الذكاء الاصطناعي يحصد الذهب في أولمبياد الرياضيات.. لحظة فارقة في تاريخ المسابقات العلمية
لأول مرة بلغ نموذجان من الذكاء الاصطناعي AI models مستوى الميدالية الذهبية في واحدة من أرفع مسابقات الرياضيات للشباب، ويؤكد مطوّروهما أن هذه النماذج قد تكون على أعتاب حلِّ بعضٍ من أعقد المسائل العلمية قريبًا.
بقلم أليكس ولكنز
في لحظة فارقة، في تاريخ الذكاء الاصطناعي، أعلنت شركتا ديب مايند DeepMind وأوبن إي آي OpenAI أن نموذجين تجريبيين للذكاء الاصطناعي طورتاهما حققا أداء بمستوى الميدالية الذهبية في الأولمبياد الدولي للرياضيات International Mathematical Olympiad (اختصارا: مسابقة/ أولمبياد IMO). وهي المرة الأولى التي يبلغ فيها الذكاء الاصطناعي هذا المستوى، في واحدة من أعرق مسابقات الرياضيات للشباب.
وعلى الرغم من أن الشركتين وصفتا الإنجاز بأنه خطوة مهمة نحو تطوير أنظمة قادرة على حل أعقد المسائل العلمية والرياضية، فإن علماء الرياضيات تعاملوا مع الإعلان بحذر؛ نظرًا إلى غياب التفاصيل الدقيقة بشأن آلية عمل النماذج ونتائجها الفعلية.
تُعد المسابقة IMO من أكثر المنافسات المرموقة في الرياضيات في العالم لطلبة المرحلة الثانوية، وينظر إليها الباحثون في الذكاء الاصطناعي بصفتها معيارًا حاسمًا لقدرات التفكير الرياضي التي تطرح صعوبات أمام أنظمة الذكاء الاصطناعي.
بعد نسخة العام 2024 التي جرت في باث بالمملكة المتحدة، أعلنت ديب مايند (التابعة لمجموعة غوغل Google) أن نموذجين طورتهما، هما: ألفابروف AlphaProof وألفاجومتري AlphaGeometry، حققا معًا أداء بمستوى الميدالية الفضية، لكن لجنة التحكيم المعتمدة في المسابقة لم تقيِّمهما رسميًّا.
قبل مسابقة 2025 التي أُقيمت في كوينزلاند بأستراليا، تواصلت شركات، من بينها غوغل وهواوي Huaweiوبايتدانس ByteDance (مالكة تيك توكTikTok )، إضافة إلى باحثين أكاديميين، مع المنظمِين للسؤال عما إذا كان في الإمكان تقييم أداء نماذج الذكاء الاصطناعي التي طورتها رسميًّا، وفق ما صرح غريغور دولينار Gregor Dolinar، رئيس الأولمبياد الدولي للرياضيات IMO. وافق المنظمون بشرط أن تنتظر الشركات حتى 28 يوليو لإعلان نتائجها، بعد انتهاء مراسم حفل ختام الأولمبياد.
من جانبها، طلبت شركة أوبن إي آي، كذلك، المشاركة في المسابقة، ولكن دولينار قال إن الشركة، بعد إبلاغها بالنظام الرسمي، لم تجب، ولم تسجل للمشاركة.
في 19 يوليو، أعلنت شركة أوبن إي آي أن نموذجًا جديدًا طورته من الذكاء الاصطناعي حقق نتيجة بمستوى «ميدالية ذهبية» سجلها ثلاثة فائزين سابقين في أولمبياد IMO، على نحو منفصل عن المسابقة الرسمية. وقالت أوبن إي آي إن الذكاء الاصطناعي أعطى إجابات صحيحة عن خمسة من أصل ستة أسئلة، ضمن المهلة الزمنية نفسها البالغة 4.5 ساعة، مثل سائر المتسابقين.
بعد يومين، أعلنت «ديب مايند» التابعة
لـ «غوغل»، أيضًا، أن نظام الذكاء الاصطناعي الخاص بها (جيميناي ديب ثينك Gemini Deep Think) بلغ مستوى الميدالية الذهبية مسجلًا النتيجة نفسها، وضمن المهلة الزمنية ذاتها. وأكد دولينار أن المصححين الرسميين للمسابقة هم من منحوا هذه النتيجة لنظام جيميناي ديب ثينك.
على عكس نظامي «ألفابروف» و«ألفاجوميترِي» اللذين صممتهما «غوغل» خصيصًا للمسابقة، وعَمِلا على أسئلة وأجوبة مكتوبة بلغة برمجة تُدعى لين Lean، عمل نموذجا غوغل وأوبن إي آي هذا العام بالكامل باللغة الطبيعية.
العمل بلغة لين Lean يعني أن مخرجات الذكاء الاصطناعي يمكن التحقق من صحتها فورًا، لكن يصعب على غير المتخصصين قراءتها. يقول ثانغ لوانغ Thang Luong ، الذي عمل على جيميناي ديب ثينك، إن استخدام اللغة الطبيعية يمكن أن يُنتج إجابات أكثر قابلية للفهم، إضافة إلى إمكان تطبيقها على أنظمة ذكاء اصطناعي مفيدة بشكل عام.
يقول لوانغ إن القدرة على التحقق من الحلول – في نموذج لغوي كبير صارت – ممكنة بفضل التقدم في التعلم المعزَّز Reinforcement learning، وهي طريقة تدريب يُعلَّم فيها الذكاء الاصطناعي ما يبدو عليه النجاح، ويُترك ليكتشف القواعد، وكيف يحقق النجاح من خلال التجربة والخطأ فقط. كانت هذه الطريقة أساسية في نجاحات غوغل السابقة مع أنظمة الذكاء الاصطناعي التي تمارس الألعاب، مثل ألفازيرو AlphaZero.
ويقول لوانغ إن نموذج غوغل يأخذ أيضًا في الاعتبار عدة حلول في وقت واحد، في وضع يُسمى التفكير المتوازي Parallel thinking، إضافة إلى تدريبه على مجموعة بيانات من مسائل رياضية مفيدة بشكل خاص لأولمبياد IMO.
أوبن إي آي لم تكشف سوى القليل من التفاصيل عن نظامها، باستثناء أنه يستخدم أيضًا التعلم المعزَّز و«طرق بحث تجريبية».
يقول تيرينس تاو Terence Tao، من جامعة كاليفورنيا University of California في لوس أنجليس: «التقدم واعد، لكنه لم ينفذ بطريقة علمية مضبوطة، ولذلك لا يمكنني تقييمه في هذه المرحلة. ربما عندما تنشر الشركات المعنية بعض المقالات التي تحتوي على مزيد من البيانات، وتتيح ما نأمل الوصول إليه على نحو كافٍ للنموذج، لتمكين الآخرين من تكرار النتائج، يمكن حينها قول شيء أكثر تحديدًا، ولكن في الوقت الحالي، علينا – إلى حد كبير – أن نثق بالشركات نفسها بشأن النتائج المعلنة».
يوافقه جوردي ويليامسون Geordie Williamson، من جامعة سيدني University of Sydney في أستراليا، الرأي، ويقول: «أظن أن وصولنا إلى هذه المرحلة مسألة مهمة. من المؤسف أننا، غير المشاركين في العملية، لم نحصل إلا على قليل من التفاصيل، مقارنة بمن يعملون على هذه الأنظمة من قرب».
يقول جوزيف مايرز Joseph Myers، أحد منظمي أولمبياد IMO 2025، إنه في حين أن الأنظمة التي تعمل باللغة الطبيعية قد تكون مفيدة لغير الرياضيين، لكنها قد تُشكّل أيضًا مشكلة إذا أنتجت النماذج براهين طويلة يصعب التحقق منها. ويضيف: «إذا كانت أنظمة الذكاء الاصطناعي ستنتج يومًا ما حلولًا لمسائل غير محلولة مهمة، فقد تكون تلك الحلول صحيحة على نحو معقول، ولكنها قد تحتوي أيضًا على بعض الأخطاء الدقيقة والخطرة المخفية عن طريق الخطأ، أو ربما عمدًا من ذكاء اصطناعي غير متوافق، وجعل هذه الأنظمة تُنتج أيضًا برهانًا رسميًّا هو أمر أساسي؛ لنثق بصحة مخرجات الذكاء الاصطناعي الطويلة قبل محاولة قراءتها».
تقول كلتا الشركتين إنهما ستتيحان هذه الأنظمة أولًا لعلماء الرياضيات لاختبارها خلال الأشهر المقبلة، قبل طرحها للجمهور الأوسع. وقد تساعد هذه النماذج قريبًا على معالجة مشكلات أكثر تعقيدًا في مجال البحث العلمي، وفق جونهيك جونغ Junehyuk Jung، الذي عمل على جيميناي ديب ثينك لدى غوغل. ويضيف جونغ أن هذه النماذج «ستكون قادرة على التعامل مع عدد كبير من المسائل العلمية المعقدة التي ظلّت – حتى وقت قريب – عصيّة على الحل».
© 2025, New Scientist, Distributed by Tribune Content Agency LLC