AI-системы AlphaProof и AlphaGeometry 2 преодолели новый рубеж в математическом решении задач

Команды AlphaProof и AlphaGeometry 2 представили прорывные модели, которые успешно решают сложные задачи математического рассуждения, что открывает новые горизонты в науке и технологиях. Эти системы продемонстрировали свои способности, решив четыре из шести задач, представленных на Международной математической олимпиаде (IMO), и впервые достигнув уровня серебряного медалиста в этом престижном соревновании.

IMO, проводимая ежегодно с 1959 года, является самой крупной и выдающейся олимпиадой для юных математиков. Каждый год молодые дарования со всего мира готовятся к решению шести сложных задач из различных областей математики, включая алгебру и теорию чисел. Recent innovations in AI have led to more efficient methods of tackling these challenging problems, with AlphaProof и AlphaGeometry 2 вносят значительный вклад в этот процесс.

Модель AlphaProof использует алгоритм обучения с подкреплением для формального математического рассуждения, в то время как AlphaGeometry 2 улучшает решение геометрических задач. В этом году наши системы получали оценки от известных математиков, таких как профессор сэр Тимоти Гауэрс, отмечая, что «то, что программа смогла найти такую неочевидную конструкцию, впечатляет и значительно превышает ожидаемое». AlphaProof успешно решил две алгебраические задачи и одну из теорий чисел, включая самую трудную задачу в конкурсе, среди всего лишь пяти успешных попыток участников.

Системы решают задачи с помощью формального языка Lean, что обеспечивают верификацию доказательств для корректности. В результате, AlphaProof достиг финального балла 28 из 42 возможных — что соответствует верхней границе серебряной медали. В этом году порог для золотой медали начинается с 29 баллов.

AlphaGeometry 2 значительно быстрее своего предшественника, что позволило решить 83% исторических задач по геометрии из последних 25 лет, сегодня она справилась с задачей за 19 секунд. Исследования в области формального языка и новейших подходов к решению задач лишь подчеркивают широту возможностей AI в области математического рассуждения.

Похожие записи

«Охота за единорогами» — Business StandUp тур от Оскара Хартманна

Samsung ведет переговоры о партнерстве с Perplexity AI для интеграции технологий поиска в смартфоны

Искусственный интеллект DeepNash достиг уровня эксперта в игре Stratego