Измученный человек побеждает модель ИИ в чемпионате мирового кодирования
1 min read
В то время как Дббак выиграл 500 000 иен и пережил свое испытание лучше, чем легендарный водитель стали, финал мирового тура Atcoder подталкивает людей и модели искусственного интеллекта в свои пределы благодаря сложным задачам оптимизации, которые не имеют идеального решения – только постепенно лучше.
Кодирование марафона проверяет человеческую выносливость против эффективности ИИ
Финал Atcoder World Tour представляет собой одно из самых эксклюзивных событий конкурсных программ, приглашающих только 12 лучших программистов по всему миру, основываясь на их эффективности в течение предыдущего года. Эвристическое разделение фокусируется на проблемах оптимизации «NP-Hard». При программировании эвристика-это методы решения проблем, которые находят хорошие решения с помощью ярлыков и образованных предположений, когда идеальные ответы займет слишком много времени для расчета.
Все конкуренты, в том числе OpenAI, были ограничены идентичным оборудованием, предоставленным AtCoder, обеспечивая ровное игровое поле между участниками человека и AI. Согласно правилам конкурса, участники могли бы использовать любой язык программирования, доступный на Atcoder, без штрафа за повторное повторение, но обязательное пятиминутное ожидание между представлениями.
Окончательные результаты в таблице лидеров для эвристического конкурса мирового финала 2025 года, показывающих Dębiak (как «Psyho») на вершине.
Кредит: Atcoder
Окончательные результаты конкурса показали, что Psyho финишировал с баллом 1 812 272 558 909 баллов, в то время как модель Openai (перечисленная как «Openaiahc») набрала 1 654 675 725 406 баллов – примерно 9,5 процента. Искусственный участник Openai, моделируемая модели и смоделированная модель рассуждений, похожая на O3, заняла второе место в общем зачете, опередив 10 других человеческих программистов, которые прошли квалификацию в течение годичного рейтинга.
OpenAI охарактеризовал второе место в качестве вехи для моделей искусственного интеллекта в конкурентном программировании. «Модели, такие как O3, ранжируются среди лучших в конкурсах кодирования/математики, но, насколько нам известно, это первое место в топ-3 в главном конкурсе кодирования/математики»,-сказал представитель компании в электронном письме Ars Technica. «Такие события, как Atcoder, дают нам возможность проверить, насколько хорошо наши модели могут рассуждать стратегически, планировать длительные горизонты и улучшить решения посредством проб и ошибок – просто как человек».
