揭秘首个AI数学大赛:为防止人类替考,AI“先交代”再交卷

访客2年前AI生活193

北京时间4月15日上午8点,2024阿里巴巴全球数学竞赛预选赛正式交卷,58个国家与地区的选手在线鏖战48小时,更有来自全球知名高校院所与企业的563支队伍使用AI作答,其中00后占比超50%。他们各显神通,使用模型调优、AI Agent、提示词工程等多种方式,推动AI构建更强大的数学能力。

阿里巴巴全球数学竞赛组委会介绍,当前,AI已经在不少领域展现超越人类的能力,但在“人类智慧的皇冠”数学领域还颇为受限。因此,从2024年起,阿里巴巴全球数学竞赛决定向AI开放,鼓励探索AI的潜力上限,推动AI在数学领域的研究和应用创新。

在这场48小时的预选赛中,AI和人类选手共用一套试卷,题目包括选择题、解答题与证明题。为了保证公平,防止“人类替考”,组委会制定了“赛前固定方案、赛中诚实答题、赛后复现总结”的三步走规则。因此,在正式开考之前,AI参赛团队就需要完成模型的训练或微调,并锁定做题版本;如使用提示词工程,也需要提前提交相应方案。

AI挑战赛吸引了全球563支队伍踊跃报名,主要来自全球知名高校院所与企业,包括北大、清华、牛津、中国科学院、AWS、字节跳动等,大多具有AI专业背景,也有部分来自数学、物理等专业。统计显示,参赛队伍中,00后占比超50%,年轻一代正在成为AI生力军,用多种形式热情探索AI的数学上限。他们有的在开源大模型的基础上进行专项微调,让AI从初等数学进阶到高等数学;他们有的构建起AI Agent,结合提示词工程来调用GPT-4等闭源模型,使得GPT-4的数学解题能力有大幅提升。

西南交通大学应用物理系的大四学生向劲宇是一名AI开发者,也是MetaGPT-MC小组贡献者之一,这次他和多位开发者组队参赛,使用GPT-4与Claude 3组成Muti-Agent的方案,让AI分饰多个角色、相互验证来完成答题步骤,改善了AI“一本正经的胡说八道”的通病,提升了AI做题的准确性。在AWS从事AI研究的毛帽,是数学专业的博士,已连续三年参赛,今年转换身份,从人类选手转为AI的竞赛辅导员,与同事组成一支“豪华团队”,集合了数学、统计、地球物理及机器学习背景的4名博士,希望能向人类选手们秀一把AI的实力。

据介绍,本次AI挑战赛结果将于6月与人类选手成绩同期公布,AI前三名分别获得奖金10000美元、5000美元、2000美元。不少选手表示,他们更期待的是,AI的成绩能否达到人类优秀选手水平,能否达到决赛资格线?在往年的阿里巴巴全球数学竞赛中,只有1%的预选赛选手能够晋级决赛。

由阿里巴巴公益、达摩院共同举办的阿里巴巴全球数学竞赛,以不设报名门槛、趣味十足著称,举办6届以来不断推陈出新,比如把蚂蚁森林种树、张师傅扭宽面等题目引入竞赛,激发全民数学热情。今年,这项赛事更是紧扣AI与数学融合的技术趋势,首次向AI开放,不限选手是碳基还是硅基。

 揭秘首个AI数学大赛:为防止人类替考,AI“先交代”再交卷

本站部分文章来自互联网,文章版权归原作者所有。如有疑问请联系QQ:362580117!

相关文章

蔡丛兴:从语词到「故事」,AIGC 要做思想的「相机」丨GAIR 2023

蔡丛兴:从语词到「故事」,AIGC 要做思想的「相机」丨GAIR 2023

编者按:2023年8月14日-15日,第七届GAIR全球人工智能与机器人大会在新加坡乌节大酒店成功举办。 论坛由GAIR研究院、小编、世界科技...

余承东公开认错,称华为与北汽不是不合作;特斯拉中国工厂普通工人月薪1万

特斯拉中国工厂普通工人月薪1万块 据上海临港招聘发布,近日刚刚签约落户上海临港的特斯拉储能超级工厂开始招聘,2019年,特斯拉上海工厂建成招聘...

吉利推出新品牌「极越」,汽车机器人极越01上市在即

吉利推出新品牌「极越」,汽车机器人极越01上市在即

小编获悉,近日,吉利控股集团(以下简称吉利控股)将正式推出高端智能汽车机器人品牌“极越”。这是吉利控股、百度自2021年“汽车机器人战略合作...

酒店因“疫”求变,服务机器人逆势入局!

酒店因“疫”求变,服务机器人逆势入局!

“不要出门!” 这四个字构成了2020年第一个关键词。也正是这掷地有声的四个字,成了阻止疫情迅速蔓延的关键。 然而,这场...

科沃斯集团主办 首届苏州湾服务机器人产业峰会将于6月30日在苏州举行

科沃斯集团主办 首届苏州湾服务机器人产业峰会将于6月30日在苏州举行

首届科沃斯机器人大会,暨苏州湾服务机器人产业峰会将于2023年6月30日-7月1日于苏州市吴中区举办。峰会由科沃斯机器人股份有限公司、中国机电一体化技术应用协会联合主办。本届峰会以...

金桥智能网联汽车测试示范区:构建特色应用场景 助力“未来车”驶上“快车道”

金桥智能网联汽车测试示范区:构建特色应用场景 助力“未来车”驶上“快车道”

浦东金桥智能网联汽车测试示范区是国内首个特大型城市中心城区自动驾驶汽车开放测试道路,首期里程29.3公里,也是目前上海风险等级最高的开放测试...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。