新 闻科教                                             

CMU新作颠覆认知:AI数学能力暴涨100%
新智元 | 2025-06-01  

声明: 本消息或因风格和篇幅原因进行过编辑,但未经核实,也不代表我们的立场、观点或建议。如有侵权,联系秒删。[ 使用条款 ]
赞助信息

数据枯竭正成为AI发展的新瓶颈!CMU团队提出革命性方案SRT:让LLM实现无需人类标注的自我进化!SRT初期就能迭代提升数学与推理能力,甚至性能逼近传统强化学习的效果,揭示了其颠覆性潜力。

点击图片看原样大小图片





通往AGI最大的绊脚石,便是互联网数据不够用了!

DeepSeek-R1、OpenAI的o系推理模型出世,不再单纯依赖人类标注「标准答案」,而是通过RL实现破局。

但问题来了——当前,LLM依然需要人类设计「正确信号」来指导训练。

如果问题复杂到人类都不知道答案,这些AI就只能抓瞎了。

为此,CMU联手独立研究员推出一套「自奖励训练」(SRT)的全新方法,堪称AI「自我修行」的秘籍!

点击图片看原样大小图片





论文地址:https://arxiv.org/pdf/2505.21444

赞助信息

赞助信息

赞助信息

赞助信息

赞助信息

赞助信息

赞助信息

赞助信息

赞助信息

您的观点至关重要

点击朱笔,直抒胸臆

Google: super cool 200

    © 2025    八阕之地™ by Towards Digital Group关于我们反馈意见业务合作八阕书局隐私政策使用条款  
CMU新作颠覆认知:AI数学能力暴涨100%