AIGC动态

DeepSeek-R1-ZERO 尝试复现的一些现象分享

尝试做了一波 r1-zero 的简单的复现实验
阅读原文

“首席炒作官”Altman “碰瓷”摩尔定律引社区不满,1400万美元广告被批“都能训练3个DeepSeek V3了!”

距离上次发文过去了一个月多,OpenAI CEO Sam Altman 再次发表了一篇 2000 多字的“小作文”
阅读原文

从 DeepSeek 看 AI 编程新热潮:我们离 “告别手敲代码” 还有多远?| 直播预告

最近DeepSeek 非常火,大家怎么看它的编程能力?本次直播借着这股热浪,我们一起聊聊 AI 驱动下的编程能力!
阅读原文

Meta 即将开启全公司大裁员,不会透露更具体细节

当地时间 2 月 7 日,据纽约路透社消息,Facebook 所有者 Meta Platforms 的内部备忘录显示,该公司向员工透露,计划下周在全公司范围内进行裁员,同时加快招...
阅读原文

如何优化测试时计算?解决「元强化学习」问题

通过改变 LLM 训练目标,可以重用现有数据以及更多的测试时计算来训练模型以做得更好。
阅读原文

人大刘勇团队「慢思考」机理分析:从雪球误差到正确推理概率

本文探讨了外部慢思考在LLM推理中的作用机制,为理解外部慢思考方法提供了理论支撑,并为优化LLM的推理能力提供了新思路。
阅读原文

马克龙豪掷1090亿开欧洲「星际之门」,Mistral狂飙登顶法国APP榜首!

原标题:马克龙豪掷1090亿开欧洲「星际之门」,Mistral狂飙登顶法国APP榜首! 文章来源:新智元 内容字数:6843字法国Mistral AI的Le Chat横扫AI市场,欧洲AI...
阅读原文

诺奖得主DeepMind CEO放话:DeepSeek是中国最好AI模型,但没任何科学进步

原标题:诺奖得主DeepMind CEO放话:DeepSeek是中国最好AI模型,但没任何科学进步 文章来源:新智元 内容字数:3485字DeepSeek引发的AI巨头论战:技术突破还...
阅读原文

LLM实现自回归搜索!MIT哈佛等提出「行动思维链」COAT,推理能力大提升

原标题:LLM实现自回归搜索!MIT哈佛等提出「行动思维链」COAT,推理能力大提升 文章来源:新智元 内容字数:7670字Satori:赋予LLM自回归搜索能力的7B参数模...
阅读原文