标签:模型

分解大模型的神经元!Claude团队最新研究火了,网友:打开黑盒

丰色 发自 凹非寺量子位 | 公众号 QbitAI神经网络的不可解释性,一直是AI领域的“老大难”问题。但现在,我们似乎取得了一丝进展——ChatGPT最强竞对Claude背后的...
阅读原文

开源论文神器DocsGPT登顶GitHub热榜!多类型文档查询,支持中文可本地部署 | 狂揽8000+星

白交 发自 凹非寺量子位 | 公众号 QbitAI开源论文神器来了,结果直接登顶GitHub热榜,狂揽8000+星!只需跟DocsGPT聊聊天,就可以查找各种文档中的信息。目前...
阅读原文

致敬TempleOS,有开发者创建了启动Llama 2的操作系统,网友:8G内存老电脑就能跑

机器之心报道编辑:杜伟不得不说,Llama 2 的「二创」项目越来越硬核、有趣了。自 Meta 发布开源大模型 Llama 2 以来,围绕着该模型的「二创」项目便多了起来...
阅读原文

OpenAI计划研发自己的AI芯片,已有收购目标

机器之心报道编辑:小舟天下苦英伟达久矣。微软和 OpenAI 这对合作伙伴,将在人工智能芯片赛道上成为竞争对手。据路透社报道,OpenAI 正在考虑构建自己的人工...
阅读原文

基于牛顿求根法,新算法实现并行训练和评估RNN,带来超10倍增速

机器之心报道编辑:Panda W人们普遍认为 RNN 是无法并行化的,因为其本质上的序列特性:其状态依赖于前一状态。这使得人们难以用长序列来训练 RNN。近日,一...
阅读原文

76页综述+300余篇参考文献,天大团队全面介绍大语言模型对齐技术

机器之心专栏作者:熊德意教授团队天大自然语言处理团队从更广泛的 AI 对齐视角,审视大语言模型对齐技术,并从多个角度进行深入讨论。近日,天津大学熊德意...
阅读原文

7.7亿参数,超越5400亿PaLM!UW谷歌提出「分步蒸馏」,只需80%训练数据|ACL 2023

新智元报道编辑:LRS【新智元导读】LLM不实用,小模型蒸馏才是「现实」的大模型应用路线,全面领先微调技术!土豪请无视。。。大型语言模型虽然性能优异,可...
阅读原文

30分钟教会机器人做家务!CMU提出全新结构化世界模型SWIM

大数据文摘授权转载自将门创投作者:seven_教会机器人在现实环境中解决各种复杂任务,一直是机器人控制领域的关键研究课题。近来随着具身智能的快速发展,机...
阅读原文

人工智能会放长假吗?

对看到这篇推文的各位来说,2023 年最后的假期结束了。对 2023 年一路狂飙的 AI 而言,并不存在这个概念。人工智能不会休息。持续冲刺,持续颠覆一切。大模型...
阅读原文

OpenAI 劲敌 Anthropic 身价飙升,亚马逊注资 40 亿美元,大模型站在“分叉口”

大数据文摘受权转载自AI科技评论作者 | 西西编辑 | 陈彩娴9 月 25 日,昨日,亚马逊官宣其向 AI 初创公司 Anthropic 注资 40 亿美元的消息,引起了海内外人工...
阅读原文

CMU华人打破大模型黑盒,Llama 2撒谎被一眼看穿!脑电波惨遭曝光,LLM矩阵全

新智元报道编辑:编辑部【新智元导读】大语言模型黑盒,居然被CMU等机构的学者打破了?他们发现,LLM内部有可解释的表征,如果撒谎,还能被测谎仪检测出来!...
阅读原文

LLM成功不可或缺的基石:RLHF及其替代技术

机器之心编译编辑:Panda关于训练大模型常用的 RLHF 技术,这篇文章帮你逐步解读了其工作过程,还总结了一些其他替代方法。在讨论 LLM 时,我们总是会涉及一...
阅读原文

自动驾驶独角兽如此造假,LeCun都服了

明敏 发自 凹非寺量子位 | 公众号 QbitAI你以为这是个平平无奇的自动驾驶视频?‍‍‍NO、NO、NO……这其实是完全由AI从头生成的。没有一帧是“真的”。‍‍‍‍‍不同路...
阅读原文

MIT惊人证明:大语言模型就是「世界模型」?吴恩达观点再被证实,LLM竟能理解空间和时间

新智元报道编辑:编辑部【新智元导读】MIT的两位学者发文力证:大语言模型能够理解世界!他们的工作表明,LLM不仅仅学习了表面的统计数据,还学习了包括空间...
阅读原文

ICCV2023奖项出炉!斯坦福ControlNet和多伦多大学分别获得最佳论文!Segment Anything最佳提名

新智元报道作者:专知【新智元导读】ICCV 2023全部奖项已经公布,有两篇获得最佳论文,一篇来自斯坦福大学的研究者的ControlNet获得ICCV 2023马尔奖(最佳论...
阅读原文