标签:模型

字节大模型同传智能体,一出手就是媲美人类的同声传译水平

机器之心发布 机器之心编辑部无论是语速超快、发音复杂的绕口令,还是精妙绝伦的文言文,又或是充满即兴和灵感的随意聊天,模型都能流畅自然地给出准确而地道...
阅读原文

Nature封面:AI训练AI,越训越离谱

机器之心报道 机器之心编辑部训练数据是用 GPT-4o 生成的?那质量不好说了。我们知道,大模型面临的三大挑战是算法、算力和数据。前两者靠优化升级,后者靠积...
阅读原文

RLHF不够用了,OpenAI设计出了新的奖励机制

机器之心报道 机器之心编辑部OpenAI 的新奖励机制,让大模型更听话了。自大模型兴起以来,使用强化学习从人类反馈(RLHF)中微调语言模型一直是确保 AI 准确...
阅读原文

大模型智障检测+1:Strawberry有几个r纷纷数不清,最新最强Llama3.1也傻了

梦晨 一水 发自 凹非寺量子位 | 公众号 QbitAI继分不清9.11和9.9哪个大以后,大模型又“集体失智”了! 数不对单词“Strawberry”中有几个“r”,再次引起一片讨论...
阅读原文

ICML最佳论文曾被ICLR拒稿,Pika联创参与,一作已入职OpenAI

明敏 发自 凹非寺量子位 | 公众号 QbitAIICML 2024最佳论文出炉,结果发现其中一篇曾被ICLR 2024拒稿? 这篇论文来自斯坦福,Pika创始人之一孟晨琳(Chenlin ...
阅读原文

打乱/跳过Transformer层会怎样?最新研究揭开其信息流动机制,一口气解答8大问题

西风 发自 凹非寺量子位 | 公众号 QbitAITransformer中的信息流动机制,被最新研究揭开了: 所有层都是必要的吗?中间层在做同样的事吗?层的顺序重要吗? 如...
阅读原文

行业头牌OpenAI年亏损50亿美元!AI不在是门好生意?

点击上方蓝字关注我们“OpenAI今年预计在AI训练和员工上花费高达85亿美元,可能面临50亿美元资金缺口,需新一轮融资。The Information 的分析显示,OpenAI 正...
阅读原文

Mistral发布Large 2 挑战 Llama 3.1

点击上方蓝字关注我们“法国人工智能初创公司Mistral推出新一代开源模型Mistral Large 2,以1230亿参数挑战行业巨头,尽管其参数数量少于Meta的Llama 3.1,但...
阅读原文

重磅!Mistral Large 2深夜发布!Llama3.1仅一天被超越,最强开源再易主

夕小瑶科技说 原创作者 | 海野 第一次开源模型革命,突然就兴起了…… Llama3.1发布后,Meta还沉浸在强烈的社会反响中时,法国的Mistral AI团队突然扔出王炸:...
阅读原文

终于有人把大模型的内部一致性和自反馈讲明白了

夕小瑶科技说 原创作者 | 谷雨龙泽 在LLM的研究中,改进LLMs的推理能力和减少幻觉内容一直是诸多研究者为之献祭GPU和头发的重大问题。近日,中国的一群青年才...
阅读原文

减轻幻觉新SOTA,7B模型自迭代训练效果超越GPT-4,上海AI lab发布

夕小瑶科技说 原创作者 | 谢年年 LLMs在回答各种复杂问题时,有时会“胡言乱语”,产生所谓的幻觉。解决这一问题的初始步骤就是创建高质量幻觉数据集训练模型以...
阅读原文

催化能力提高 3.5 倍!中科院团队基于扩散模型,开发 P450 酶从头设计方法 P450Diffusion

作者:梅菜 编辑:李宝珠,十九 中国科学院天津工业生物技术研究所的新酶设计团队,开发了基于扩散模型和口袋设计原则的 P450 酶从头设计方法 P450Diffusion...
阅读原文

视频生成产品 PixVerse 版本大更新!支持一键生成5段、最长 40S 连续视频

今年6 月份起,视频生成赛道持续涌现新的产品,从可灵到 Luma、Runway Gen3,模型能力和产品化效果越来越卷。 7 月 24 日,爱诗科技正式发布视频生成产品 Pix...
阅读原文

最强模型 Llama 3.1 如期而至!扎克伯格最新访谈:Llama 会成为 AI 界的 Linux

这是开源 AI 的里程碑时刻。文 | 王启隆 出品丨AI 科技大本营(ID:rgznai100) 本文为 CSDN 编辑整理,未经授权,禁止转载。 今天,Meta AI 的最新最强模型 ...
阅读原文

开源Llama 3.1一夜成最强大模型!超越闭源GPT-4o,OpenAI坐不住了

夕小瑶科技说 原创作者 | 海野万众期待的开源模型Llama3.1终于走官方渠道上线了。 我们昨天已经领略过Llama3.1(偷跑版的)威名: Llama3.1共包含8b、70b和405b...
阅读原文