标签：模型

字节大模型同传智能体，一出手就是媲美人类的同声传译水平

机器之心发布机器之心编辑部无论是语速超快、发音复杂的绕口令，还是精妙绝伦的文言文，又或是充满即兴和灵感的随意聊天，模型都能流畅自然地给出准确而地道...

阅读原文

AIGC动态

2年前 (2024)

Nature封面：AI训练AI，越训越离谱

机器之心报道机器之心编辑部训练数据是用 GPT-4o 生成的？那质量不好说了。我们知道，大模型面临的三大挑战是算法、算力和数据。前两者靠优化升级，后者靠积...

阅读原文

AIGC动态

2年前 (2024)

RLHF不够用了，OpenAI设计出了新的奖励机制

机器之心报道机器之心编辑部OpenAI 的新奖励机制，让大模型更听话了。自大模型兴起以来，使用强化学习从人类反馈（RLHF）中微调语言模型一直是确保 AI 准确...

阅读原文

AIGC动态

2年前 (2024)

大模型智障检测+1：Strawberry有几个r纷纷数不清，最新最强Llama3.1也傻了

梦晨一水发自凹非寺量子位 | 公众号 QbitAI继分不清9.11和9.9哪个大以后，大模型又“集体失智”了！数不对单词“Strawberry”中有几个“r”，再次引起一片讨论...

阅读原文

AIGC动态

2年前 (2024)

ICML最佳论文曾被ICLR拒稿，Pika联创参与，一作已入职OpenAI

明敏发自凹非寺量子位 | 公众号 QbitAIICML 2024最佳论文出炉，结果发现其中一篇曾被ICLR 2024拒稿？这篇论文来自斯坦福，Pika创始人之一孟晨琳（Chenlin ...

阅读原文

AIGC动态

2年前 (2024)

打乱/跳过Transformer层会怎样？最新研究揭开其信息流动机制，一口气解答8大问题

西风发自凹非寺量子位 | 公众号 QbitAITransformer中的信息流动机制，被最新研究揭开了：所有层都是必要的吗？中间层在做同样的事吗？层的顺序重要吗？如...

阅读原文

AIGC动态

2年前 (2024)

行业头牌OpenAI年亏损50亿美元！AI不在是门好生意？

点击上方蓝字关注我们“OpenAI今年预计在AI训练和员工上花费高达85亿美元，可能面临50亿美元资金缺口，需新一轮融资。The Information 的分析显示，OpenAI 正...

阅读原文

AIGC动态

2年前 (2024)

Mistral发布Large 2 挑战 Llama 3.1

点击上方蓝字关注我们“法国人工智能初创公司Mistral推出新一代开源模型Mistral Large 2，以1230亿参数挑战行业巨头，尽管其参数数量少于Meta的Llama 3.1，但...

阅读原文

AIGC动态

2年前 (2024)

重磅！Mistral Large 2深夜发布！Llama3.1仅一天被超越，最强开源再易主

夕小瑶科技说原创作者 | 海野第一次开源模型革命，突然就兴起了…… Llama3.1发布后，Meta还沉浸在强烈的社会反响中时，法国的Mistral AI团队突然扔出王炸：...

阅读原文

AIGC动态

2年前 (2024)

终于有人把大模型的内部一致性和自反馈讲明白了

夕小瑶科技说原创作者 | 谷雨龙泽在LLM的研究中，改进LLMs的推理能力和减少幻觉内容一直是诸多研究者为之献祭GPU和头发的重大问题。近日，中国的一群青年才...

阅读原文

AIGC动态

2年前 (2024)

减轻幻觉新SOTA，7B模型自迭代训练效果超越GPT-4，上海AI lab发布

夕小瑶科技说原创作者 | 谢年年 LLMs在回答各种复杂问题时，有时会“胡言乱语”，产生所谓的幻觉。解决这一问题的初始步骤就是创建高质量幻觉数据集训练模型以...

阅读原文

AIGC动态

2年前 (2024)

催化能力提高 3.5 倍！中科院团队基于扩散模型，开发 P450 酶从头设计方法 P450Diffusion

作者：梅菜编辑：李宝珠，十九中国科学院天津工业生物技术研究所的新酶设计团队，开发了基于扩散模型和口袋设计原则的 P450 酶从头设计方法 P450Diffusion...

阅读原文

AIGC动态

2年前 (2024)

视频生成产品 PixVerse 版本大更新！支持一键生成5段、最长 40S 连续视频

今年6 月份起，视频生成赛道持续涌现新的产品，从可灵到 Luma、Runway Gen3，模型能力和产品化效果越来越卷。 7 月 24 日，爱诗科技正式发布视频生成产品 Pix...

阅读原文

AIGC动态

2年前 (2024)

最强模型 Llama 3.1 如期而至！扎克伯格最新访谈：Llama 会成为 AI 界的 Linux

这是开源 AI 的里程碑时刻。文 | 王启隆出品丨AI 科技大本营（ID：rgznai100）本文为 CSDN 编辑整理，未经授权，禁止转载。今天，Meta AI 的最新最强模型 ...

阅读原文

AIGC动态

2年前 (2024)

开源Llama 3.1一夜成最强大模型！超越闭源GPT-4o，OpenAI坐不住了

夕小瑶科技说原创作者 | 海野万众期待的开源模型Llama3.1终于走官方渠道上线了。我们昨天已经领略过Llama3.1(偷跑版的)威名： Llama3.1共包含8b、70b和405b...

阅读原文

AIGC动态

2年前 (2024)

1…117 118119120 121…483