标签:语言

Google DeepMind 最新研究:搞定这三个任务?人类不行,AI 也不行

撰文 | 赵雅琦前言人工智能(AI)并非完美的推理者,即使是当前大热的语言模型(LMs),也同样会表现出与人类类似的错误倾向,尤其是出现显著的“内容效应”(C...
阅读原文

Ilya Sutskever 离职后首次采访:个人经历,Scaling Laws,AI幻觉

来源:AI寒武纪 Ilya Sutskever自从 OpenAI 赶走 Sam Altman 后首次接受播客采访,他提到了 AI 和深度学习的过去、现在和未来。他回顾了他从 17 岁起与 Jeff ...
阅读原文

「后训练 + STaR」是 OpenAI 绝密项目「草莓」背后的秘密吗?

机器之心PRO · 会员通讯 Week 29---- 本周为您解读 ③个值得细品的AI & Robotics业内要事 ---- 1. 「后训练 + STaR」是 OpenAI 绝密项目「草莓」背后的秘...
阅读原文

KDD 2024|港大黄超团队深度解析大模型在图机器学习领域的「未知边界」

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

【阿姆斯特丹博士论文】以实体为中心的神经模型用于自然语言处理

来源:专知 这篇论文探讨了如何通过将实体信息纳入神经网络模型来增强自然语言理解。它解决了三个关键问题: 利用实体进行理解任务:本文引入了Entity-GCN模...
阅读原文

创业者复盘:出海“本地化”过程中,我犯了哪些错?

本文作者杨杰是一位产品经理出身的创业者,所在团队从2019 年开始做国内 SAAS 业务,2022年观察到国内业务出现瓶颈,开始寻求第二增长曲线。 2022年4月,产品...
阅读原文

清华大学联合斯坦福大学提出混合注意力机制MoA,大模型解码速率提高6倍

夕小瑶科技说 原创作者 | Richard 随着大语言模型的规模不断扩大,如何在保持模型性能的同时提高其效率,成为了当前研究的热点问题。最近,清华大学联合斯坦...
阅读原文

对话南洋理工大学安波教授:如何让大语言模型适应动态环境?

大数据文摘受权转载自AI科技评论 作者丨陈鹭伊 编辑丨岑峰 对人类越是简单的问题,大语言模型反而越难以做好? 尽管现在的大模型已经有能力冲击数学竞赛级别...
阅读原文

对话南洋理工大学安波教授:如何让大语言模型适应动态环境?丨IJAIRR

智能体实现AGI的自我超越,从与环境交互做起。作者丨陈鹭伊 编辑丨岑峰 对人类越是简单的问题,大语言模型反而越难以做好? 尽管现在的大模型已经有能力冲击...
阅读原文

上海AI lab开源LLaMAX,用3.5万小时的A100训练让大模型掌握上百种语言翻译

夕小瑶科技说 原创作者 | Richard 在这个AI大爆发的时代,各种智能工具如雨后春笋般涌现,大语言模型的能力也在不断刷新我们的认知。随便拉出一个AI模型,似...
阅读原文

无损加速最高5x,EAGLE-2让RTX 3060的生成速度超过A100

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

抛弃视觉编码器,这个「原生版」多模态大模型也能媲美主流方法

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

初创公司硬刚英伟达:在AMD卡上模拟CUDA,原版程序直接编译运行

克雷西 发自 凹非寺量子位 | 公众号 QbitAI无需任何修改转换,AMD显卡也跑起原版CUDA程序了! 英国一家初创公司,推出了针对AMD的CUDA程序编译工具,而且免费...
阅读原文

大语言模型的前世今生:万字长文完整梳理所有里程碑式大语言模型(LLMs)

点击下方卡片,关注“AI生成未来” >>后台回复“GAI”,免费获取AI行业报告和资料! 作者:APlayBoy编辑:AI生成未来 链接:https://zhuanlan.zhihu.com/p/...
阅读原文

阿里开源语音处理模型 FunAudioLLM :50 种语言无缝翻译,还能识别语音情绪

作者 | 赵明华 阿里巴巴通义实验室近日发布并开源了 FunAudioLLM,这是一个旨在增强人与大型语言模型(LLMs)之间自然语音交互的框架,代表了语音处理领域的...
阅读原文
15678929