标签:研究人员
8人小团队单挑OpenAI,半年仿出GPT-4o,还开源了
机器之心报道 机器之心编辑部最近,一个对标 GPT-4o 的开源实时语音多模态模型火了。 这个开源模型来自法国一个仅有 8 人的非营利性 AI 研究机构 ——Kyutai,...
科研实验室 DeepMind,正转变为 AI 产品工厂
来源:学术头条 【编者按】科研与商业如何平衡?尤其是在当前科技圈最热的赛道——人工智能(AI)中。来自谷歌内部的一些经验和教训,或许可以给出一些启示。 ...
240万亿巨量数据被洗出,足够训出18个GPT-4!全球23所机构联手,清洗秘籍公开
新智元报道编辑:编辑部 【新智元导读】是时候把数据Scale Down了!Llama 3揭示了这个可怕的事实:数据量从2T增加到15T,就能大力出奇迹,所以要想要有GPT-3...
最新研究:大模型已涌现出欺骗能力!钻漏洞、偷偷篡改奖励函数,GPT-4欺骗人类高达99.16%
夕小瑶科技说 原创作者 | 付奶茶 昨天,Anthropic发布的最新版本Claude 3.5 Sonnet让AI圈激动了一把,不止如此,Anthropic联合牛津大学又带来了一篇非常有意...
Science Robotics见刊发表 剑桥大学成功开发人类“第六指”
大数据文摘受权转载自机器人大讲堂 人类与动物的根本区别在于能够熟练地使用工具,而使用工具的必要前提是人类的双手得以解放。但你有没有想过,绝大多数灵长...
Meta新模型NLLB获Nature盛赞,200种濒危语言高质量翻译,「不让任何语言掉队」
新智元报道编辑:庸庸 乔杨 【新智元导读】Meta AI的NLLB-200登上Nature,「不让任何一门语言掉队」,能翻译200种语言的大模型获得Nature社论的盛赞——复兴了...
大脑是如何工作的?谷歌和哈佛的研究人员用AI把它画出来了|NIO Capital 未来生活
Google Research & Lichtman Lab/Harvard University ©️不久前,谷歌和哈佛大学的研究人员发布了一组人类大脑及其神经网络的详细图像,这个图像被称为迄...
AI画连环画角色更一致了!人物之间的复杂互动也能处理|中山大学&联想团队出品
AutoStudio团队 投稿量子位 | 公众号 QbitAI让AI画漫画角色保持一致的新研究来了! 创作的连环画效果belike: 频繁切换主体、人物之间复杂的互动也能保持角色...
全华人团队推出多模态大模型新基准,GPT-4o准确率仅为65.5%,所有模型最易犯感知错误
王家豪 投稿自 凹非寺量子位 | 公众号 QbitAIGPT-4o再次掀起多模态大模型的浪潮。 如果他们能以近似人类的熟练程度,在不同领域执行广泛的任务,这对许多领域...
「汪汪」to Vector!密歇根博士生用AI解码狗的声音 | LREC 2024
新智元报道编辑:alan 【新智元导读】近日,来自密歇根大学的研究人员,开发了一款人工智能工具,可以区分不同含义的狗叫声,并识别狗的年龄、性别和品种。有...
港大北航等1bit大模型引热议,IEEE刊物评“解决AI能源需求”!作者亲自解读在此
BiLLM团队 发自 凹非寺量子位 | 公众号 QbitAI极限量化,把每个参数占用空间压缩到1.1bit! IEEE Spectrum专栏,一种名为BiLLM的训练后量化(PTQ)方法火了。...
从LLM中完全消除矩阵乘法,效果出奇得好,10亿参数跑在FPGA上接近大脑功耗
机器之心报道 机器之心编辑部让语言模型「轻装上阵」。一直以来,矩阵乘法(MatMul)稳居神经网络操作的主导地位,其中很大原因归结为 GPU 专门针对 MatMul ...
纽约大学研究表明:大模型并没有利用思维链的推理能力,它只是加了计算!
思维链技术,可能要被推翻了!来自纽约大学的最新研究表明:大模型并没有利用思维链的推理能力,它只是偷偷加了计算!来源:悦智网 红极一时的思维链技术,可...
斯坦福让“GPU高速运转”的新工具火了,比FlashAttention2更快
西风 发自 凹非寺量子位 | 公众号 QbitAIAI算力资源越发紧张的当下,斯坦福新研究将GPU运行效率再提升一波—— 内核只有100行代码,让H100比使用FlashAttention...
next-token被淘汰!Meta实测「多token」训练方法,推理提速3倍,性能大涨10%+
新智元报道编辑:LRS 【新智元导读】研究人员提出了一种新的大型语言模型训练方法,通过一次性预测多个未来tokens来提高样本效率和模型性能,在代码和自然语...