标签:模型

大模型综述出书了

在2023年3月,我们发表了大语言模型综述文章《A Survey of Large Language Models》。这篇综述文章已经更新到第13个版本,包含了83页的正文内容,并收录了900...
阅读原文

又一个GPT-4 级LLM!前谷歌大脑成员初创公司官宣 Reka Core,多模态交互超越 Claude3 Opus

直播预告 | 4月25日早10点,「智猩猩机器人新青年讲座」第5讲正式开讲,谷歌DeepMind实习研究员、上海科技大学助理教授顾家远将主讲《可泛化的具身智能操作技...
阅读原文

OpenAI陷巨大算力荒,国内大厂抢先破局!打破单芯片限制,算力效率提升33%

新智元报道编辑:编辑部 【新智元导读】一切计算皆AI已成为行业共识。大模型参数规模从千亿走向万亿,从单一走向MoE,对算力的需求愈加庞大。我们需要理清的...
阅读原文

一张照片+音频=超逼真数字人视频!VASA-1模型拉开「实时交互」大幕

新智元报道编辑:LRS 【新智元导读】仅需一张照片加一段音频,即可生成具有精确唇音同步、逼真面部行为和自然头部运动的超逼真说话面部视频,并且生成速度快...
阅读原文

总市值近45亿港币,AIGC第一股出门问问流血上市!首日破发开跌超21%

整理|凌敏、冬梅出门问问成功上市 成 AIGC 第一股 刚刚,AI 公司出门问问正式在港股上市,报 2.98 港元,总市值约 44.45 亿港元。据悉,出门问问首次发行约 8...
阅读原文

小模型时代来了?微软最小参数AI模型发布,性能逼近 GPT-3.5

作者| 李冬梅 当地时间 4 月 23 日,微软宣布推出其轻量级人工智能模型 Phi-3 Mini 的下一版本,这是该公司计划发布的三个小型模型中的第一个。 Phi-3 Mini ...
阅读原文

深度拆解“AIGC第一股”出门问问|甲子光年

“问个Billion dollar question: 人工智能的商业模式会是什么? ”作者|Vic‍‍‍ 编辑|王博 千回百转终成路,这一路走了12年。 2024年4月24日,出门问问有限公司...
阅读原文

解构海洋缺氧:浙大 GIS 实验室融合机器学习及卫星测绘,发布全球海表溶解氧综合建模框架

作者:浙大 GIS 实验室 编辑:十九,李宝珠 浙大 GIS 实验室开发了一个全球海表溶解氧综合建模框架 DOsurface-Pred Framework,并基于该框架生成了一个跨越 2...
阅读原文

商汤甩出大模型豪华全家桶!秀拳皇暴打GPT-4,首晒“文生视频”,WPS小米现场助阵

“大模型+大算力”双轮驱动,运营算力达12000P。 作者|ZeR0 编辑|漠影 智东西4月23日报道,今日,商汤科技全新升级“日日新SenseNova 5.0”大模型体系,综合能力...
阅读原文

Llama 3上线4天,井喷1000多个变种!中文版也有了!Groq上推理速度800token每秒

大数据文摘授权自夕小瑶科技说作者:Zicy 4月19号,Meta发布了其最新的大型语言模型Llama 3的早期版本,反响热烈,短短4天,就有了1000多个变种,而且这个数...
阅读原文

李彦宏说开源模型会越来越落后,为什么很多人不认同?|甲子光年

差距在缩小,但可能永远追不上。作者|赵健‍‍‍ 上周,百度董事长兼CEO李彦宏对于开源大模型的一番言论引发了争议。 李彦宏在Create 2024百度AI开发者大会上表...
阅读原文

挑战拯救痴心“舔狗”,我和大模型都尽力了

机器之心发布 机器之心编辑部天降猛男,大模型化身为 “痴情男大”,等待人类玩家的拯救。 一款名为 “拯救舔狗” 的大模型原生小游戏出现了。 游戏规则很简单:...
阅读原文

这就是OpenAI神秘的Q*?斯坦福:语言模型就是Q函数

机器之心报道 编辑:Panda‍‍还记得去年 11 月底爆出来的 Q* 项目吗?这是传说中 OpenAI 正在秘密开展、或将带来颠覆性变革的 AI 项目。如果你想回忆一下,可...
阅读原文

微软发布Phi-3,性能超Llama-3,可手机端运行

机器之心报道 编辑:小舟、泽南数据已成为提升大模型能力的重点。Llama-3 刚发布没多久,竞争对手就来了,而且是可以在手机上运行的小体量模型。 本周二,微...
阅读原文

24GB单卡全量微调Llama 3-8B,仅需添加一行代码

自ChatGPT问世以来,大型语言模型在各个领域引起了广泛兴趣,并催生了基于语言模型的应用,包括但不限于自动文本生成、信息检索、智能助理、聊天机器人以及智...
阅读原文