标签:阶段

今日arXiv最热大模型论文:上海AI lab发布MathBench,GPT-4o的数学能力有多强?

夕小瑶科技说 原创作者 | 谢年年大模型数学能力哪家强? 最近,上海AI lab构建了一个全面的多语言数学基准——MathBench。与现有的基准不同的是,MathBench涵盖...
阅读原文

Nature子刊 | 加州理工学院利用脑机接口实时解码内心言语

语音脑机接口(BMIs)将大脑神经信号转换为单词或音频输出,能够让因疾病或受伤而失去语言能力的人能够进行交流。虽然在语音、尝试和模拟语音解码方面取得了...
阅读原文

集体出走的Stability AI 发布全新代码大模型,3B以下性能最优,超越Code Llama和DeepSeek-Coder

夕小瑶科技说 原创作者 | 蛋糕Stability AI又有新动作!程序员又有危机了?3月26日,Stability AI推出了先进的代码语言模型Stable Code Instruct 3B,该模型...
阅读原文

智能体DS-Agent基于案例推理,让GPT-4数据科学任务接近100%

机器之心专栏 机器之心编辑部基于案例的推理助力大模型智能体挑战自动化数据科学任务,吉大、上交和汪军团队发布专注于数据科学的智能体构建框架 DS-Agent。...
阅读原文

高盛:英伟达引领了AI行业的第一阶段,接下来的三个阶段是..

点击上方蓝字关注我们“随着人工智能技术的飞速发展,高盛最新报告为投资者描绘了一幅详尽的投资路线图。报告指出,尽管英伟达(Nvidia)股价波动,但其年初至...
阅读原文

图解Mixtral 8 * 7b推理优化原理与源码实现

智猩猩与智东西将于4月18-19日在北京共同举办2024中国生成式AI大会,阿里巴巴通义千问大模型技术负责人周畅,潞晨科技创始人尤洋,生数科技CEO唐家渝,优必选...
阅读原文

复旦发布ToolSword框架,揭露大模型工具学习中的安全风险

夕小瑶科技说 原创作者 | 芒果、Python引言:工具学习在实际部署大型语言模型中的重要性在当今的人工智能领域,大语言模型(LLMs)的实际部署已成为一个热门...
阅读原文

生成速度快SDXL一倍,9GB GPU也能运行,Stable Cascade来搞性价比了

机器之心报道 编辑:大盘鸡硬件要求越来越低,生成速度越来越快。Stability AI 作为文本到图像的「元老」,不仅在引领该领域的潮流方向,也在模型质量上一次...
阅读原文

AI看视频自动找“高能时刻”|字节&中科院自动化所@AAAI 2024

梦晨 发自 凹非寺量子位 | 公众号 QbitAI大家看视频用过“高光时刻”功能吗? 观众可以直接空降到精彩时刻,主播也可以从长时间直播录像中复盘自己的表现。 字...
阅读原文

比A100性价比更高!FlightLLM让大模型推理不再为性能和成本同时发愁

机器之心专栏 机器之心编辑部大语言模型在端侧的规模化应用对计算性能、能效比需求的“提拽式”牵引,在算法与芯片之间,撕开了一道充分的推理竞争场。 面对想...
阅读原文

AAAI 2024:大模型如何掌握复杂工具?看孔子框架的教学之道

夕小瑶科技说 原创作者 | 智商掉了一地、Python 如今,大型语言模型(LLM)发展飞速,在文本和图像生成方面表现都很出色,但在我们的实际生活中,要理解和正...
阅读原文

只需一张图片、一句动作指令,Animate124轻松生成3D视频

机器之心专栏 机器之心编辑部Animate124,轻松将单张图片变成 3D 视频。近一年来,DreamFusion 引领了一个新潮流,即 3D 静态物体与场景的生成,这在生成技术...
阅读原文

一文剖析GPT推断中的批处理(Batching)效应

来源:PaperWeekly作者:陈乐群学校:华盛顿大学博士生研究方向 :机器学习系统及分布式系统机器学习模型依赖于批处理(Batching)来提高推断吞吐量,尤其是...
阅读原文

OpenAI内斗时,Karpathy在录视频:《大型语言模型入门》上线

机器之心报道编辑:杜伟赶紧学习起来吧!OpenAI 的风波暂时告一段落,员工也忙着「干活了」。年初回归 OpenAI 的 Andrej Karpathy 最近做了一场关于大型语言...
阅读原文

ChatGPT只算L1阶段,谷歌提出AGI完整路线图

丰色 发自 凹非寺量子位 | 公众号 QbitAIAGI应该如何发展、最终呈什么样子?现在,业内第一个标准率先发布:AGI分级框架,来自谷歌DeepMind。该框架认为,发...
阅读原文
123