标签:模型
算法、系统和应用,三个视角全面读懂混合专家(MoE)
机器之心报道 编辑:Panda WLLM 很强,而为了实现 LLM 的可持续扩展,有必要找到并实现能提升其效率的方法,混合专家(MoE)就是这类方法的一大重要成员。最...
ICML最佳论文SD3上线公共教程!DreamBench++图像自动评估新基准来了,实现人类偏好深度对齐
近日,ICML 2024 最佳论文公布了!其中就包含年度图像生成的「网红模型」——Stable Diffusion 3(简称 SD3)。SD3 是由 Stability AI 开发的最新文本到图像生...
138 亿美元的 Scale AI:解决正确的问题,做「技术含量最低」的生意
Scale AI 的创始人 8 年前意识到,所有干 AI 的都认为数据至关重要,但没多少人把数据当成主业。 他从 MIT 辍学,创业做数据标注。 2016 年,Alex Wang 成立 ...
Nature 重磅论文:用 AI 生成的数据训练 AI,会让大模型崩溃
文章转载自「新智元」。我们知道,训练大模型需要大量的数据积累,随着技术的发展,高质量数据逐渐成为AI进步的强烈需求。 面对这样的情况下,为了提升模型能...
TTS、Voice Agent,大模型落地语音呼叫中心的难点与实操经验分享
许多人都非常关心的问题是,究竟在什么场景下,当下 AI 技术容易落地? 在一场行业人士的讨论会中,四位参与者认为,呼叫中心是大模型最易落地的场景。TTS的...
Mistral AI新旗舰模型挑战Llama 3.1!1230亿参数性能直逼GPT-4o
Mistral AI新旗舰模型重磅发布:“幻觉”控制出色。 编译|孟强 编辑|云鹏 智东西7月25日消息,继Meta昨日推出开源Llama3.1模型之后,法国初创AI公司Mistral AI...
“3D视频版Sora”来了!
40秒生成3D视频,Stability AI开源首个视频生视频模型。 作者|香草 编辑|李水青 输入单个物体视频,就能获取任意拍摄视角的全视图3D动态视频了! 智东西7月25...
两天内,Meta 和 Mistral 两款主流大模型打擂台!已经不仅卷性能了,谁更便宜就用谁?
来源:AI前线 整理:冬梅、核子可乐Mistral 发布开源旗舰模型, 参数更小但性能不打折 对于前沿人工智能模型领域来说,这两天可谓热闹非凡,AI 科技竞赛正在...
万字长文,腾讯、清华等多位生物大模型作者专访,畅谈AI生物学,解析大型细胞模型技术
来源:ScienceAI 编辑:KX 大型语言模型(LLM)在自然语言处理和理解领域已取得重大突破。 在生物学领域,一些采用类似 LLM 结构的大型细胞模型(Large Cellu...
LLama 405B 技术报告解读
9月6-7日,2024全球AI芯片峰会将在北京召开。目前,AMD人工智能事业部高级总监王宏强,清华大学交叉信息研究院助理教授、北极雄芯创始人马恺声,珠海芯动力创...
OpenAI掀桌子!免费提供GPT-4o mini微调,每天200万tokens
9月6-7日,2024全球AI芯片峰会将在北京召开。目前,AMD人工智能事业部高级总监王宏强,清华大学交叉信息研究院助理教授、北极雄芯创始人马恺声,珠海芯动力创...
C 端太卷,转战企业级应用,大模型与业务场景之间的差距到底有多大?
作者 | 罗燕珊 To B or not To B,放到今天的大模型市场,依然是个可以无限议论的话题。 “to B 端的 AI 为企业提供的是更全局性的对生产力和生产效率的认知...
AI训AI惨遭投毒9次大崩溃,牛津剑桥等惊天发现登Nature封面!
新智元报道编辑:编辑部 【新智元导读】9次迭代后,模型开始出现诡异乱码,直接原地崩溃!就在今天,牛津、剑桥等机构的一篇论文登上了Nature封面,称合成数...
Mistral新旗舰决战Llama 3.1!最强开源Large 2 123B,扛鼎多语言编程全能王
新智元报道编辑: 【新智元导读】紧跟着Meta的重磅发布,Mistral Large 2也带着权重一起上新了,而且参数量仅为Llama 3.1 405B的三分之一。不仅在编码、数学...
Nature最新封面:AI训练AI?也许越来越笨
大数据文摘授权转载自学术头条 撰文:马雪薇 编审:佩奇当前,在愈发火热的大模型行业,Scaling Law 被证明依然奏效。 问题是,一旦由人类生成的高质量数据(...