标签:模型

红杉资本合伙人前瞻:大模型三要素已过时,电力、服务器、钢铁成制胜关键

新智元报道编辑:耳朵 乔杨 【新智元导读】AI资格赛已经结束,下一阶段建设为王,巨头和初创如何继续赢得下半场?著名风险投资公司红杉资本的合伙人David Cah...
阅读原文

哈萨比斯:谷歌想创造第二个Transformer,还想把AlphaGo和Gemini强强联合

机器之心报道 机器之心编辑部「当一家人工智能公司的首席执行官更像是计算机科学家而不是推销员时,我感觉更舒服」。对于 DeepMind 来说,2023 是充满变化的...
阅读原文

浙大李玺团队:指代表达理解新方法,ScanFormer粗到细迭代消除视觉冗余

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

做了7年AI陪伴,Replika创始人如何看待这个赛道的未来?

Replika 是一款虚拟陪伴(AI 伴侣)应用,成立于 2017 年,在 LLM 技术爆发之前。 Replika 的灵感来源于一次悲剧 :大约十年前,Eugenia 的一位朋友去世了,...
阅读原文

酣战大模型:跨越日均5000亿+Tokens,能说明什么,该说明什么?|甲子光年

任一环节做不好=“烂尾工程”。作者|赵健‍‍‍ 编辑|甲小姐 2024年被看作大模型大规模落地元年。市场关注点流变:从“拼参数”到了“拼落地”。 被调用Tokens数可作...
阅读原文

打脸“AI灭绝伦”!研究反驳:大模型涌现能力不会威胁人类生存

大数据文摘受权转载自学术头条 大语言模型(LLM)因“涌现能力”(emergent abilities)而拥有了超出人类预期的技能,但也因此让人类十分忌惮:操纵、欺骗人类...
阅读原文

大模型时代,算法算力一体化芯片的思考与布局 | 演讲预告

生成式AI时代,大模型及AIGC的快速发展推动着计算需求的高速增长。 从服务器到边缘,再到AI手机、AI PC、AIoT、智能汽车,各个领域的AI芯片玩家都面临着新的...
阅读原文

别等GPT-4o啦,国产「开源版」GPT-4o 来了!支持全模态、无障碍交流

夕小瑶科技说 原创作者 | 谢年年腾讯最近的多模态进展有点子“一路高歌”,先是腾讯元宝升级了一波多模态能力,就差把GPT-4o从榜一拉下来了。 最近,又搞了一个...
阅读原文

科大讯飞做大模型:功能不需样样冒尖,先打造业务需要的能力

作者 | 褚杏娟 “讯飞研究院并非一个纯粹闭门造车的技术研究院。”科大讯飞副总裁、研究院院长刘聪说道。从 2005 成立至今,讯飞研究院为科大讯飞的产品提供了...
阅读原文

小模型站起来了,浏览器里跑出SOTA,抱抱脸:快逃,合成数据不是未来

梦晨 发自 凹非寺量子位 | 公众号 QbitAI浏览器里直接能跑的SOTA小模型来了,分别在2亿、5亿和20亿级别获胜,抱抱脸出品。 秘诀只有两个: 狠狠地过滤数据 在...
阅读原文

4秒看完2小时电影!阿里发布通用多模态大模型mPLUG-Owl3 | 开源

阿里mPLUG团队 投稿量子位 | 公众号 QbitAI4秒看完2小时电影,阿里团队新成果正式亮相—— 推出通用多模态大模型mPLUG-Owl3,专门用来理解多图、长视频。 具体...
阅读原文

微调Flux席卷全网,外国小哥一人组一队漫威英雄!

新智元报道编辑:编辑部 【新智元导读】席卷开源界的AI生图王者诞生了!发布半个月,Flux已经成为替代Midjourney的宠儿。各路开发者们开始用自己的照片微调Lo...
阅读原文

Post-Training有多重要?AI2研究员长文详解前沿模型的后训练秘籍

新智元报道编辑:乔杨 【新智元导读】越来越多研究发现,后训练对模型性能同样重要。Allen AI的机器学习研究员Nathan Lambert最近发表了一篇技术博文,总结了...
阅读原文

LLM数学性能暴涨168%,微软14人团队力作!合成数据2.0秘诀曝光,智能体生成教学

新智元报道编辑:桃子 【新智元导读】合成数据2.0秘诀曝光了!来自微软的研究人员们提出了智能体框架AgentInstruct,能够自动创建大量、多样化的合成数据。经...
阅读原文

昆仑万维推出全球首款 AI 短剧平台 SkyReels,「一人一剧」时代来临

机器之心原创 作者:吴昕8月19日,昆仑万维发布全球首个集成视频大模型与3D大模型的AI短剧平台SkyReels。SkyReels平台集剧本生成、角色定制、分镜、剧情、对...
阅读原文
18889909192483