标签:模型

他们掰开神经元,终于让大模型9.8大于9.11了:神秘创业公司,开源AI「」工具

机器之心报道 机器之心编辑部大模型为什么认为 9.8<9.11?神经元级别的解释来了。9.8 和 9.11 到底哪个大?这个小学生都能答对的问题却难倒了一众大模型,...
阅读原文

​哪个模型擅长调用工具?这个7B模型跻身工具调用综合榜单第一

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

加强版Claude3.5正式上线,一句话操控电脑的时代真的要来了。

大数据文摘受权 转载自数字生命卡兹克 作者:卡兹克、东毅 夜里十一点,大洋彼岸早上8点整。 Claude带着大货闪亮登场了。 升级版的Claude 3.5 Sonnet,新模型...
阅读原文

别人刚上「端到端」,理想智驾却又迭代了

理想的 快与慢自动驾驶技术发展了这么多年,最大的变化是什么? 在写下这篇文章的前一天,两位汽车行业朋友来到爱范儿,和我们坐下聊了聊。聊到的内容有很多...
阅读原文

医疗领域基准测试超越Llama 3、接近GPT-4,上海交大团队发布多语言医学大模型,覆盖6国语言

作者:李宝珠 编辑:三羊 上海交通大学王延峰教授与谢伟迪教授团队创建了一个包含 255 亿 tokens 的多语言医疗语料库 MMedC,开发了一个覆盖 6 种语言的多语...
阅读原文

HyperAI超神经 x 开源中国丨高性能计算与大模型推理,北京见!

10 月 26 日,「高性能计算与大模型推理」OSC 源创会·北京站·第 107 期,来自华为、商汤、趋境科技的资深研发人员将发表主题演讲,共同探讨大模型推理优化与...
阅读原文

荣耀MagicOS 9.0来了个全局智能体,AI手机方向变了

机器之心报道 编辑:泽南、杜伟一夜之间,AI 智能体学会操纵手机了。「太可怕了。」 在直播间里,赵明向周鸿祎现场展示了真正的技术,找 AI 智能体整点咖啡:...
阅读原文

NeurIPS 2024 | 解锁大模型知识记忆编辑的新路径,浙大用「WISE」对抗幻觉

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

Q3大模型中标项目超360个,业界仍在解决落地难

大模型落地项目在屡创新高,大部分项目是探索大模型应用场景。 作者|周享玥 编辑|赵艳秋 大模型落地项目在屡创新高。 数智前线通过中国政府采购网、中国招投...
阅读原文

如何通过KV稀疏实现对vLLM的1.5倍加速

作者 | PPIO 算法专家张青青前 言近一年以来,自 H2O 起,关于 KV 稀疏的论文便百花齐放,而在实际应用中不得不面临的一个问题便是学术论文与实际应用之间的...
阅读原文

不怪奥特曼慌!最大对手Anthropic抢先让AI 接管人类电脑,网友怒赞并喊话OpenAI:看看人家

整理 | 华卫、核子可乐 昨日,由多位前 OpenAI 员工建立的 AI 初创公司 Anthropic 对外推出了一项引人注目的新功能,名为“计算机使用”。这项功能让大模型理...
阅读原文

西湖大学发布 「 AI 科学家」 Nova,效果相比 SOTA 提升 2.5 倍

科学家看着生成结果,不敢相信这是AI整出来的东西。作者丨郑佳美 编辑丨马晓宁 还记得今年夏天让众多科研工作者“瑟瑟发抖”的 AI scientist 吗? 彼时的它,作...
阅读原文

Transformer能否推理引争议,DeepMind连夜更新论文开源数据集:Transformer真的很强

小模型干大事,DeepMind重新审视Transformer推理能力。作者丨刘洁 编辑丨岑峰 DeepMind闷声干大事,悄悄训练了一个大小只有270M的Transformer模型,居然不需...
阅读原文

AI公司波形智能解散,主创团队集体入职OPPO;微软亚研院前首席研究经理谭旭加入月之暗面;商汤CEO内部信曝光丨AI情报局

要闻提示1.AI创业公司波形智能解散,曾获千万融资,主创团队已入职OPPO 2.传字节跳动旗下BytePlus考虑在泰国新建数据中心,专攻人工智能 3.中国首个UI大模型...
阅读原文

黄仁勋:我从不在乎市场份额,英伟达唯一目标是创造新市场

一水 发自 凹非寺量子位 | 公众号 QbitAI“这是我听过的黄仁勋最好的采访!” 英伟达CEO黄仁勋的一场炉边谈话再次引起热议: 英伟达从来没有一天谈论过市场份额...
阅读原文
12627282930483