标签:能力

Nature 热议论文证明「语言不是思考工具」,LLM 可能要学不会推理了?

机器之心PRO · 会员通讯 Week 26---- 本周为您解读 ③个值得细品的AI & Robotics业内要事 ---- 1. Nature 热议论文证明「语言不是思考工具」,LLM 可能要...
阅读原文

AI如何改变通信?对话联想懂的通信

克雷西 发自 凹非寺量子位 | 公众号 QbitAI刚刚,世界通信行业顶级大会——MWC上海站落下帷幕。 展会上,不仅5.5G(5G-A)标准正式亮相,AI也成为了通信领域新...
阅读原文

打开文心大模型,一看全是生产力

机器之心报道 作者:泽南、小舟百度文心按下了 Turbo 键。 最近一段时间,人们在热衷于给大模型「考试」。 不论是适用于机器的 Benchmark 跑分,还是人类的高...
阅读原文

打通大模型行业应用任督二脉!看讯飞星火如何做好大模型落地“必答题”

破解大模型落地最后一公里难题,科大讯飞甩出组合拳。 作者|程茜 编辑|漠影 智东西6月28日下午,昨日下午,科大讯飞的星火大模型迎来重磅升级,基于全国首个...
阅读原文

炸裂!讯飞现场大秀强干扰语音识别,星火4.0霸榜八个榜单,74种语言交流

游鱼 发自 凹非寺量子位 | 公众号 QbitAI很炸裂!讯飞星火大秀语音识别能力,现场掌声雷动—— 三个人同时说话,再加上背景音乐,如此强干扰的场景,大模型却表...
阅读原文

陈丹琦团队图表解读新基准:新王Claude3.5刚及格,但已是模型最强推理表现

克雷西 发自 凹非寺量子位 | 公众号 QbitAIClaude 3.5 Sonnet的图表推理能力,比GPT-4o高出了27.8%。 针对多模态大模型在图表任务上的表现,陈丹琦团队提出了...
阅读原文

击败Gemini-1.5-Pro、GPT-4V,从容大模型多模态能力跻身全球前三

机器之心报道 机器之心编辑部近日,云从科技从容大模型在综合评测权威平台 OpenCompass 的多模态评测领域中取得重大进展。 最新评测结果显示,云从科技的从容...
阅读原文

一群顶尖搜索人才如何2个月出货,还把GPU利用率干到60%!揭秘百川智能研发大模型这一年

作者|褚杏娟 采访嘉宾|陈炜鹏 去年的大模型之战讲究一个“快”字:入场快、发布快、迭代快。 王小川在去年 4 月份宣布成立“百川智能”的两个月后,就迅速对外...
阅读原文

飞书,为何成为国内大模型独角兽们的共同选择?

机器之心发布 来源:虎嗅题图 |视觉中国 在过去的一年多时间里,“大模型” 一直是中国科技领域内最热门的赛道。 尤其是进入 2024 年之后,整个行业的热度只能...
阅读原文

OpenAI封杀不支持地区API:违规封号,7月9日生效

机器之心报道 编辑:泽南该来的还是来了。昨晚,很多大模型应用的开发者、程序员都收到了 OpenAI 的警告信,心里一惊。OpenAI 在检测用户使用其 API 的地区后...
阅读原文

昆仑万维携手南洋理工大学抢发Q*算法:百倍提升7B模型推理能力

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

图解智能和意识基本原理的“飞行模型”

作者:刘锋 随着本世纪以来人工智能的快速发展,其对人类社会的影响也越来越大,对于通用智能何时实现、人工智能是否能产生自我意识,人工智能未来的研究方...
阅读原文

语言≠思维,大模型学不了推理:一篇Nature让AI社区炸锅了

机器之心报道 机器之心编辑部方向完全搞错了?大语言模型(LLM)为什么空间智能不足,GPT-4 为什么用语言以外的数据训练,就能变得更聪明?现在这些问题有 「...
阅读原文

奥林匹克竞赛里选最聪明的AI:Claude-3.5-Sonnet vs. GPT-4o?

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

大模型“考生”数学全不及格!首个AI高考全卷评测结果出分

直播预告 | 6月25日晚7点,「智猩猩机器人新青年讲座」第9讲正式开讲,UMass Amherst在读博士周沁泓将直播讲解《在具身智能模拟器中针对动态灾害进行具身决策...
阅读原文
1151617181956