标签:场景

苹果大模型新成果:GPT-4o扮演用户,在场景中考察大模型工具调用,网友:Siri也要努力 | 开源

克雷西 发自 凹非寺量子位 | 公众号 QbitAI苹果团队,又发布了新的开源成果——一套关于大模型工具调用能力的Benchmark。 这套Benchmark创新性地采用了场景化测...
阅读原文

自动驾驶的终极答案:理想、特斯拉和 OpenAI 的殊途同归 | 对话理想智驾团队

自动驾驶 终极答案2013 年的时候,自动驾驶还是一个非常前沿和性感的概念,一如当下的 AGI,前几年的元宇宙,在互联网公司如火如荼的时代,腾讯每年都会举办...
阅读原文

最高提速1440倍!15秒用GCN搞定随机规划,中科院自动化所新成果入选ICML 24

中科院自动化研究所 投稿量子位 | 公众号 QbitAI仅需15秒即可搞定随机规划问题,速度比传统方法快了1440倍! 中科院自动化研究所的新研究,利用GCN在此类问题...
阅读原文

一年半了,AI 产品还没找到它的「二维码」

2011 年 11 月,微信更新了 v3.1,首发于诺基亚的塞班上,带来了「二维码」。一周后,这一功能也上线到了安卓和 iOS。 来源:微信官网 2012 年 5 月,张小龙...
阅读原文

李飞飞「空间智能」之后,上交、智源、北大等提出空间大模型SpatialBot

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

首次(全)解锁CARLA V2! 上交大RethinkLab提出隐世界模型下的强化学习自动驾驶模型Think2Drive

「自动驾驶新青年讲座」由智猩猩企划,致力于邀请全球知名高校、顶尖研究机构以及优秀企业的新青年,主讲在环境感知、精准定位、决策规划、控制执行等自动驾...
阅读原文

ICML 2024|复杂组合3D场景生成,LLMs对话式3D可控生成编辑框架来了

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

GPT-4o 最关键功能本周上线,语音交互的时代终于要来了

Voice Agent 是与人类进行对话沟通的 AI,是下一代人机交互界面。和文本相比,声音交互的优势主要体现在: • 语音交互以其与人类自然沟通方式的高度一致性,...
阅读原文

1亿元模型券来了!北京发布AI新政策,76次提及“大模型”

最高奖励5000万元!北京“人工智能+”行动计划发布。 作者|李水青 编辑|心缘 智东西7月29日消息,7月26日,北京市发展和改革委员会、北京市经济和信息化局等多...
阅读原文

TTS、Voice Agent,大模型落地语音呼叫中心的难点与实操经验分享

许多人都非常关心的问题是,究竟在什么场景下,当下 AI 技术容易落地? 在一场行业人士的讨论会中,四位参与者认为,呼叫中心是大模型最易落地的场景。TTS的...
阅读原文

跨境电商的AI奇点正在到来|甲子光年

阿里国际用AI重写了1亿款商品的标题和详情页。作者|王艺‍‍‍ 编辑|栗子‍‍ 2023年是跨境电商在海外狂飙突进的一年。中国电商“出海四小龙”(SHEIN、速卖通AliE...
阅读原文

“具身智能小镇”来了!机器人逛超市买菜满街跑,AI充当NPC,来自上海AI Lab

明敏 发自 凹非寺量子位 | 公众号 QbitAI超逼真的机器人小镇来了! 在这里,机器人可以像人一样在超市里购物: 买菜回家做饭: 在办公室里接咖啡(旁边还有人...
阅读原文

机器人版的「斯坦福小镇」来了,专为具身智能研究打造

机器之心报道 编辑:张倩首个专为各种机器人设计的模拟互动 3D 社会。还记得斯坦福的 AI 小镇吗?这是斯坦福的 AI 研究者打造的一个虚拟环境。在这个小镇上,...
阅读原文

Nature Medicine:“小世界增强”落地级医学大模型推向临床试验

来源:原文链接:https://www.nature.com/articles/s41591-024-03148-7 以大模型为代表的生成式人工智能,拥有强大的知识编码、文本理解、推理能力,迅速成为...
阅读原文

CVPR'24 Highlight|一个框架搞定人物动作生成,精细到手部运动

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文
13456718