标签:任务

小模型也可以「分割一切」,Meta改进SAM,参数仅为原版5%

机器之心报道编辑:陈萍、蛋酱对于 2023 年的计算机视觉领域来说,「」(Segment Anything Model)是备受关注的一项研究进展。Meta四月份发布的「分割一切模...
阅读原文

思维链提出者Jason Wei:关于大模型的6个直觉

选自 jasonwei.net/blog作者:Jason Wei机器之心编译编辑:Panda大模型究竟从下一个词预测任务中学到了什么呢?还记得 Jason Wei 吗?这位思维链的提出者还曾...
阅读原文

谷歌大杀器终于来了,最大规模Gemini震撼发布:真超GPT4,三大版本,手机直接可用

机器之心报道机器之心编辑部时代变了?迄今为止规模最大,能力最强的谷歌大模型来了。当地时间 12 月 6 日,谷歌 CEO 桑达尔・皮查伊官宣 Gemini 1.0 版正式...
阅读原文

解析 AI Agent 的发展现状和技术难点 |InfoQ《极客有约》

采访嘉宾|王元,美国五百强公司 高级数据科学家后 AIGC 时代,AI Agent 无疑是一个新沸点。AI Agent(人工智能体)是一种能够感知环境、进行决策和执行动作...
阅读原文

微软发布Orca2,“式”教会小规模大语言模型如何推理!

夕小瑶科技说 原创作者 | 付奶茶我们都知道在大多数情况下,语言模型的体量和其推理能力之间存在着正相关的关系:模型越大,其处理复杂任务的能力往往越强。...
阅读原文

通用视觉推理显现,UC伯克利炼出单一纯CV大模型,三位资深学者参与

机器之心报道机器之心编辑部仅靠视觉(像素)模型能走多远?UC 伯克利、约翰霍普金斯大学的新论文探讨了这一问题,并展示了大型视觉模型(LVM)在多种 CV 任...
阅读原文

全球首个开源多模态医疗基础模型:人工打分平均超越GPT-4V、支持2D/3D放射影像

机器之心专栏机器之心编辑部本文中,上海交大 上海 AI Lab 发布 Radiology Foundation Model (RadFM),开源 14B 多模态医疗基础模型,首次支持 2D/3D 放射影...
阅读原文

横扫13个视觉语言任务!哈工深发布多模态大模型「九天」,性能直升5%

新智元报道编辑:LRS【新智元导读】哈工深发布全新多模态大语言模型九天(JiuTian-LION),融合细粒度空间感知和高层语义视觉知识,在13个评测任务上实现了so...
阅读原文

Meta教你5步学会用Llama2:我见过最简单的大模型教学

机器之心报道编辑:赵阳本文是 Meta 官网推出的 Llama2 使用教学博客,简单 5 步教会你如何使用 Llama2。在这篇博客中,Meta 探讨了使用 Llama 2 的五个步骤...
阅读原文

追踪溯源?可定位源头模型的AI文本判别器出现了!CMU提出

夕小瑶科技说 原创作者 | 智商掉了一地、Python自从去年底 ChatGPT 发布以来,许多人的工作和生活方式随之变化。作为创作时代的重要拐点,大型语言模型(LLM...
阅读原文

用GPT-4V和人类演示训练机器人:眼睛学会了,手也能跟上

机器之心报道编辑:赵阳微软提出使用人手运动视频直接教机器人完成任务的新方法,这种方法使用 GPT-4V 分解视频中的动作,结合大语言模型生成对应的行为表述...
阅读原文

专注图表理解,腾讯、南洋理工等开源图表羊驼大模型ChartLlama

机器之心专栏机器之心编辑部在图像理解领域,多模态大模型已经充分展示了其卓越的性能。然而,对于工作中经常需要处理的图表理解与生成任务,现有的多模态模...
阅读原文

微软教小模型推理进阶版:Orca 2性能媲美10倍参数模型,已开源

机器之心报道机器之心编辑部站在巨人的肩膀上会让你看的更远,而通过让大规模语言模型来「教」较小规模的语言模型进行推理,也会是事半功倍的效果。如你我所...
阅读原文

朱松纯教授团队提出通用人工智能测试评级的标准与平台Tong Test

//人类正在迈入智能时代,其区别于信息时代的显著特征是大量通用智能体的出现,而通用人工智能作为引领和推动智能时代发展的核心科技,是目前及未来国际人工...
阅读原文

LLM准确率飙升27%!谷歌DeepMind提出全新「后退一步」提示技术

新智元报道编辑:拉燕【新智元导读】谷歌DeepMind全新提示技术「Step-Back Prompting」,让LLM性能拉满!前段时间,谷歌DeepMind提出了一种全新的「Step-Back...
阅读原文
1363738394048