标签:数据

通用端到端OCR模型开源,拒绝多模态大模型降维打击

Vary团队投稿 凹非寺量子位 | 公众号 QbitAI在AI-2.0时代,OCR模型的研究难道到头了吗!?(OCR:一种将图像中的文字转换为可编辑和可搜索文本的技术) Vary...
阅读原文

LLM训练通信量减少10000倍!全新分布式优化器,整合世间算力训练强大AI

新智元报道编辑:alan 【新智元导读】近日,Nous Research宣布了一项重大突破,通过使用与架构和网络无关的分布式优化器,研究人员成功将训练LLM时GPU间的通...
阅读原文

还在人工炼丹?自动提示工程指南来了,还带从头实现

机器之心报道 编辑:Panda人工设计提示词太麻烦了!想过让 LLM 帮你设计用于 LLM 的提示词吗?近日,自称生成式 AI 黑带选手的谷歌研究者 Heiko Hotz 发布了...
阅读原文

还在死磕AI咒语?北大-百川搞了个自动提示工程系统PAS

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

离开OpenAI,独自创业之后,Karpathy对AI更乐观了

「我觉得车在自动驾驶中基本上就是个机器人。」 「很多人认为特斯拉只是一家汽车公司,这种看法有点误导。特斯拉其实是一家大规模的机器人公司。」 在最近一...
阅读原文

RL 是 LLM 的新范式

AGI 正在迎来新范式,RL 是 LLM 的秘密武器。最近几个月,我们能明显感受到头部 AI labs 在形成一些新共识:post training 的重要程度在提高,需要的计算资源...
阅读原文

70B大模型训练秘方① :数据集创建与评估

今年6月,大模型公司Imbue预训练了一个70B参数的模型,并在多选推理基准上进行了微调。在这些基准上,Imbue微调的模型超越了GPT-4o zero-shot表现(该模型未...
阅读原文

Andrej Karpathy最新采访:认知核心模型10亿参数就够了,AI会打破教育不公的僵局

夕小瑶科技说 原创作者 | 海野AI圈子的红人,AI大神Andrej Karpathy,曾是OpenAI联合创始人之一,特斯拉AI总监。上一次的动态是官宣创办一家名为 Eureka Labs...
阅读原文

视觉模型底座超越OpenAI,格灵深瞳开启多模态落地的Scaling Law

梦晨 发自 凹非寺量子位 | 公众号 QbitAI大模型时代,有个大家普遍焦虑的问题:如何落地?往哪落地? 聚光灯下最耀眼的OpenAI,最近也先被曝出资金告急,后又寻...
阅读原文

实现机器人领域的ChatGPT时刻,需要大模型+强化学习丨明星教授Sergey特邀报告

大数据文摘受权转载自智源社区 想象一下,如果想构建一个AI系统来控制机器人探索另一个星球。这样的机器人需要做些什么呢? 它需要储备一些知识,能够理解环...
阅读原文

不炼大模型的互联网公司,趟出AI转型第一波经验

一水 发自 凹非寺量子位 | 公众号 QbitAIAI应用落地,算力不足仍是摆在众人面前的第一道槛。 这不,作为国产芯片设计公司,燧原科技成立时就碰上了这个老大难...
阅读原文

北大王立威:理论视角看大模型,为什么AI既聪明又愚蠢 | 智者访谈

人工智能的卓越发展 源于对技术与产业本质的洞察 机器之心全新视频栏目「智者访谈」 邀请领域专家,洞悉 AI 核心技术与行业趋势 为从业者量身打造 深化行业认...
阅读原文

大模型边推理边纠错,有可能做到吗?这是ICML爆火的演讲

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

太火了!我在外滩大会玩Deepfake,想骗过机器人结果……

白小交 发自 凹非寺量子位 | 公众号 QbitAI我在外滩大会上生成Deepfake,结果没骗过机器人…… 反倒啪的一下,秒秒钟就被找出?! 而机器人手中的神兵利器,仅...
阅读原文

突破传统:AI如何应对心电图中的长尾挑战?

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文
11718192021126