标签:数据
Ilya认错,Scaling Law崩了?自曝SSI秘密技术路线取代OpenAI
新智元报道编辑:Aeneas 好困 【新智元导读】Ilya终于承认,自己关于Scaling的说法错了!现在训练模型已经不是「越大越好」,而是找出Scaling的对象究竟应该...
完全开源的代码大模型OpenCoder来了,跻身性能第一梯队
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
CCS 2024 | 如何严格衡量机器学习算法的隐私泄露? ETH有了新发现
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
伯克利罗剑岚:机器人的范式革命,藏在真实世界中丨具身先锋十人谈
Sergey Levine 对罗剑岚说,“You really made RL work.”作者丨赖文昕 编辑丨陈彩娴 近日,伯克利大学 Sergey Levine 团队发布了一项强化学习方向的重磅工作——...
收集20+时空数据集,超1.3亿样本点,清华研究团队基于生成式AI,提出3种城市复杂系统建模方法
作者:丁璟韬,李姝 编辑:李宝珠 在 HyperAI超神经联合出品的 COSCon’24 AI for Science 论坛中,来自清华大学电子工程系城市科学与计算研究中心的博士后研...
o1不是唯一路径!MIT新研究:在测试时训练,模型推理能力最高升至5.8倍
克雷西 发自 凹非寺量子位 | 公众号 QbitAIo1不是通向大模型推理的唯一路径! MIT的新研究发现,在测试时对大模型进行训练,可以让推理水平大幅提升。 在挑战...
应用突破还是炫技噱头:大模型能否真正驱动行业升级?
编辑 | 罗燕珊 策划 | AICon 全球人工智能开发与应用大会 大模型如何驱动行业升级? 近日 InfoQ《极客有约》X AICon 直播栏目特别邀请了商汤科技大模型技术...
曝OpenAI新旗舰模型“难产”,或明年年初发布
GPT进展放缓,OpenAI撞上数据墙,努力寻找出路。 编译|汪越 编辑|Panken 智东西11月11日消息,据The Information报道,OpenAI的GPT系列模型改进速度放缓,公...
The Information爆料:OpenAI调整大模型方向,Scaling Law撞墙?
文章转载自「机器之心」。 有研究预计,如果 LLM 保持现在的发展势头,预计在 2028 年左右,已有的数据储量将被全部利用完。届时,基于大数据的大模型的发展...
万字长文细说腾讯发布史上最大开源Moe:Hunyuan-Large(详解版,建议收藏)
大会预告12月5日-6日,2024中国生成式AI大会(上海站)将举办。上海科大助理教授、博导顾家远,腾讯优图实验室天衍研究中心负责人吴贤,银河通用机器人合伙人...
浙大开源“最懂Excel的GPT”!首次将结构化数据作为独立模态训练,刷榜提升40百分点
明敏 发自 凹非寺量子位 | 公众号 QbitAI大模型理解复杂表格,能力再次飞升了! 不仅能在不规则表格中精准找到相关信息,还能直接进行计算。 比如提问: 如果...
天塌了,Scaling Law 已撞收益递减墙?OpenAI 在内,所有大模型都正遭遇巨大瓶颈
整理 | 华卫、核子可乐 近日,有外媒报道称,OpenAI 正在制定新策略,以应对人工智能大模型改进速度放缓的问题。消息一出,知名认知科学家、AI 研究员 Gary M...
微软开源5级通用AI Agent:浏览网页、查论文,无所不能!
大会预告12月5日-6日,2024中国生成式AI大会(上海站)将举办。上海科大助理教授、博导顾家远,腾讯优图实验室天衍研究中心负责人吴贤,银河通用机器人合伙人...
「压缩即智能」,成就LLM的Transformer 未必是终极解?
机器之心PRO · 会员通讯 Week 45---- 本周为您解读 ③个值得细品的AI & Robotics业内要事 ---- 1. LLM 验证了「压缩即智能」,但 Transfomer 未必长青? L...
腾讯混元康战辉:将开源大模型训练代码,但数据开源意义不大
11 月 5 日,腾讯混元宣布最新的 MoE 模型“混元 Large“以及混元 3D 生成大模型“ Hunyuan3D-1.0”正式开源,支持企业及开发者精调、部署等不同场景的使用需求,...