标签:模型
AI 求解量子多体问题:GPT 理解人类语言,也理解量子语言吗?
导语加州大学圣地亚哥分校副教授、集智科学家尤亦庄等人在最新研究中,提出一种名为 ShadowGPT 的新方法,让 GPT 语言模型生成经典阴影(classical shadows)...
英伟达 Blackwell 芯片又又又曝问题!老黄大半年没搞定,微软们被迫换货、换方案
整理 | 燕珊 据 The Information 最新报道,英伟达下一代 Blackwell 芯片在高密度服务器机架中出现严重过热问题,导致设计变更和客户方面的部署延迟。这让 G...
网易CodeWave:当低代码+AIGC 进入深水区,我们如何继续发展?
作者 |网易 CodeWave 团队 何少甫、赵雨森、姜天意 低代码 +AIGC 在很多人眼里貌似是一个很“新”的领域,怎么就深水区了?去年在同样的时间点,我们规划并上线...
扩散模型版CS: GO!世界模型+强化学习:2小时训练登顶Atari 100K
新智元报道编辑:LRS 【新智元导读】DIAMOND是一种新型的强化学习智能体,在一个由扩散模型构建的虚拟世界中进行训练,能够以更高效率学习和掌握各种任务。在...
Karpathy后悔了:2015年就看到了语言模型的潜力,却搞了多年强化学习
机器之心报道 机器之心编辑部耽误业界好多年?「这是有史以来最大、最令人困惑的研究生涯错误,」Andrej Karpathy 感叹道。 上个周末,OpenAI 创始成员、研究...
NeurIPS 2024 | 自我纠错如何使OpenAI o1推理能力大大加强?北大、MIT团队给出理论解释
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
周五聊:AI产品出海,怎么找达人做营销?
产品出海,做产品增长有很多方式。SEO、PLG、广告、社区、社媒……每种方式都值得细说。 在之前的「AI 创业工具箱」系列 Workshop中,我们聊了增长策略、广告投...
PLM重大突破!上海交大与上海AI Lab最新成果入选NeurIPS 24,ProSST有效整合蛋白质结构信息
作者:田小幺 编辑:十九,李宝珠 上海交通大学自然科学研究院/物理天文学院/张江高研院/药学院洪亮教授课题组,上海交大助理研究员周冰心,联合上海人工智能...
ScalingLaw终结了么?
大会预告12月5-6日,智猩猩共同主办的2024中国生成式AI大会(上海站)将举办。北大(临港)大模型对齐中心执行主任徐骅,腾讯优图实验室天衍研究中心负责人吴...
扩展测试时计算是万能的吗?Scaling What成为关键
机器之心PRO · 会员通讯 Week 46---- 本周为您解读 ③个值得细品的AI & Robotics业内要事 ---- 1. 扩展测试时计算是万能的吗?Scaling What成为关键 传统...
突破无规则稀疏计算边界,编译框架CROSS数倍提升模型性能
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
AI周报 | 月之暗面杨植麟回应近期争议;马斯克或遭调查,理由是“通俄”;小米汽车校招待遇曝光,一年可达 18 薪
整理 | 傅宇琪、褚杏娟 Kimi 发布新模型对标 OpenAI o1!月之暗面创始人回应近期争议;马斯克或遭调查,理由是“通俄”;小米汽车校招待遇曝光:一年收入可达 1...
通义灵码 SWE-GPT:从 静态代码建模 迈向 软件开发过程长链推理
作者 | 马迎伟 / 明巍、黎槟华 / 临城、李永彬 / 水德 解决真实 GitHub issue 能力进化,通义灵码团队最新论文《An Open Development-Process-Centric Langua...
Scaling Law或将终结?哈佛MIT预警:低精度量化已无路可走,重磅研究掀翻AI圈
新智元报道编辑:桃子 LRS 【新智元导读】哈佛斯坦福MIT等机构首次提出「精度感知」scaling law,揭示了精度、参数规模、数据量之间的统一关系。数据量增加,...
14天速成LLM高手!大佬开源学习笔记,GitHub狂揽700星
新智元报道编辑:LRS 【新智元导读】一位AI从业者分享的14天学习路线图,涵盖大模型从基础到高级的主要关键概念!无论是面试找工作、还是自学创业,甚至想要...