速度暴涨1000倍!扩散模型预测材料“炼金”过程,体系越复杂加速度越大丨MIT&康奈尔

萧箫 发自 凹非寺量子位 | 公众号 QbitAI用扩散模型预测化学反应,速度直接暴涨1000倍!原本需要用计算机硬算几小时甚至一天,现在单个GPU用6秒钟就能搞定。...
阅读原文

GPT-4V都搞不明白的未来推理有解法了!来自华科大&上科大

于恩 投稿量子位 | 公众号 QbitAI多模态大语言模型展现了强大的图像理解和推理能力。但要让它们基于当前观测来对未来事件进行预测推理仍然非常困难。即便是当...
阅读原文

论文遭首届ICLR拒稿、代码被过度优化,word2vec作者Tomas Mikolov分享背后的故事

机器之心报道编辑:杜伟、大盘鸡除了表达自己获得 NeurIPS 2023 时间检验奖的感想之外,Tomas Mikolo 还对 NLP 和 ChatGPT 的现状给出了自己的一些思考。几天...
阅读原文

数智上海2023峰会成功举办,百余位大咖齐聚,共论智能创新赋能产业数字化转型

以“应变求机 以数谋新”为主题的 2023 上海城市数字化转型体验周于 12 月 16 日在上海财经大学国家大学科技园开幕。市政府副秘书长庄木弟为上海城市数字化转型...
阅读原文

走在GPT 4.5前面?3D、视频直接扔进对话框,大模型掌握跨模态推理

机器之心报道编辑:Panda W最近,有人在社交媒体上发布了一张有关 GPT4.5 更新的截图。图中内容显示,和 GPT 系列之前推出的模型相比,GPT4.5 最大的惊喜可能...
阅读原文

源代码is all you need!7B代码小模型同尺寸无敌,性能媲美ChatGPT和谷歌Gemini

机器之心报道编辑:Rome Rome软件开发人员对代码生成 AI 已经不陌生,它们已经成为提高生产力的利器。本文中,伊利诺伊大学香槟分校(UIUC)张令明老师团队带...
阅读原文

为什么基于MoE的大模型更值得关注?

此页面是否是列表页或首页?未找到合适正文内容。…
阅读原文

是什么手机零件,能让余承东和小米为它吵了一架?

开合之间造就质感这两天余承东和小米的隔空对线,刷爆了热搜。没点进词条之前,我以为他们两家在达成「全球专利交叉许可协议」后,又开展了什么重大的业务合...
阅读原文

哀悼!55岁商汤科技创始人汤晓鸥突然离世,他撑起中国计算机视觉研究半壁江山

新智元报道编辑:编辑部【新智元导读】商汤科技创始人、著名人工智能科学家汤晓鸥于12月15日因病救治无效不幸离世,终年55岁。沉痛悼念!2023年12月15日23时4...
阅读原文

Mistral携微软引爆「小语言模型」潮!Mistral中杯代码能力完胜GPT-4,成本暴降2/3

新智元报道编辑:Aeneas【新智元导读】小模型的风潮,最近愈来愈盛,Mistral和微软分别有所动作。而网友实测发现,Mistral-medium的代码能力竟然完胜了GPT-4...
阅读原文

UC伯克利发现GPT-4惊人缺陷:儿童从经验中学习因果,LLM却不行

新智元报道编辑:拉燕【新智元导读】最近,UC伯克利的一项研究揭示了LLM和小孩子们在认知上的一项重要差别——创造新的因果结构的能力。大家有没有想过一个问题...
阅读原文

王小川创业 8 个月:大模型还没到谈 PMF 的时候

这是王小川创业做大模型的第 8 个月。很多过去行业的常识、惯性的做法,都不再适用当下的大模型时代,王小川认为,当前很多大模型的应用,并没有真正扣应用户...
阅读原文

追忆商汤科技汤晓鸥:告别一个有趣的灵魂|甲子光年

汤晓鸥教授,一路走好。作者|「甲子光年」内容团队‍‍‍“我不是在最好的时光遇见了你们,而是遇见了你们,我才有了这段最好的时光。”在今年7月举办的2023世界...
阅读原文

重磅发布|2023 Science年度十大科学突破

点击上方蓝色字,关注我们Breakthroughof The Year2023年度十大科学突破每一年,《科学》杂志的编辑团队都会评选出年度十大科学突破,其中包括一项科学突破冠...
阅读原文

Ilya带头OpenAI超级对齐首篇论文《弱到强的泛化:在弱监督下获得强能力》,AI对齐AI取得实证结果

来源:转载机器之心报道编辑:陈萍、蛋酱人类无法监督超级人工智能,但人工智能可以。过去一年,以「预测下一个 Token」为本质的大模型已经横扫人类世界的多...
阅读原文