标签:基础

16家头部大模型公司上海神秘碰头,现场人挤人人人

金磊 明敏 发自 上海量子位 | 公众号 QbitAI挤爆了,简直要被大模型公司们给挤爆了。 来感受一下这个feel: 毫不夸张地说,国内外叫得上来的大模型公司基本上...
阅读原文

State of GPT:大神Andrej揭秘OpenAI大模型原理和训练过程

前言 OpenAI的创始人之一,大神Andrej Karpthy刚在微软Build 2023开发者大会上做了专题演讲:State of GPT(GPT的现状)。 在这个朴实无华的题目之下,Andrej...
阅读原文

李彦宏欧洲谈AI:比起GPT-5,我更感兴趣超级应用

鱼羊 发自 凹非寺量子位 | 公众号 QbitAI中国AI与西方的最大区别是应用,中国有数百个基础模型,但人们越来越多地在讨论什么是AI时代的超级应用。 应用正在驱...
阅读原文

谷歌员工爆料Python基础团队原地解散

机器之心报道 编辑:蛋酱什么?谷歌解雇了整个 Python 基础团队?「当与你直接共事的每个人,包括你的主管,都被裁员 —— 哦,是职位被削减,而你被要求安排他...
阅读原文

阿里开源110B大模型!超越LLama3!

4月26日晚间,阿里正式发布了110B的千问1.5开源大模型。 110B是中文开源模型的最大尺寸,用了GQA,32k上下文,除了中文能力亮眼,英文表现效果好于LLama3 70B...
阅读原文

《大模型决策制定中的幻觉检测》综述

来源:专知 自主系统很快将无处不在,从制造业自主性到农业领域的机器人,再从医疗保健助手到娱乐产业。这些系统的大多数都是用于决策、规划和控制的模块化子...
阅读原文

八位院士发言!如何推动“基础研究”高质量发展?

来源:《瞭望》 转自:锐动源◆受访专家(按姓氏笔画排序): 中国科协副主席,北京大学常务副校长、医学部主任,中国工程院院士 乔杰 厦门大学党委书记、中国...
阅读原文

OpenAI 投资的机器人公司高管:具身智能会像 ChatGPT 一样突然到来

2022 年,谷歌高级研究科学家 Eric Jang 离开 Google Robotics,以副总裁的身份加入 1X Technologies 负责 AI 工作。2023 年 3 月,1X 获得了一轮由 OpenAI ...
阅读原文

DeepMind CEO:LLM+树搜索就是AGI技术线路,AI科研依赖工程能力,闭源模型就是比开源安全

新智元报道编辑:润 【新智元导读】最近谷歌DeepMind的CEO Hassabis接受了多个播客主播的专访,向大众透露很多谷歌最近发布模型的内幕,以及他理解的如何通向...
阅读原文

限时下载 | 86页!复旦大模型Agent综述,一文纵览AI智能体的现状与未来

《基于LLMs的代理的兴起和潜力:一项调查》是由复旦大学自然语言处理团队(FudanNLP)推出的 LLM-based Agents 综述论文,全文长达 86 页,共有 600 余篇参考...
阅读原文

EMMS:高效的多模态多任务预训练模型选择器 | NeurIPS 2023

直播预告 | 今晚7点,「多模态大模型线上闭门会」正式开讲!阿里巴巴通义实验室 NLP 高级算法专家严明参与出品,携手刘兆洋、李彦玮、文束三位青年学者,共同...
阅读原文

吴恩达最新预测:关于AI,这些事未来十年不会变

金磊 发自 凹非寺量子位 | 公众号 QbitAI2024年,AI的发展会有怎样的改变? 在吴恩达最新的一封来信中,他认为有几件事情在接下来十年内都不会发生改变。 (...
阅读原文

基础模型+机器人:现在已经走到哪一步了

机器之心报道 编辑:Panda W机器人是一种拥有无尽可能性的技术,尤其是当搭配了智能技术时。近段时间创造了许多变革性应用的大模型有望成为机器人的智慧大脑...
阅读原文

告别冷启动,LoRA成为大模型「氮气加速器」,提速高达300%

选自Raphael G 的博客 机器之心编译 作者:Raphael G 编辑:大盘鸡用 LoRA打造更快的 AI 模型。AI 模型功能越来越强大,结构也越来越复杂,它们的速度也成为...
阅读原文

两只羊驼掐头去尾拼一起,屠榜HuggingFace

梦晨 发自 凹非寺量子位 | 公众号 QbitAIHuggingFace开源大模型排行榜,又被屠榜了。 前排被清一色的SOLAR 10.7B微调版本占据,把几周之前的各种Mixtral 8x7B...
阅读原文
1234