标签:模型

奥特曼晒“草莓”引热议,神秘新模型现身竞技场,网友第一波实测来了

白交 发自 凹非寺量子位 | 公众号 QbitAIOpenAI神秘新模型,真的藏不住了! 先是有匿名聊天机器人现身lmsys竞技场,声称自己是GPT-4系列模型一部分,吊足了大...
阅读原文

曝Bengio新动向:世界模型+数学证明,确保AI系统正常运作

西风 发自 凹非寺量子位 | 公众号 QbitAI深度学习三巨头之一Yoshua Bengio的下一步动向公开了,关于AI安全—— 加入了一个名为Safeguarded AI(受保护的人工智...
阅读原文

奥特曼秀5颗草莓疯狂暗示GPT-5?匿名新模型神秘现身,数学超强!

新智元报道编辑:桃子 好困 【新智元导读】奥特曼又来搞事情了!一张5颗草莓照片,让全网掀起热议狂澜。这不是明摆着暗示,神秘Strawberry项目真实存在。难道...
阅读原文

无比喻,不论文!用「画家流水线」的方式理解Transformer中间层

新智元报道编辑:乔杨 庸庸 【新智元导读】Transformer架构层层堆叠,包含十几亿甚至几十亿个参数,这些层到底是如何工作的?当一个新奇的比喻——「画家流水线...
阅读原文

多模态LLM视觉推理能力堪忧,浙大领衔用GPT-4合成数据构建多模态基准

新智元报道编辑:乔杨 【新智元导读】LLM的数学推理能力缺陷得到了很多研究的关注,但最近浙大、中科院等机构的学者们提出,先进模型在视觉推理方面同样不足...
阅读原文

在线教程丨超大模型部署无压力!一键运行 Llama 3.1 405B 和 Mistral Large 2

作者:李宝珠 编辑:xixi、李宝珠 HyperAI超神经为大家上线了 Llama 3.1 405B 和 Mistral Large 2407 的一键部署教程,无需输入任何命令,只需点击「克隆」即...
阅读原文

1500 万月活的 AI 搜索:理解用户、做好产品,比模型更重要

创立于 2022 年 8 月的 Perplexity 引领了当下的 AI 搜索热潮。。 4 月份,在最新一轮融资 6200 万美元之后,Perplexity 的估值超过 10 亿美元,成为新的 AI ...
阅读原文

Figure 02来了!更时尚、更智能,采用新材料,但好像没那么强?详细技术解读看这里

大数据文摘受权转载自机器人大讲堂 人形机器人初创公司Figure迎来更强的新生代产品——Figure 02。该公司创始人CEO布雷特•阿德科克(Brett Adcock)8月3日自信...
阅读原文

拆解SearchGPT后,我们发现了AI搜索的壁垒、突破和未来|甲子光年

为什么说AI搜索不只是搜索?作者|王艺‍‍‍ 编辑|王博 经历了几轮爆料后,AI搜索赛道终于迎来了一位“重要玩家”——SearchGPT,一个由OpenAI推出的AI驱动的搜索...
阅读原文

程序员窃喜!卡了大模型脖子的Json输出,OpenAI终于做到了100%正确

夕小瑶科技说 原创作者 | 海野OpenAI上次提到JSON模式的概念,还是在去年的DevDay上。那是ChatGPT第一次拥抱JSON模式。 但这个功能可以说是饱受诟病。 经常遇...
阅读原文

上海AI Lab 搭台,36个大模型一起角逐长上下文建模能力

夕小瑶科技说 原创作者 | Richard现在的大模型论文简直像是在比长度,动不动就上百页!记得前阵子小编瞅见那份90页的Gemini技术报告,顿时脑袋嗡嗡作响。那会...
阅读原文

7.5K 星开源项目“白做了”?OpenAI 发布开发者最期待的头号功能,让多个优秀开源项目瞬间凉了!

编译 | 核子可乐、Tina 应广大用户需求,OpenAI 终于发布重量级新功能。 JavaScript 对象表示法(JSON)的文件与数据交换格式已然成为行业标准,因为其既适...
阅读原文

实时视频理解首次上端!面壁小钢炮2.6 携单图、多图、视频理解3 SOTA,全面对标 GPT-4V 最强多模态

整理 | 褚杏娟 8 月 6 日,面壁智能宣布「小钢炮」 MiniCPM-V 2.6 模型重磅上新!据悉,该模型仅 8B 参数,但将实时视频理解、多图联合理解(还包括多图 OCR...
阅读原文

精准0误差,输入价格打骨折!OpenAI官宣API支持结构化输出,JSON准确率100%

新智元报道编辑:编辑部 【新智元导读】程序员福音!OpenAI新推出的模型API全部支持结构化输出,JSON Schema匹配率高达100%,成本还立减一半。还在绞尽脑汁...
阅读原文

三「模」联盟,谷歌DeepMind缔造终身学习智能体!

新智元报道编辑:桃子 【新智元导读】打造终身学习智能体,是研究界以来一直追求的目标。最近,帝国理工联手谷歌DeepMind打造了创新联合框架扩散增强智能体(...
阅读原文