标签:答案

AI赚钱副业~AI生成影视解说,半个月涨粉变现3.5W+!

这两年大家都在感叹生活不易,然而我想说的是,机会还是有的,但问题不在于有没有,而在于你是否能够认准机会,然后抓住它。 接触过很多咨询项目的人,发现...

OpenAI“”在线教育巨头

AI正给传统行业带来深刻的影响。 编译|陈骏达 编辑|Panken 一家在线教育巨头,被OpenAI给打趴下了。 智东西11月14日消息,据《华尔街日报》报道,红极一时的...
阅读原文

o1/Claude集体翻车!陶哲轩等60+顶尖数学家合力提出新数学基准,大模型正确率通通不足2%

一水 发自 凹非寺量子位 | 公众号 QbitAI让大模型集体吃瘪,数学题正确率通通不到2%! 获大神卡帕西力荐,大模型新数学基准来势汹汹—— 一出手,曾在国际数学...
阅读原文

谷歌苹果曝出LLM惊人,自主识别错误却装糊涂!AI幻觉背后藏着更大秘密

新智元报道编辑:桃子 【新智元导读】大模型幻觉,究竟是怎么来的?谷歌、苹果等机构研究人员发现,大模型知道的远比表现的要多。它们能够在内部编码正确答案...
阅读原文

o1满血版泄露!具有奥特曼所说的图像推理能力

夕小瑶科技说 分享来源 | 量子位o1满血版泄露了!没想到,OpenAI还搁那儿“今年一定”呢,不少网友已经率先上手体验到了(doge)。 事情是酱婶的:有网友发现,...
阅读原文

o1满血版泄露!奥数题图片推理手拿把掐,奥特曼上线剧透o2

鱼羊 发自 凹非寺量子位 | 公众号 QbitAIo1满血版泄露了! 没想到,OpenAI还搁那儿“今年一定”呢,不少网友已经率先上手体验到了(doge)。 事情是酱婶的:有...
阅读原文

Google危矣?ChatGPT真变AI搜索引擎了!

来源:CSDN(ID:CSDNnews) 整理:屠敏 一早打开 ChatGPT,发现其于昨日深夜上线了一项新功能——搜索,这让不少 ChatGPT 深度用户感到惊喜。 将 AI 聊天机器...
阅读原文

大模型在装傻!谷歌苹果最新发现:LLM知道但不告诉你,掌握知识比表现出来的多

新智元报道编辑:alan 【新智元导读】近日,来自谷歌和苹果的研究表明:AI模型掌握的知识比表现出来的要多得多!这些真实性信息集中在特定的token中,利用这...
阅读原文

最强 OpenAI o1 逻辑推理正确率仅 50%!清华、智谱推出「大模型逻辑推理新基准」

9.11 和 9.9 哪个大? 这一连人类幼儿园儿童都能回答的问题,曾经(至今)难倒了众多大语言模型(LLM)。然而,要想达到通用人工智能(AGI)的水平,LLM 不仅...
阅读原文

OpenAI o1 技术初探2:使用MCTS增强推理能力(基于代码实践的解读)

在o1的整体框架篇中(https://zhuanlan.zhihu.com/p/773907223),我们从现有开源的论文和代码中(https://github.com/hijkzzz/Awesome-LLM-Strawberry),抽...
阅读原文

开发者火冒三丈炮轰GenAI:垃圾语料太多,模型正在变得越来越笨

新智元报道编辑:Lumina 【新智元导读】人工智能是否早已达到顶峰,正在变得越来越愚蠢?生成式AI(GenAI),尤其是以OpenAI的ChatGPT为代表,人们发现,这些...
阅读原文

OpenAI o1式思维链,开源模型也可以有,成功案例来了

机器之心报道 编辑:Panda北京时间 9 月 13 日午夜,OpenAI 发布了推理性能强大的 ο1 系列模型。之后,各路研究者一直在尝试挖掘 ο1 卓越性能背后的技术并尝...
阅读原文

实测 OpenAI 最强模型 o1 :做题王者,实战青铜

做题王者 实战青铜本周OpenAI 突然发布了 o1 系列模型,最大的特点是擅长推理。 模型的能力,一代比一代强,我们的测评,一次比一次难做。测评变成一件「毕恭...
阅读原文

LLM推理性能受输出格式影响,JSON最严重

一水 发自 凹非寺量子位 | 公众号 QbitAI输出格式不同,竟然还能影响大模型发挥?! 两种提示下让大语言模型(LLMs)解同一道数学题,问题如下: Eliza每周工...
阅读原文

1500 万月活的 AI 搜索:理解用户、做好产品,比模型更重要

创立于 2022 年 8 月的 Perplexity 引领了当下的 AI 搜索热潮。。 4 月份,在最新一轮融资 6200 万美元之后,Perplexity 的估值超过 10 亿美元,成为新的 AI ...
阅读原文

苹果AI后台提示词曝光,工程师:别幻觉!别捏造事实!

金磊 发自 凹非寺量子位 | 公众号 QbitAI苹果AI(Apple Intelligence)还没有正式到来,后台的提示词却意外曝光了。 事情是这样的。 上周苹果不是刚发布了包...
阅读原文
1236