标签:问题

ChatGPT “变懒”证据确凿,疑似GPT-4.5 将于本月内发布!

夕小瑶科技说 原创作者 | 小戏、兔子酱速报!OpenAI 官方承认 ChatGPT 变懒;GPT-4.5 或将于本月内发布!这两天关于 ChatGPT 性能的讨论热度一直颇高。前脚 C...
阅读原文

大模型就是「造梦机」,Karpathy一语惊人!人类才是「幻觉问题」根本原因

新智元报道编辑:桃子 润【新智元导读】大模型就是「造梦机」!幻觉是LLM与生俱来的特性,而非缺陷。OpenAI科学家Andrej Karpathy独特视角在AI社区掀起了激烈...
阅读原文

如何看待 OpenAI Q* 谣言

作者 | Timothy B Lee 译者 | 核子可乐 策划 | Tina OpenAI 仍未明确解释 Q* 究竟是什么,但透露的线索倒是相当不少。 11 月 22 日,就在 OpenAI 决定解雇...
阅读原文

一文详解大模型归因机制,幻觉问题有救了!

夕小瑶科技说 原创作者 | 谢年年、python大模型的幻觉问题一直是一个亟待解决的挑战。由于大模型的训练语料来源广泛,且都是未经筛选的现实世界文本,预训练...
阅读原文

谷歌发布 Gemini:我们还是一家强大的公司

谷歌 Gemini 与 OpenAI GPT-4 哪家强?作者丨郭思 王悦编辑丨陈彩娴过去半年, 在OpenAI 持续迭代,不断赚足大众视线之际,谷歌迟迟没有发声。直至今日凌晨,...
阅读原文

优等生归来,谷歌最强大模型Gemini能否打败GPT4?|甲子光年

谷歌在技术前瞻性上领先,OpenAI更专注于产品的打磨。作者|苏霍伊编辑|王博‍‍'沉寂'已久的谷歌终于放大招了。美国当地时间12月6日,谷歌发布多模态大模型Ge...
阅读原文

谷歌大杀器终于来了,最大规模Gemini震撼发布:真超GPT4,三大版本,手机直接可用

机器之心报道机器之心编辑部时代变了?迄今为止规模最大,能力最强的谷歌大模型来了。当地时间 12 月 6 日,谷歌 CEO 桑达尔・皮查伊官宣 Gemini 1.0 版正式...
阅读原文

互联网大厂“组团”宕机,都怪降本增“笑”?

编辑|冬梅、邓邓、Tina当服务器宕机的那一刻,时间仿佛也停滞了。前不久,国际数据公司 IDC 发布了《中国公有云服务市场(2023 上半年)跟踪》报告。该报告...
阅读原文

解析 AI Agent 的发展现状和技术难点 |InfoQ《极客有约》

采访嘉宾|王元,美国五百强公司 高级数据科学家后 AIGC 时代,AI Agent 无疑是一个新沸点。AI Agent(人工智能体)是一种能够感知环境、进行决策和执行动作...
阅读原文

大模型版“5年高考3年模拟”来了!6141道数学题,还是多模态的那种|微软&UCLA&UW联合出品

Pan Lu投稿量子位 | 公众号 QbitAI大模型的“5年高考3年模拟”数学题来了,还是加强强强版!微软、加州大学洛杉矶分校(UCLA)、华盛顿大学(UW)联合打造全新...
阅读原文

112页报告深挖GPT-4V!UCLA等发布全新「多模态数学推理」基准MathVista

新智元报道编辑:LRS 好困【新智元导读】大型多模态模型会做数学题吗?在UCLA等机构最新发布的MathVista基准上,即使是当前最强的GPT-4V也会感到「挫败感」。...
阅读原文

【重磅】解码OpenAI Q*:迈向AGI的信仰之跃

作者|费斌杰随着OpenAI CEO的罢免闹剧逐渐平息,隐藏在整个事件背后的“Q*”模型浮出水面。据路透社消息,在Sam Altman罢免前夕,几位OpenAI的科学家向董事会写...
阅读原文

AIGC 算法揭秘及产业落地应用分享

嘉宾 | 鱼哲、祝天刚 编辑 | Tina 智能客服一直被视为大模型最适合的应用场景之一,而京东在大模型出现后,不仅推出了京东言犀大模型,还利用这些模型升级了...
阅读原文

大模型角色扮演也有偏好?男性角色效果优于女性角色?

夕小瑶科技说 原创作者 | 谢年年、python我们在设计prompt时,为了激发大模型的能力,总是让它扮演不同的角色:你是一个出色的助手、翻译家、厨师、计算机科...
阅读原文

最强的GPT-4V都考不过?基于大学考试的测试基准MMMU诞生了

机器之心报道编辑:Panda目前最好的大型多模态模型 GPT-4V 与大学生谁更强?我们还不知道,但近日一个新的基准数据集 MMMU 以及基于其的基准测试或许能给我们...
阅读原文
1252627282935