标签:答案

AI搜索之战再迎微软Bing入局,「千年老二」能否一举翻身?

新智元报道编辑:庸庸 乔杨 【新智元导读】搜索引擎市场老二微软Bing引进AI搜索功能,集传统搜索结果和AI搜索结果于一体,这次,能撼动老大哥谷歌搜索的江山...
阅读原文

OpenAI向Google宣战,重磅推出AI搜索引擎SearchGPT,却被网友发现已翻车?

来源:CSDN(ID:CSDNnews) 整理:屠敏 有 AI 在的科技圈,似乎没有冷场的时候。过去一周,前有 Meta 发布最强模型Llama 3.1炸场,扬言要成为 AI 界的 Linux...
阅读原文

AI搜索大战打响!OpenAI深夜发布SearchGPT,不过先“翻车”了

9月6-7日,2024全球AI芯片峰会将在北京召开。目前,AMD人工智能事业部高级总监王宏强,清华大学交叉信息研究院助理教授、北极雄芯创始人马恺声,珠海芯动力创...
阅读原文

IMO数学竞赛第5题是何方神圣?大模型全军覆没了…

夕小瑶科技说 原创作者 | 海野昨天,第65届IMO(国际数学奥林匹克竞赛)决赛成绩公布,中国队因2分之差憾失冠军。 从中国队的得分情况来看,其中第5题是中国...
阅读原文

大模型“自学”后能力反下降,Llama/Mistral都没逃过

PengFei Liu 投稿量子位 | 公众号 QbitAIAI经过多轮“自我提升”,能力不增反降? 上海交通大学GAIR团队最新研究表明,在常识理解、数学推理和代码生成等复杂任...
阅读原文

OpenAI超级对齐团队再发「绝唱」!首提「证明者-验证者」博弈,训练GPT说人话

新智元报道编辑:乔杨 好困 【新智元导读】当我们不停在CoT等领域大下苦功、试图提升LLM推理准确性的同时,OpenAI的对齐团队从另一个角度发现了华点——除了准...
阅读原文

OpenAI超级对齐团队遗作:两个大模型博弈一番,输出更好懂了

机器之心报道 机器之心编辑部如果 AI 模型给的答案一点也看不懂,你敢用吗?随着机器学习系统在更重要的领域得到应用,证明为什么我们可以信任它们的输出,并...
阅读原文

微软开源的GraphRAG爆火,Github Star量破万,生成式AI进入知识图谱时代?

机器之心报道 编辑:Panda W知识图谱从不退环境!LLM 很强大,但也存在一些明显缺点,比如幻觉问题、可解释性差、抓不住问题重点、隐私和安全问题等。检索增...
阅读原文

给大家介绍我的新工具人,夸克AI搜索

NO.1AI时代的搜索变身搜索引擎,长期占据互联网“铁王座”。 AI迅猛崛起后,风向有变。 有人猜测: “搜索引擎的黄金时代可能要结束了。”然而,这事没那么简单,...
阅读原文

首个视频思维链推理框架Video-of-Thought来了:像人一样从感知到认知全面推理视频

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

大模型权威测试被曝翻车!更偏袒GPT-4等闭源模型,连提示词都区别对待

白交 发自 凹非寺量子位 | 公众号 QbitAI大模型权威测试,翻车了?! HuggingFace都在用的MMLU-PRO,被扒出评测方法更偏向闭源模型,被网友直接在GitHub Issu...
阅读原文

语义熵识破LLM幻觉!牛津大学新研究登Nature

新智元报道编辑:alan 【新智元导读】近日,来自牛津大学的研究人员推出了利用语义熵来检测LLM幻觉的新方法。作为克服混淆的策略,语义熵建立在不确定性估计...
阅读原文

复旦大学:一个小技巧探测大模型的知识边界,有效消除幻觉

夕小瑶科技说 原创作者 | Zicy 孔子说“知之为知之,不知为不知,是知也”,目前的大模型非常缺乏这个能力。虽然大模型拥有丰富的知识,但它仍然缺乏对自己知识...
阅读原文

你的欲言又止它都懂!输入法竟然自带AI了,90% 的人还不知道!

点击上方蓝字关注我们“微信输入法迎来AI革新,Mac和Windows版本新增输入即查功能,手机端'边写边译'支持多语言,让沟通无国界。在这个AI横行霸道的时代,微信...
阅读原文

2024KDD挑战任务,GPT-4仅得40分,Meta发布最新RAG评价基准

夕小瑶科技说 原创作者 | Axe_越众所周知,“要想富,先修路”,经常挖路的同学应该知道,要想修好一条路,首先就必须搞清楚关于道路质量的统一验收标准,否则...
阅读原文
12346