标签：答案

AI搜索之战再迎微软Bing入局，「千年老二」能否一举翻身？

新智元报道编辑：庸庸乔杨【新智元导读】搜索引擎市场老二微软Bing引进AI搜索功能，集传统搜索结果和AI搜索结果于一体，这次，能撼动老大哥谷歌搜索的江山...

阅读原文

AIGC动态

2年前 (2024)

OpenAI向Google宣战，重磅推出AI搜索引擎SearchGPT，却被网友发现已翻车？

来源：CSDN（ID：CSDNnews）整理：屠敏有 AI 在的科技圈，似乎没有冷场的时候。过去一周，前有 Meta 发布最强模型Llama 3.1炸场，扬言要成为 AI 界的 Linux...

阅读原文

AIGC动态

2年前 (2024)

AI搜索大战打响！OpenAI深夜发布SearchGPT，不过先“翻车”了

9月6-7日，2024全球AI芯片峰会将在北京召开。目前，AMD人工智能事业部高级总监王宏强，清华大学交叉信息研究院助理教授、北极雄芯创始人马恺声，珠海芯动力创...

阅读原文

AIGC动态

2年前 (2024)

IMO数学竞赛第5题是何方神圣？大模型全军覆没了…

夕小瑶科技说原创作者 | 海野昨天，第65届IMO（国际数学奥林匹克竞赛）决赛成绩公布，中国队因2分之差憾失冠军。从中国队的得分情况来看，其中第5题是中国...

阅读原文

AIGC动态

2年前 (2024)

大模型“自学”后能力反下降，Llama/Mistral都没逃过

PengFei Liu 投稿量子位 | 公众号 QbitAIAI经过多轮“自我提升”，能力不增反降？上海交通大学GAIR团队最新研究表明，在常识理解、数学推理和代码生成等复杂任...

阅读原文

AIGC动态

2年前 (2024)

OpenAI超级对齐团队再发「绝唱」！首提「证明者-验证者」博弈，训练GPT说人话

新智元报道编辑：乔杨好困【新智元导读】当我们不停在CoT等领域大下苦功、试图提升LLM推理准确性的同时，OpenAI的对齐团队从另一个角度发现了华点——除了准...

阅读原文

AIGC动态

2年前 (2024)

OpenAI超级对齐团队遗作：两个大模型博弈一番，输出更好懂了

机器之心报道机器之心编辑部如果 AI 模型给的答案一点也看不懂，你敢用吗？随着机器学习系统在更重要的领域得到应用，证明为什么我们可以信任它们的输出，并...

阅读原文

AIGC动态

2年前 (2024)

微软开源的GraphRAG爆火，Github Star量破万，生成式AI进入知识图谱时代？

机器之心报道编辑：Panda W知识图谱从不退环境！LLM 很强大，但也存在一些明显缺点，比如幻觉问题、可解释性差、抓不住问题重点、隐私和安全问题等。检索增...

阅读原文

AIGC动态

2年前 (2024)

给大家介绍我的新工具人，夸克AI搜索

NO.1AI时代的搜索变身搜索引擎，长期占据互联网“铁王座”。 AI迅猛崛起后，风向有变。有人猜测： “搜索引擎的黄金时代可能要结束了。”然而，这事没那么简单，...

阅读原文

AIGC动态

2年前 (2024)

首个视频思维链推理框架Video-of-Thought来了：像人一样从感知到认知全面推理视频

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术...

阅读原文

AIGC动态

2年前 (2024)

大模型权威测试被曝翻车！更偏袒GPT-4等闭源模型，连提示词都区别对待

白交发自凹非寺量子位 | 公众号 QbitAI大模型权威测试，翻车了？！ HuggingFace都在用的MMLU-PRO，被扒出评测方法更偏向闭源模型，被网友直接在GitHub Issu...

阅读原文

AIGC动态

2年前 (2024)

语义熵识破LLM幻觉！牛津大学新研究登Nature

新智元报道编辑：alan 【新智元导读】近日，来自牛津大学的研究人员推出了利用语义熵来检测LLM幻觉的新方法。作为克服混淆的策略，语义熵建立在不确定性估计...

阅读原文

AIGC动态

2年前 (2024)

复旦大学：一个小技巧探测大模型的知识边界，有效消除幻觉

夕小瑶科技说原创作者 | Zicy 孔子说“知之为知之，不知为不知，是知也”，目前的大模型非常缺乏这个能力。虽然大模型拥有丰富的知识，但它仍然缺乏对自己知识...

阅读原文

AIGC动态

2年前 (2024)

你的欲言又止它都懂！输入法竟然自带AI了，90% 的人还不知道！

点击上方蓝字关注我们“微信输入法迎来AI革新，Mac和Windows版本新增输入即查功能，手机端'边写边译'支持多语言，让沟通无国界。在这个AI横行霸道的时代，微信...

阅读原文

AIGC动态

2年前 (2024)

2024KDD挑战任务，GPT-4仅得40分，Meta发布最新RAG评价基准

夕小瑶科技说原创作者 | Axe_越众所周知，“要想富，先修路”，经常挖路的同学应该知道，要想修好一条路，首先就必须搞清楚关于道路质量的统一验收标准，否则...

阅读原文

AIGC动态

2年前 (2024)

123 4…6