语言 - 第 4 页

特约文章丨大语言模型的知识冲突：成因、根源与展望

文/李兴明，胡庆拥摘要：大语言模型在实际应用场景中经常面临知识冲突的问题，主要包括上下文 - 记忆知识冲突、多源上下文知识冲突和记忆内知识冲突。本文...

阅读原文

AIGC动态

2年前 (2024)

大语言模型如何助力药物开发? 哈佛 George Church Lab 最新综述

文章链接: https://arxiv.org/abs/2409.04481 大语言模型因其展现出类人般的推理、工具使用和问题解决能力而备受瞩目，此外，它在化学、生物学等专业领域也展...

阅读原文

AIGC动态

2年前 (2024)

万字长文解析OpenAI o1 Self-Play RL技术路线

来源：AI大模型实验室 OpenAI 的 Self-Play RL 新模型 o1 最近交卷，直接引爆了关于对于 Self-Play 的讨论。在数理推理领域获得了傲人的成绩，同时提出了 tra...

阅读原文

AIGC动态

2年前 (2024)

在大语言模型中分离语言和思想

来源：清熙作者： Kyle Mahowald* 德克萨斯大学奥斯汀分校 mahowald@utexas.edu Anna A. Ivanova* 佐治亚理工学院 a.ivanova@gatech.edu Idan A. Blank，加...

阅读原文

AIGC动态

2年前 (2024)

KG+LM超越传统架构！海德堡提出全新图语言模型GLM | ACL 2024

新智元报道编辑：alan 【新智元导读】近日，来自海德堡大学的研究人员推出了图语言模型 (GLM)，将语言模型的语言能力和知识图谱的结构化知识，统一到了同一种...

阅读原文

AIGC动态

2年前 (2024)

全球开源大模型新王！阿里Qwen2.5来了，性能跨量级超Llama3.1

通义千问Qwen下载量突破4000万，“产仔”超5万个。作者|三北编辑|漠影云计算“春晚”云栖大会开幕，通义千问大模型再次燃爆全场！智东西9月19日杭州报道，今...

阅读原文

AIGC动态

2年前 (2024)

强化学习成为OpenAI o1灵魂，速来学习下Self-play增强大模型

在机器学习尤其是强化学习领域，自我博弈（Self-play）是一种非常重要的学习策略。即使 AI 或者智能体没有明确的对手或者没有外部环境提供额外信息，也能通过...

阅读原文

AIGC动态

2年前 (2024)

「LLM」这个名字不好，Karpathy认为不准确、马斯克怒批太愚蠢

机器之心报道编辑：陈陈LLM 应该改名吗？你怎么看。在 AI 领域，几乎每个人都在谈论大型语言模型，其英文全称为 Large Language Models，简写为 LLM。因为 ...

阅读原文

AIGC动态

2年前 (2024)

蚂蚁自研知识增强大模型服务框架KAG，可显著提升知识推理准确率

机器之心发布机器之心编辑部近日，在 2024 Inclusion・外滩大会 “超越平面思维，图计算让 AI 洞悉复杂世界” 见解论坛上，蚂蚁集团知识图谱负责人梁磊分享了 ...

阅读原文

AIGC动态

2年前 (2024)

揭开OpenAI草莓模型神秘面纱——重塑大语言模型的逻辑能力

OpenAI即将发布“草莓”模型来源：medium 来源：智源社区编辑：李梦佳据报道，OpenAI计划在未来两周内发布其新的AI模型Strawberry（草莓）。据 Seeking Alph...

阅读原文

AIGC动态

2年前 (2024)

字节跳动冯佳时：大语言模型在计算机视觉领域的应用、问题和我们的解法

演讲嘉宾｜冯佳时编辑｜蔡芳芳策划｜ AICon 全球人工智能开发与应用大会近年来，大语言模型 (LLMs) 在文本理解与生成领域取得了显著进展。然而，LLMs 在...

阅读原文

AIGC动态

2年前 (2024)

名场面来了，李云龙、徐江、王多鱼同台飙戏，背后是小红书的AI

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术...

阅读原文

AIGC动态

2年前 (2024)

整合 200 多项相关研究，大模型「终生学习」最新综述来了

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术...

阅读原文

AIGC动态

2年前 (2024)

通向AGI之路｜人工智能史上最重磅的19篇论文，系统展示AI如何从象牙塔走进生活！

来源：AI异类弗兰克身边有人说，AI好像是前两年突然火起来的，一下子就成了我们今天熟悉的产品的模样。 2022年11月，ChatGPT横空出世，如惊雷。只是，雷从何...

阅读原文

AIGC动态

2年前 (2024)

通义千问开源视觉语言模型 Qwen2-VL，可理解 20 分钟以上视频

整理 | 褚杏娟 2023 年 8 月，通义千问开源第一代视觉语言理解模型 Qwen-VL，成为开源社区最受欢迎的多模态模型之一。短短一年内，模型下载量突破 1000 万次...

阅读原文

AIGC动态

2年前 (2024)

标签：语言