标签:语言

特约文章丨大语言模型的知识冲突:成因、根源与展望

文/李兴明,胡庆拥摘 要: 大语言模型在实际应用场景中经常面临知识冲突的问题,主要包括上下文 - 记忆知识冲突、多源上下文知识冲突和记忆内知识冲突。本文...
阅读原文

大语言模型如何助力药物开发? 哈佛 George Church Lab 最新综述

文章链接: https://arxiv.org/abs/2409.04481 大语言模型因其展现出类人般的推理、工具使用和问题解决能力而备受瞩目,此外,它在化学、生物学等专业领域也展...
阅读原文

万字长文解析OpenAI o1 Self-Play RL技术路线

来源:AI大模型实验室 OpenAI 的 Self-Play RL 新模型 o1 最近交卷,直接引爆了关于对于 Self-Play 的讨论。在数理推理领域获得了傲人的成绩,同时提出了 tra...
阅读原文

在大语言模型中分离语言和思想

来源:清熙 作者: Kyle Mahowald* 德克萨斯大学奥斯汀分校 mahowald@utexas.edu Anna A. Ivanova* 佐治亚理工学院 a.ivanova@gatech.edu Idan A. Blank,加...
阅读原文

KG+LM超越传统架构!海德堡提出全新图语言模型GLM | ACL 2024

新智元报道编辑:alan 【新智元导读】近日,来自海德堡大学的研究人员推出了图语言模型 (GLM),将语言模型的语言能力和知识图谱的结构化知识,统一到了同一种...
阅读原文

全球开源大模型新王!阿里Qwen2.5来了,性能跨量级超Llama3.1

通义千问Qwen下载量突破4000万,“产仔”超5万个。 作者|三北 编辑|漠影 云计算“春晚”云栖大会开幕,通义千问大模型再次燃爆全场! 智东西9月19日杭州报道,今...
阅读原文

强化学习成为OpenAI o1灵魂,速来学习下Self-play增强大模型

在机器学习尤其是强化学习领域,自我博弈(Self-play)是一种非常重要的学习策略。即使 AI 或者智能体没有明确的对手或者没有外部环境提供额外信息,也能通过...
阅读原文

「LLM」这个名字不好,Karpathy认为不准确、马斯克怒批太愚蠢

机器之心报道 编辑:陈陈LLM 应该改名吗?你怎么看。在 AI 领域,几乎每个人都在谈论大型语言模型,其英文全称为 Large Language Models,简写为 LLM。 因为 ...
阅读原文

蚂蚁自研知识增强大模型服务框架KAG,可显著提升知识推理准确率

机器之心发布 机器之心编辑部近日,在 2024 Inclusion・外滩大会 “超越平面思维,图计算让 AI 洞悉复杂世界” 见解论坛上,蚂蚁集团知识图谱负责人梁磊分享了 ...
阅读原文

揭开OpenAI草莓模型神秘面纱——重塑大语言模型的逻辑能力

OpenAI即将发布“草莓”模型 来源:medium 来源:智源社区 编辑:李梦佳 据报道,OpenAI计划在未来两周内发布其新的AI模型Strawberry(草莓)。据 Seeking Alph...
阅读原文

字节跳动冯佳时:大语言模型在计算机视觉领域的应用、问题和我们的解法

演讲嘉宾|冯佳时 编辑 |蔡芳芳 策划 | AICon 全球人工智能开发与应用大会 近年来,大语言模型 (LLMs) 在文本理解与生成领域取得了显著进展。然而,LLMs 在...
阅读原文

名场面来了,李云龙、徐江、王多鱼同台飙戏,背后是小红书的AI

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

整合 200 多项相关研究,大模型「终生学习」最新综述来了

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

通向AGI之路|人工智能史上最重磅的19篇论文,系统展示AI如何从象牙塔走进生活!

来源:AI异类弗兰克 身边有人说,AI好像是前两年突然火起来的,一下子就成了我们今天熟悉的产品的模样。 2022年11月,ChatGPT横空出世,如惊雷。只是,雷从何...
阅读原文

通义千问开源视觉语言模型 Qwen2-VL,可理解 20 分钟以上视频

整理 | 褚杏娟 2023 年 8 月,通义千问开源第一代视觉语言理解模型 Qwen-VL,成为开源社区最受欢迎的多模态模型之一。短短一年内,模型下载量突破 1000 万次...
阅读原文
12345629