标签:自然语言

英伟达开源合成数据大模型:奖励模型,超过GPT-4 Turbo

直播预告 | 6月18日上午10点,「智猩猩AI新青年讲座」第240讲正式开讲,邀请到德州大学奥斯汀分校刘星超博士将直播讲解《利用直线概率流加速Stable Diffusion...
阅读原文

今日arXiv最热大模型论文:大模型都能怎么用?中南大学最新综述:大模型时代的自然语言处理

夕小瑶科技说 原创作者 | Axe_越还记得2022年末ChatGPT的横空出世,带来了整个NLP乃至AI领域的震动,随后如LLaMA、ChatGLM、Qwen等类ChatGPT大模型(LLM)开...
阅读原文

走近吴立德教授:CV、NLP中国最高奖项得主,讲述复旦大学人工智能几十年往事

InfoQ特约作者 |秦海龙写在最前吴立德教授,中国最早从事计算机视觉和自然语言处理研究的科学家之一。1937 年生,复旦大学教授,博士生导师。美国纽约科学院...
阅读原文

ICML 2024 | 脱离LoRA架构,训练参数大幅减少,新型傅立叶微调来了

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

GPT模型的前世今生

大数据文摘授权转载自数据派THU 作者:李媛媛 1 GPT模型概述 GPT模型,全称Generative Pre-trained Transformer,由OpenAI团队开发,是一种基于深度学习的自...
阅读原文

给大家推荐一个“遥遥领先”的 python 三方库

Python 以数量众多、内容丰富的第三方软件包出名,今天就介绍一个软件包,名字叫做 NTTS。 这个三方包的主要作用是:评价: 其实这种库,你看着好像只是穿了...
阅读原文

金山办公姚冬:AI让办公不再孤立,LUI是下一代交互 | 中国AIGC产业峰会

编辑部 整理自 AIGC峰会量子位 | 公众号 QbitAIAIGC果然要将所有软件重塑一遍? 中国AIGC产业峰会上,金山办公副总裁、研发中台事业部总经理姚冬分享了金山办...
阅读原文

Transformer杀手来了:一篇新的论文轰动网络,它为什么这么厉害?

点击上方蓝字关注我们在人工智能的世界里,每一次技术的飞跃都让我们离真正的智能更近一步。最近,LSTM(长短期记忆网络)的发明者们发布了一篇新论文,介绍...
阅读原文

美国高校:在超半数AI热门领域,中国研究已领先于美国

这些发现揭示了中美在引领AI进步方面的重要差别。 编译|ZeR0 编辑|漠影 智东西5月4日消息,根据美国乔治城大学安全与新兴技术中心(CSET)向Axios分享的新数...
阅读原文

ChatGPT们的幕后先驱,斯坦福教授Manning的四十年NLP生涯

机器之心报道 编辑:亚鹂Christopher Manning 虽已成 NLP 领域先驱,却仍为 AI 大模型的未来殚精竭虑。今年 1 月份,2024 年度 IEEE 冯诺伊曼奖项结果正式公...
阅读原文

ICLR 2024 Spotlight | 无惧中间步骤,MUSTARD可生成高质量数学推理数据

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

一次预测多个token,Meta新模型推理加速3倍,编程任务提高17%

梦晨 西风 发自 凹非寺量子位 | 公众号 QbitAI“预测下一个token”被认为是大模型的基本范式,一次预测多个tokens又会怎样? Meta AI法国团队推出“基于多token...
阅读原文

GitHub版Devin上线,会打字就能开发应用,微软CEO:重新定义IDE

克雷西 发自 凹非寺量子位 | 公众号 QbitAI微软的“GitHub版Devin”——Copilot WorkSpace,终于上线了! WorkSpace是一种“Copilot原生”的全新开发环境,目的是让...
阅读原文

走近李生教授:培养出周明、王海峰等数位AI科学家,NLP国际最高奖项得主的科研之路

作者 |秦海龙写在最前李生,中国最早从事机器翻译研究的自然语言处理科学家之一。哈尔滨工业大学教授,博士生导师,中文信息学会会士,中国中文信息学会名誉...
阅读原文

「大模型+强化学习」最新综述!港中文深圳130余篇论文:详解四条主流技术路线

新智元报道编辑:LRS 【新智元导读】用大模型来辅助强化学习,可以提高模型在多任务学习、样本利用率、任务规划等复杂任务下的能力,该论文综述了LLM-enhance...
阅读原文