标签:任务

爱丁堡大学出新招,大小语言模型配合节约成本!

夕小瑶科技说 原创作者 | 墨墨在大语言模型的应用中,往往面临着成本和性能权衡的问题。 一方面,大型LLM的参数量极大(如70B),每次调用都可能带来更多的成...
阅读原文

GPT-4理解武林外传中的含蓄表述,达人类水平

‍ ‍ 大数据文摘受权转载自夕小瑶科技说作者 | 谢年年 在人际交谈中,特别是在使用中文这样博大精深的语言时,人们往往不会直接回答问题,而是采用含蓄、隐晦...
阅读原文

今日arXiv最热NLP大模型论文:GPT-4理解武林外传中的含蓄表述,达人类水平

夕小瑶科技说 原创作者 | 谢年年在人际交谈中,特别是在使用中文这样博大精深的语言时,人们往往不会直接回答问题,而是采用含蓄、隐晦或间接的表达方式。 人...
阅读原文

「代理人战争」!微软、OpenAI 、谷歌、Meta用AI Agent疯钱

新智元报道编辑:alan 【新智元导读】为了搞钱,微软、OpenAI 、谷歌和Meta纷纷瞄准Agent这片蓝海,各顶尖高校也紧随其后。Agent才是商业学术两开花的未来!...
阅读原文

告别偏科,能玩转多模态、多任务、多领域的强化智能体终于来了

机器之心报道 编辑:佳琦模型、专家智能体和数据集都已开源。随着 Llama 3 发布,未来大模型的参数量已飙升至惊人的 4000 亿。尽管每周几乎都有一个声称性能...
阅读原文

AI学会隐藏思维暗中推理!不依赖人类经验解决复杂任务,更黑箱了

梦晨 发自 凹非寺量子位 | 公众号 QbitAIAI做数学题,真正的思考居然是暗中“心算”的? 纽约大学团队新研究发现,即使不让AI写步骤,全用无意义的“……”代替,在...
阅读原文

CVPR‘24:与任务无关的多模态数据也能提升Transformer性能|港中文&腾讯

Yiyuan 投稿量子位 | 公众号 QbitAI万万没想到,与任务无直接关联的多模态数据也能提升Transformer模型性能。 比如训练一个图像分类模型,除了标注好类别的图...
阅读原文

一次预测多个token,Meta新模型推理加速3倍,编程任务提高17%

梦晨 西风 发自 凹非寺量子位 | 公众号 QbitAI“预测下一个token”被认为是大模型的基本范式,一次预测多个tokens又会怎样? Meta AI法国团队推出“基于多token...
阅读原文

大语言模型自进化技术综述:概念框架,进化方向,经验获取,经验更新,评估方法,开放问题

我们翻译整理最新论文:大语言模型自我进化技术综述,文末有论文连接。 大型语言模型(LLMs)在各个领域和智能体应用中取得了显著进展。然而,当前从人类或外...
阅读原文

神秘模型"gpt2-chatbot"现身,引发GPT-4.5/GPT-5疯狂猜想

大数据文摘受权转载自头部科技 文丨Congerry OpenAI放出了一个迷雾弹。 当Google、Meta、Anthropic等公司都在猛推大模型的时候,OpenAI除了对GPT-4修修补补,...
阅读原文

神秘GPT模型引爆社区,GPT-4.5、GPT-5谣言满天飞,奥特曼在线围观

机器之心报道 编辑:杜伟、陈萍这场等待「GPT-5」的游戏啥时候才能结束?GPT-5 啥时候来?估计是 AI 领域最关心的问题之一了。是像 Sora 一样毫无预兆的发布...
阅读原文

智子引擎发布多模态大模型 Awaker:MOE、自主更新、写真视频效果优于 Sora

在 4 月 27 日召开的中关村论坛通用人工智能平行论坛上,人大系初创公司智子引擎隆重发布全新的多模态大模型 Awaker 1.0。 相对于智子引擎前代的 ChatImg 序...
阅读原文

MIT研究登顶会ICLR 2024:让机器人掌握"常识",自主完成复杂家务

大数据文摘受权转载自机器人大讲堂 在人工智能飞速发展的今天,家用服务机器人正日益走进寻常百姓家。然而,要让机器人像人一样灵活应对家庭环境的复杂多变,...
阅读原文

全球首个自主进化多模态MoE震撼登场!写真视频击败Sora,人大系团队自研底座VDT

新智元报道编辑:编辑部 【新智元导读】人大系初创公司智子引擎发布的全新多模态大模型Awaker 1.0,直接迈向了AGI!它是业界首个真正实现自主更新的大模型,...
阅读原文

今日arXiv最热NLP大模型论文:超越GPT-4,清华发布网页导航智能体AutoWebGLM

夕小瑶科技说 原创作者 | Tscom随着大语言模型(LLMs)的发展,Agent在网络导航等任务中展现出了前所未有的能力。想象一下,一个基于LLM的Agent能够在你享用...
阅读原文
1202122232448