标签：任务

爱丁堡大学出新招，大小语言模型配合节约成本！

夕小瑶科技说原创作者 | 墨墨在大语言模型的应用中，往往面临着成本和性能权衡的问题。一方面，大型LLM的参数量极大（如70B），每次调用都可能带来更多的成...

阅读原文

AIGC动态

2年前 (2024)

GPT-4理解武林外传中的含蓄表述，达人类水平

‍ ‍ 大数据文摘受权转载自夕小瑶科技说作者 | 谢年年在人际交谈中，特别是在使用中文这样博大精深的语言时，人们往往不会直接回答问题，而是采用含蓄、隐晦...

阅读原文

AIGC动态

2年前 (2024)

今日arXiv最热NLP大模型论文：GPT-4理解武林外传中的含蓄表述，达人类水平

夕小瑶科技说原创作者 | 谢年年在人际交谈中，特别是在使用中文这样博大精深的语言时，人们往往不会直接回答问题，而是采用含蓄、隐晦或间接的表达方式。人...

阅读原文

AIGC动态

2年前 (2024)

「代理人战争」！微软、OpenAI 、谷歌、Meta用AI Agent疯钱

新智元报道编辑：alan 【新智元导读】为了搞钱，微软、OpenAI 、谷歌和Meta纷纷瞄准Agent这片蓝海，各顶尖高校也紧随其后。Agent才是商业学术两开花的未来！...

阅读原文

AIGC动态

2年前 (2024)

告别偏科，能玩转多模态、多任务、多领域的强化智能体终于来了

机器之心报道编辑：佳琦模型、专家智能体和数据集都已开源。随着 Llama 3 发布，未来大模型的参数量已飙升至惊人的 4000 亿。尽管每周几乎都有一个声称性能...

阅读原文

AIGC动态

2年前 (2024)

AI学会隐藏思维暗中推理！不依赖人类经验解决复杂任务，更黑箱了

梦晨发自凹非寺量子位 | 公众号 QbitAIAI做数学题，真正的思考居然是暗中“心算”的？纽约大学团队新研究发现，即使不让AI写步骤，全用无意义的“……”代替，在...

阅读原文

AIGC动态

2年前 (2024)

CVPR‘24：与任务无关的多模态数据也能提升Transformer性能｜港中文&腾讯

Yiyuan 投稿量子位 | 公众号 QbitAI万万没想到，与任务无直接关联的多模态数据也能提升Transformer模型性能。比如训练一个图像分类模型，除了标注好类别的图...

阅读原文

AIGC动态

2年前 (2024)

一次预测多个token，Meta新模型推理加速3倍，编程任务提高17%

梦晨西风发自凹非寺量子位 | 公众号 QbitAI“预测下一个token”被认为是大模型的基本范式，一次预测多个tokens又会怎样？ Meta AI法国团队推出“基于多token...

阅读原文

AIGC动态

2年前 (2024)

大语言模型自进化技术综述：概念框架，进化方向，经验获取，经验更新，评估方法，开放问题

我们翻译整理最新论文：大语言模型自我进化技术综述，文末有论文连接。大型语言模型（LLMs）在各个领域和智能体应用中取得了显著进展。然而，当前从人类或外...

阅读原文

AIGC动态

2年前 (2024)

神秘模型"gpt2-chatbot"现身，引发GPT-4.5/GPT-5疯狂猜想

大数据文摘受权转载自头部科技文丨Congerry OpenAI放出了一个迷雾弹。当Google、Meta、Anthropic等公司都在猛推大模型的时候，OpenAI除了对GPT-4修修补补，...

阅读原文

AIGC动态

2年前 (2024)

神秘GPT模型引爆社区，GPT-4.5、GPT-5谣言满天飞，奥特曼在线围观

机器之心报道编辑：杜伟、陈萍这场等待「GPT-5」的游戏啥时候才能结束？GPT-5 啥时候来？估计是 AI 领域最关心的问题之一了。是像 Sora 一样毫无预兆的发布...

阅读原文

AIGC动态

2年前 (2024)

智子引擎发布多模态大模型 Awaker：MOE、自主更新、写真视频效果优于 Sora

在 4 月 27 日召开的中关村论坛通用人工智能平行论坛上，人大系初创公司智子引擎隆重发布全新的多模态大模型 Awaker 1.0。相对于智子引擎前代的 ChatImg 序...

阅读原文

AIGC动态

2年前 (2024)

MIT研究登顶会ICLR 2024：让机器人掌握"常识"，自主完成复杂家务

大数据文摘受权转载自机器人大讲堂在人工智能飞速发展的今天，家用服务机器人正日益走进寻常百姓家。然而，要让机器人像人一样灵活应对家庭环境的复杂多变，...

阅读原文

AIGC动态

2年前 (2024)

全球首个自主进化多模态MoE震撼登场！写真视频击败Sora，人大系团队自研底座VDT

新智元报道编辑：编辑部【新智元导读】人大系初创公司智子引擎发布的全新多模态大模型Awaker 1.0，直接迈向了AGI！它是业界首个真正实现自主更新的大模型，...

阅读原文

AIGC动态

2年前 (2024)

今日arXiv最热NLP大模型论文：超越GPT-4，清华发布网页导航智能体AutoWebGLM

夕小瑶科技说原创作者 | Tscom随着大语言模型（LLMs）的发展，Agent在网络导航等任务中展现出了前所未有的能力。想象一下，一个基于LLM的Agent能够在你享用...

阅读原文

AIGC动态

2年前 (2024)

1…20 212223 24…48