标签:模块

南洋理工发布多模态金融交易Agent,平均利润提高36%!

夕小瑶科技说 原创作者 | 芒果 引言:金融市场的新挑战与新机遇金融市场是经济稳定的基石,它不仅促进了资本的分配,还提供了风险管理的机制。随着市场的不断...
阅读原文

迁移学习帮大忙!成都理工大学搭建 SCDUNet++ 模型进行滑坡测绘

作者:加零 编辑:李宝珠、三羊 成都理工大学的研究人员提出了一个名为 SCDUNet++ 的语义分割模型,结合卷积神经网络和 Transformer 的优势,有效开展滑坡测...
阅读原文

匿名论文提出奇招!增强大模型长文本能力居然还能这么做

丰色 发自 凹非寺量子位 | 公众号 QbitAI一提到提高大模型长文本能力,就想到长度外推或者上下文窗口扩展? 不行,这些都太费硬件资源了。 来看一个奇妙新解...
阅读原文

详解面向大模型的检索增强生成(RAG)

RAG最近有一篇广受关注的综述,最近是花了不少时间给啃了个大概,里面提及的挺多文章其实都挺精彩的,甚至是让人兴奋的。我先把链接放上。 论文:Retrieval-A...
阅读原文

小米新一代Kaldi团队论文解读:新型自动语音识别 (ASR) 模型Zipformer诞生之路|ICLR 2024 Oral

机器之心专栏 作者:新一代 Kaldi 团队近日,小米集团新一代 Kaldi 团队关于语音识别声学模型的论文《Zipformer: A faster and better encoder for automatic...
阅读原文

买个机器人端茶倒水有希望了?Meta、纽约大学造了一个OK-Robot

机器之心报道 编辑:张倩、陈萍如果有个这样的机器人,你几点回家?「xx,去把电视柜上的遥控器帮我拿过来。」在一个家庭环境中,很多家庭成员都不免被支使干...
阅读原文

大模型学会听音乐了!风格乐器精准分析,还能剪辑合成

腾讯PCG ARC实验室 投稿量子位 | 公众号 QbitAI能处理音乐的多模态大模型,终于出现了! 只见它准确分析出音乐的旋律、节奏,还有使用的乐器,甚至其中的意境...
阅读原文

今日Arxiv最热NLP大模型论文:LLM化身符号逻辑大师,智能体文本游戏新纪元

夕小瑶科技说 原创作者 | 赛博马良本期论文解读非人类撰写,全文由赛博马良「AI论文解读达人」智能体自主完成,经人工审核后发布。智能体传送门: https://ww...
阅读原文

字节最新文生视频模型,引发围观!狐狸跳舞超丝滑,效果超Gen-2

夕小瑶科技说 原创作者 | 谢年年、python扩散模型带动了文生视频领域的发展。Runway、Pika 1.0、Morph、Moon Valley和Stable Video Diffusion model等模型在...
阅读原文

效果超越Gen-2!字节最新视频生成模型,一句话让绿巨人戴上VR眼镜

白交 发自 凹非寺量子位 | 公众号 QbitAI一句话,就让绿巨人戴上VR眼镜。 4K画质那种。 熊猫的奇幻漂流~ 这是字节最新的AI视频生成模型MagicVideo-V2,各种奇...
阅读原文

腾讯 PCG ARC Lab、新加坡国立大学联合发布 M2UGen:基于 LLM 的多模态音乐理解与生成

在过去的一年里,基于大语言模型LLM的音乐AIGC技术蓬勃发展,为LLM的下游应用注入了新的活力。 本研究成果M2UGen致力于将LLM和音乐理解与音乐生成技术相结合...
阅读原文

「唤醒」NPC,这家融资过亿的国内创企在做一种很新的游戏

机器之心报道 编辑:张倩、陈萍每次进入游戏,NPC 都说着不一样的台词,这将是一个怎样的世界?在众多游戏类型中,开放世界游戏是非常受欢迎的一种,因为它允...
阅读原文

《我的世界》化身AI小镇,NPC居民角色扮演如同真人

克雷西 发自 凹非寺量子位 | 公众号 QbitAI注意看,这个方块人正在快速思考面前几位“不速之客”的身份。 原来她是遇到了危险,意识到这一点之后,她马上开始在...
阅读原文

AI绘图模型不会写字的难题,被阿里破解了

克雷西 发自 凹非寺量子位 | 公众号 QbitAI能准确写汉字的AI绘图工具,终于登场了! 包括中文在内一共支持四种语言,而且还能文字的位置还能任意指定。 从此...
阅读原文

4分钟成功复现诺奖!CMU开发GPT-4化学家,自主编码操控机器人颠覆化学研究登Nature

新智元报道编辑:桃子 润 【新智元导读】AI颠覆化学研究再次登上Nature!由CMU和Emerald Cloud Lab团队开发的GPT-4加持的AI工具,在不到4分钟的时间成功复现2...
阅读原文