标签:模块

杨立昆教授关于通用人工智能世界模型JEPA观点及争议

-本篇附录杨立昆教授世界模型JEPA论文摘要简介和争议背景,全文将在下一篇播出,论文全文约有4.6万字。‍‍‍‍‍‍ 目录 1世界模型JEPA观点及争议背景 2编译作者观...
阅读原文

今日arXiv最热大模型论文:北大发布4维时空数据预训练,助力自动驾驶

夕小瑶科技说 原创作者 | Richard自动驾驶的世界里,汽车不再只是简单的代步工具,而是一个能感知环境、预判未来的'智能体'。但要实现这样的进化,仅凭单独识...
阅读原文

AlphaFold 3来了!闭源但可供科研使用,DeepMind子公司近水楼台先推进商用?

大数据文摘授权转载自HyperAI超神经 作者:李宝珠,十九 编辑:三羊 当地时间 5 月 8 日,Google DeepMind 联合其子公司 Isomorphic Labs 重磅发布 AlphaFold...
阅读原文

AlphaFold 3来了!闭源但可供科研使用,DeepMind 子公司近水楼台先推进商用?

作者:李宝珠,十九 编辑:三羊 Google DeepMind 联合其子公司 Isomorphic Labs 发布 AlphaFold 3,能够预测所有生命分子的结构和相互作用。当地时间 5 月 8 ...
阅读原文

万字解读AI Agent架构体系,API和RPA将成为重点

与提示词、微调等大模型应用相比,AI Agent的独特之处在于其不仅能为用户提供咨询,还能直接参与决策与执行环节。Agent能够落地的核心在于。此一进步的核心在...
阅读原文

国产多模态大模型狂飙!颜水成挂帅开源Vitron,破解图像/视频模型割裂问题

未来可探索三大方向:系统架构、用户交互性、模态能力。 编辑|ZeR0 奔向通用人工智能,大模型又迈出一大步。 智东西4月25日报道,近日,由颜水成教授带队,昆...
阅读原文

颜水成挂帅,奠定「通用视觉多模态大模型」终极形态!一统理解/生成/分割/编辑

新智元报道编辑:LRS 【新智元导读】颜水成团队联合新加坡国立、南洋理工大学共同开源了Vitron模型,持从视觉理解到视觉生成、从低层次到高层次的一系列视觉...
阅读原文

DeepMind升级Transformer,前向通过FLOPs最多可降一半

机器之心报道 编辑:Panda W引入混合深度,DeepMind 新设计可大幅提升 Transformer 效率。Transformer 的重要性无需多言,目前也有很多研究团队致力于改进这...
阅读原文

RAG实战全解析:一年探索之路

4月18-19日,由智猩猩与智东西共同主办的2024中国生成式AI大会将在北京JW万豪酒店举行。大会完整议程出炉,55位嘉宾出席!免费票申请通道即将关闭,大会通票...
阅读原文

CoELA一作张洪鑫:使用大语言模型构建合作型具身智能体|智猩猩AI新青年讲座预告

「智猩猩AI新青年讲座」由智猩猩出品,致力于邀请青年学者,主讲他们在生成式AI、LLM、AI Agent、CV等人工智能领域的最新重要研究成果。 AI新青年是加速人工...
阅读原文

Up主已经开始鬼畜,腾讯开源「AniPortrait」让照片唱歌说话

机器之心报道 编辑:PandaAniPortrait 模型是开源的,可以自由畅玩。「小破站鬼畜区的新质生产力工具。」 近日,腾讯开源发布的一个新项目在推上获得了如此评...
阅读原文

详解Latte:去年底上线的全球首个开源文生视频DiT

机器之心专栏 机器之心编辑部随着 Sora 的成功发布,视频 DiT 模型得到了大量的关注和讨论。设计稳定的超大规模神经网络一直是视觉生成领域的研究重点。DiT [...
阅读原文

南洋理工发布多模态智能体 FinAgent,开启高效金融交易的创新之旅

1金融量化交易的智能化新篇章金融市场的稳定和繁荣对经济发展至关重要,它不仅促进资本的有效配置,还为风险管理提供了重要机制。然而,随着金融市场的日益复...
阅读原文

今日arXiv最热NLP大模型论文:大模型RAG新宠!浙江大学发布自反馈检索增强方法

夕小瑶科技说 原创作者 | 芒果 引言:探索知识检索增强新篇章在人工智能领域,大语言模型(LLMs)凭借其在多种任务上的卓越表现而备受瞩目。然而,这些模型在...
阅读原文

收益率16.6%!超越ChatGPT的股票预测模型来了,还能给出合理解释

夕小瑶科技说 原创作者 | 谢年年股市变换莫测,任何一点风吹草动都可能影响股票的走势,面对这种不确定性,投资者们常常感到无所适从。 于是研究者们盯上了如...
阅读原文