标签:模块

小米大模型提效新框架:训练最高提速34%,推理最高提速52%!Kaldi之父合作出品

直播预告 | 6月25日晚7点,「智猩猩机器人新青年讲座」第9讲正式开讲,UMass Amherst在读博士周沁泓将直播讲解《在具身智能模拟器中针对动态灾害进行具身决策...
阅读原文

作为人工智能下一个关口的意识研究:从加扎尼加的意识学说切入

来源:神经现实 摘要随着近年来人工智能(AI)的惊人进步,AI 是否具有意识以及如何构建有意识的 AI 系统越来 越受到学界和公众的关注。要回答这类问题,我们...
阅读原文

谷歌搜索算法内幕被扒,2500页巨细文件实名泄密!搜索排名谎言被揭穿

新智元报道编辑:庸庸 【新智元导读】就在刚刚,一份2500页的内部文档泄露,谷歌搜索算法的内幕,让不少人大跌眼镜。日前,谷歌2500页的内部文档被泄露,揭示...
阅读原文

ACL 2024 | 提升大模型持续学习性能,哈工大、度小满提出共享注意力框架SAPT

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

多模态CoT思维链架构来了,现已开源|来自厦大&腾讯优图

Happy 投稿量子位 | 公众号 QbitAI多模态大模型,也有自己的CoT思维链了! 厦门大学&腾讯优图团队提出一种名为“领唱员(Cantor)”的决策感知多模态思维链...
阅读原文

杨立昆教授关于通用人工智能世界模型JEPA观点及争议

-本篇附录杨立昆教授世界模型JEPA论文摘要简介和争议背景,全文将在下一篇播出,论文全文约有4.6万字。‍‍‍‍‍‍ 目录 1世界模型JEPA观点及争议背景 2编译作者观...
阅读原文

今日arXiv最热大模型论文:北大发布4维时空数据预训练,助力自动驾驶

夕小瑶科技说 原创作者 | Richard自动驾驶的世界里,汽车不再只是简单的代步工具,而是一个能感知环境、预判未来的'智能体'。但要实现这样的进化,仅凭单独识...
阅读原文

AlphaFold 3来了!闭源但可供科研使用,DeepMind子公司近水楼台先推进商用?

大数据文摘授权转载自HyperAI超神经 作者:李宝珠,十九 编辑:三羊 当地时间 5 月 8 日,Google DeepMind 联合其子公司 Isomorphic Labs 重磅发布 AlphaFold...
阅读原文

AlphaFold 3来了!闭源但可供科研使用,DeepMind 子公司近水楼台先推进商用?

作者:李宝珠,十九 编辑:三羊 Google DeepMind 联合其子公司 Isomorphic Labs 发布 AlphaFold 3,能够预测所有生命分子的结构和相互作用。当地时间 5 月 8 ...
阅读原文

万字解读AI Agent架构体系,API和RPA将成为重点

与提示词、微调等大模型应用相比,AI Agent的独特之处在于其不仅能为用户提供咨询,还能直接参与决策与执行环节。Agent能够落地的核心在于。此一进步的核心在...
阅读原文

国产多模态大模型狂飙!颜水成挂帅开源Vitron,破解图像/视频模型割裂问题

未来可探索三大方向:系统架构、用户交互性、模态能力。 编辑|ZeR0 奔向通用人工智能,大模型又迈出一大步。 智东西4月25日报道,近日,由颜水成教授带队,昆...
阅读原文

颜水成挂帅,奠定「通用视觉多模态大模型」终极形态!一统理解/生成/分割/编辑

新智元报道编辑:LRS 【新智元导读】颜水成团队联合新加坡国立、南洋理工大学共同开源了Vitron模型,持从视觉理解到视觉生成、从低层次到高层次的一系列视觉...
阅读原文

DeepMind升级Transformer,前向通过FLOPs最多可降一半

机器之心报道 编辑:Panda W引入混合深度,DeepMind 新设计可大幅提升 Transformer 效率。Transformer 的重要性无需多言,目前也有很多研究团队致力于改进这...
阅读原文

RAG实战全解析:一年探索之路

4月18-19日,由智猩猩与智东西共同主办的2024中国生成式AI大会将在北京JW万豪酒店举行。大会完整议程出炉,55位嘉宾出席!免费票申请通道即将关闭,大会通票...
阅读原文

CoELA一作张洪鑫:使用大语言模型构建合作型具身智能体|智猩猩AI新青年讲座预告

「智猩猩AI新青年讲座」由智猩猩出品,致力于邀请青年学者,主讲他们在生成式AI、LLM、AI Agent、CV等人工智能领域的最新重要研究成果。 AI新青年是加速人工...
阅读原文
1234