标签:长程

AI赚钱副业~AI生成影视解说,半个月涨粉变现3.5W+!

这两年大家都在感叹生活不易,然而我想说的是,机会还是有的,但问题不在于有没有,而在于你是否能够认准机会,然后抓住它。 接触过很多咨询项目的人,发现...

无一大模型及格! 北大/通研院提出超难基准,专门评估长文本理解生成

LooGLE团队 投稿自 凹非寺量子位 | 公众号 QbitAI在长文本理解能力这块,竟然没有一个大模型及格! 北大联合北京通用人工智能研究院提出了一个新基准数据集:...
阅读原文

仅需5%训练样本达到最优性能,清华大学研究团队发布条件去噪扩散模型SPDiff,实现长程人流移动模拟

大数据文摘授权转载自HyperAI超神经 作者:陈弘毅 编辑:李宝珠,三羊 人流移动模拟 (Crowd Simulation) 是在特定情境中模拟大量人员移动的过程。这项技术主...
阅读原文

仅需 5% 训练样本达到最优性能,清华大学研究团队发布条件去噪扩散模型 SPDiff,实现长程人流移动模拟

作者:陈弘毅 编辑:李宝珠,三羊 清华大学研究团队提出了一种条件去噪扩散模型 SPDiff,能够有效地利用交互动力学,通过社会力引导的扩散过程来模拟人群行为...
阅读原文

挑战Transformer的Mamba是什么来头?作者博士论文理清SSM进化路径

机器之心报道 编辑:张倩对 SSM 感兴趣的研究者不妨读一下这篇博士论文。 在大模型领域,Transformer 凭一己之力撑起了整个江山。但随着模型规模的扩展和需要...
阅读原文

破解自注意力推理缺陷的奥秘,蚂蚁自研新一代Transformer或实现无损外推

机器之心专栏作者:蚂蚁人工智能团队随着大语言模型的快速发展,其长度外推能力(length extrapolating)正日益受到研究者的关注。尽管这在 Transformer 诞生...
阅读原文