标签:长程
AI赚钱副业~AI生成影视解说,半个月涨粉变现3.5W+!
这两年大家都在感叹生活不易,然而我想说的是,机会还是有的,但问题不在于有没有,而在于你是否能够认准机会,然后抓住它。 接触过很多咨询项目的人,发现...
无一大模型及格! 北大/通研院提出超难基准,专门评估长文本理解生成
LooGLE团队 投稿自 凹非寺量子位 | 公众号 QbitAI在长文本理解能力这块,竟然没有一个大模型及格! 北大联合北京通用人工智能研究院提出了一个新基准数据集:...
仅需5%训练样本达到最优性能,清华大学研究团队发布条件去噪扩散模型SPDiff,实现长程人流移动模拟
大数据文摘授权转载自HyperAI超神经 作者:陈弘毅 编辑:李宝珠,三羊 人流移动模拟 (Crowd Simulation) 是在特定情境中模拟大量人员移动的过程。这项技术主...
仅需 5% 训练样本达到最优性能,清华大学研究团队发布条件去噪扩散模型 SPDiff,实现长程人流移动模拟
作者:陈弘毅 编辑:李宝珠,三羊 清华大学研究团队提出了一种条件去噪扩散模型 SPDiff,能够有效地利用交互动力学,通过社会力引导的扩散过程来模拟人群行为...
挑战Transformer的Mamba是什么来头?作者博士论文理清SSM进化路径
机器之心报道 编辑:张倩对 SSM 感兴趣的研究者不妨读一下这篇博士论文。 在大模型领域,Transformer 凭一己之力撑起了整个江山。但随着模型规模的扩展和需要...
破解自注意力推理缺陷的奥秘,蚂蚁自研新一代Transformer或实现无损外推
机器之心专栏作者:蚂蚁人工智能团队随着大语言模型的快速发展,其长度外推能力(length extrapolating)正日益受到研究者的关注。尽管这在 Transformer 诞生...