标签:方法
极长序列、极快速度:面向新一代高效大语言模型的LASP序列并行
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
一阶优化算法启发,北大林宙辰团队提出具有万有逼近性质的神经网络架构的设计方法
机器之心专栏 机器之心编辑部以神经网络为基础的深度学习技术已经在诸多应用领域取得了有效成果。在实践中,网络架构可以显著影响学习效率,一个好的神经网络...
史上首次,AI超越人类奥赛金牌得主!吴方法加持,30题做出27道破纪录
新智元报道编辑:编辑部 【新智元导读】就在刚刚,首位超越人类数学奥赛金牌得主的AI诞生了!剑桥大学等机构的研究者发现,结合「吴方法」的DeepMind数学模型...
中科院发布大模型想象增强法IAG,无需外部资源,想想就能变强
夕小瑶科技说 原创作者 | 松果 引言:探索知识增强的新方法在人工智能领域,尤其是自然语言处理(NLP)的子领域——问答系统(QA)中,知识的获取和利用一直是...
谷歌提出深度混合:使 AI 模型速度提高 50%
点击上方蓝字关注我们“本文介绍了一种名为'深度混合'的创新方法,旨在解决基于Transformer的语言模型在处理长序列或复杂任务时面临的计算资源分配问题。该方...
大模型融合!最新「进化算法」全自动组合开源模型,刷榜多项基准测试
新智元报道编辑:Mindy 【新智元导读】自动将不同开源模型进行组合,生成具有新能力的新模型,Sakana AI开发的新方法做到了!人类智慧的基础并不在于单个聪明...
人民大学:揭示大语言模型事实召回的关键机制
夕小瑶科技说 原创来源 | 芒果 引言:大语言模型事实召回机制探索该论文深入研究了基于Transformer的语言模型在零射击和少射击场景下的事实记忆任务机制。模...
“抄袭”原来才是最快的写论文方法?
有些研究生,即使告诉他方法,也发不了顶会顶刊! 因为能发顶会或者高区位会议的文章,idea必须有创新性。而一个科研新人几乎不具备独立提炼idea的能力。 很...
谷歌更新Transformer架构,更节省计算资源!50%性能提升
明敏 发自 凹非寺量子位 | 公众号 QbitAI谷歌终于更新了Transformer架构。 最新发布的Mixture-of-Depths(MoD),改变了以往Transformer计算模式。 它通过动...
今日arXiv最热大模型论文:从Twitter动态预测论文学术不端,人大发布
夕小瑶科技说 原创作者 | 松果 引言:社交媒体在科研诚信中的潜在作用在科研领域,确保研究成果的真实性和可靠性是至关重要的。然而,不论是由于研究不端行为...
CVPR 2024满分论文,英伟达开源BOP排行榜6D物体姿态第一名方法
机器之心专栏 机器之心编辑部物体姿态估计对于各种应用至关重要,例如机器人操纵和混合现实。实例级方法通常需要纹理 CAD 模型来生成训练数据,并且不能应用...
CVPR 2024 | 更高效、更准确的拖拽编辑 Drag Your Noise
新加坡管理大学何盛烽团队联合华南师范大学在CVPR 2024上发表了工作《Drag Your Noise: Interactive Point-based Editing via Diffusion Semantic Propagatio...
CVPR 2024|生成不了光线极强的图片?微信视觉团队有效解决扩散模型奇点问题
机器之心专栏 机器之心编辑部扩散模型凭借其在图像生成方面的出色表现,开启了生成式模型的新纪元。诸如 Stable Diffusion,DALLE,Imagen,SORA 等大模型如...
贝叶斯数学与人工智能相结合 可使太阳能更智能
GETTY IMAGES 来源:IEEE电气电子工程师学会 随着对可再生能源的需求激增,材料研究人员正在寻找制造更高效太阳能电池的方法。如今商业生产的标准晶体太阳能...
今日arXiv最热NLP大模型论文:微软:用大模型分析用户满意度,让智能系统更善解人意
夕小瑶科技说 原创作者 | 芒果引言:关于大模型分析用户满意度的探索该研究强调了用户满意度估计(USE)的准确性和可解释性在改善对话系统中的重要性。现有的...