标签:方法
人民大学:揭示大语言模型事实召回的关键机制
夕小瑶科技说 原创来源 | 芒果 引言:大语言模型事实召回机制探索该论文深入研究了基于Transformer的语言模型在零射击和少射击场景下的事实记忆任务机制。模...
“抄袭”原来才是最快的写论文方法?
有些研究生,即使告诉他方法,也发不了顶会顶刊! 因为能发顶会或者高区位会议的文章,idea必须有创新性。而一个科研新人几乎不具备独立提炼idea的能力。 很...
谷歌更新Transformer架构,更节省计算资源!50%性能提升
明敏 发自 凹非寺量子位 | 公众号 QbitAI谷歌终于更新了Transformer架构。 最新发布的Mixture-of-Depths(MoD),改变了以往Transformer计算模式。 它通过动...
今日arXiv最热大模型论文:从Twitter动态预测论文学术不端,人大发布
夕小瑶科技说 原创作者 | 松果 引言:社交媒体在科研诚信中的潜在作用在科研领域,确保研究成果的真实性和可靠性是至关重要的。然而,不论是由于研究不端行为...
CVPR 2024满分论文,英伟达开源BOP排行榜6D物体姿态第一名方法
机器之心专栏 机器之心编辑部物体姿态估计对于各种应用至关重要,例如机器人操纵和混合现实。实例级方法通常需要纹理 CAD 模型来生成训练数据,并且不能应用...
CVPR 2024 | 更高效、更准确的拖拽编辑 Drag Your Noise
新加坡管理大学何盛烽团队联合华南师范大学在CVPR 2024上发表了工作《Drag Your Noise: Interactive Point-based Editing via Diffusion Semantic Propagatio...
CVPR 2024|生成不了光线极强的图片?微信视觉团队有效解决扩散模型奇点问题
机器之心专栏 机器之心编辑部扩散模型凭借其在图像生成方面的出色表现,开启了生成式模型的新纪元。诸如 Stable Diffusion,DALLE,Imagen,SORA 等大模型如...
贝叶斯数学与人工智能相结合 可使太阳能更智能
GETTY IMAGES 来源:IEEE电气电子工程师学会 随着对可再生能源的需求激增,材料研究人员正在寻找制造更高效太阳能电池的方法。如今商业生产的标准晶体太阳能...
今日arXiv最热NLP大模型论文:微软:用大模型分析用户满意度,让智能系统更善解人意
夕小瑶科技说 原创作者 | 芒果引言:关于大模型分析用户满意度的探索该研究强调了用户满意度估计(USE)的准确性和可解释性在改善对话系统中的重要性。现有的...
两分钟1200帧的长视频生成器StreamingT2V来了,代码将开源
机器之心报道 编辑:Panda广阔的战场,风暴兵在奔跑…… prompt:Wide shot of battlefield, stormtroopers running... 这段长达 1200 帧的 2 分钟视频来自一个...
老药新用,中南大学团队发布 AdaDR,基于自适应图卷积网络进行药物重定位
作者:梅菜 编辑:李宝珠,三羊 中南大学研究团队提出了一种名为 AdaDR 的自适应 GCN 方法,通过深度集成节点特征和拓扑结构来进行药物重定位。现代社会,人...
清华微软开源全新提示词压缩工具,长度骤降80%!GitHub怒砍3.1K星
新智元报道编辑:润 好困 【新智元导读】最近,清华和微软的研究人员提出了一种全新的方法,能在保证输出质量不变的前提下,将提示词压缩到原始长度的20%!在...
模型合并就进化,直接拿下SOTA!Transformer作者创业新成果火了
丰色 发自 凹非寺量子位 | 公众号 QbitAI把Huggingface上的现成模型拿来“攒一攒”—— 直接就能组合出新的强大模型?! 日本大模型公司sakana.ai脑洞大开(正是“...
离职谷歌的Transformer作者创业,连发3个模型(附技术报告)
机器之心报道 编辑:陈萍、小舟去年 8 月,两位著名的前谷歌研究人员 David Ha、Llion Jones 宣布创立一家人工智能公司 Sakana AI,总部位于日本东京。其中,...
用大语言模型控制交通信号灯,有效缓解拥堵!
夕小瑶科技说 原创作者 | 松果 引言:城市交通拥堵的挑战与智能交通信号控制的进展城市交通拥堵是一个全球性的问题,在众多缓解交通拥堵的策略中,提高路口交...