标签:方法
灵敏度提高56%,港中文/复旦/耶鲁等联袂提出全新蛋白质同源物检测方法
作者:田小幺 编辑:十九,李宝珠 基于蛋白质语言模型和密集检索技术,香港中文大学李煜,联合复旦大学智能复杂体系实验室、上海人工智能实验室青年研究员孙...
GPT-4结合SAM2:免训练多模态分割的全新解决方案!| 已开源
北京航空航天大学 李红羽 投稿 凹非寺量子位 | 公众号 QbitAI免训练多模态分割领域有了新突破! 中科院信工所、北航、合工大、美团等单位联合提出了一种名为A...
MoE再下一城!港大提出AnyGraph:首次开启「图大模型」Scaling Law之路
新智元报道编辑:LRST 【新智元导读】AnyGraph聚焦于解决图数据的核心难题,跨越多种场景、特征和数据集进行预训练。其采用混合专家模型和特征统一方法处理结...
ECCV 2024 | 引入DiT的原生3D通用框架,适用任意神经场、秒级生成
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
3秒让AI变乖,生成风险图片减少30%!复旦新研究拿下扩散模型概念移除新SOTA|ECCV 2024
RECE团队 投稿量子位 | 公众号 QbitAI让AI绘画模型变“乖”,现在仅需3秒调整模型参数。 效果be like:生成的风险图片比以往最佳方法减少30%! 像这样,在充分...
10行代码让大模型数学提升20%,“野路子”研究谷歌也测上了,主要作者全靠自学成才
克雷西 发自 凹非寺量子位 | 公众号 QbitAI只要不到10行代码,就能让大模型数学能力(GSM8k)提升20%! 几名独立学者提出了大模型采样的改进方案,引起了开源...
LLM蒸馏到GNN,性能提升6.2%!Emory提出大模型蒸馏到文本图|CIKM 2024
新智元报道编辑:LRST 【新智元导读】Emory大学的研究团队提出了一种创新的方法,将大语言模型(LLM)在文本图(Text-Attributed Graph, 缩写为TAG)学习中的...
Post-Training有多重要?AI2研究员长文详解前沿模型的后训练秘籍
新智元报道编辑:乔杨 【新智元导读】越来越多研究发现,后训练对模型性能同样重要。Allen AI的机器学习研究员Nathan Lambert最近发表了一篇技术博文,总结了...
Llama 8B搜索100次超越GPT-4o!推理+搜索即可提升性能,新「Scaling Law」诞生?
新智元报道编辑:乔杨 【新智元导读】最近的论文表明,LLM等生成模型可以通过搜索来扩展,并实现非常显著的性能提升。另一个复现实验也发现,让参数量仅8B的L...
材料探索新纪元!清华大学徐勇、段文晖团队发布神经网络密度泛函框架,打开物质电子结构预测的黑箱!
作者:田小幺 编辑:李姝,十九 清华大学徐勇、段文晖研究组提出了神经网络密度泛函理论的理论框架,该框架统一了神经网络中损失函数的最小化与密度泛函理论...
最强智能体Agent Q发布!Llama 3零样本成功率提升340%
夕小瑶科技说 分享来源 | 新智元没有等来OpenAI的Q*草莓项目的发布,一家名为MultiOn初创公司却抢先发布了名为Q的智能体。 非常高兴地宣布我们过去6个月的工...
最强智能体Agent Q发布!Llama 3成功率飙升3倍,OpenAI神秘「草莓」遭截胡?
新智元报道编辑:乔杨 好困 【新智元导读】初创公司MultiOn最近发布了号称「目前最强」的Agent Q,在真实的预订任务中可以达到95.4%的成功率。网友纷纷猜测其...
30秒生成建模师级Mesh!最大可生成面数提升至1600,GitHub揽星1.9k项目发布V2版本
木子 投稿量子位 | 公众号 QbitAI只需30秒,AI就能像3D建模师一样,在各种指示下生成高质量人造Mesh。 NeRF、3D Gaussian Splatting生成的三维重建图像Mesh效...
清华光学AI登Nature!物理神经网络,反向传播不需要了
一水 发自 凹非寺量子位 | 公众号 QbitAI用光训练神经网络,清华成果最新登上了Nature! 无法应用反向传播算法怎么办? 他们提出了一种全前向模式(Fully For...
21.5万张X光,78万个问题!德州大学NIH等联合发布医学视觉问答数据集Medical-CXR-VQA
新智元报道编辑:LRST 好困 【新智元导读】多模态大语言模型(MLLM)在医学视觉问答(VQA)领域展现出巨大潜力,通过提供针对医学图像的具体临床问题的回答,...