标签:方法

南开&山大&北理工团队开发trRosettaRNA:利用Transformer网络自动预测RNA 3D结构

将 ScienceAI设为星标第一时间掌握新鲜的 AI for Science 资讯编辑 | 萝卜皮RNA 3D 结构预测是一个长期存在的挑战。受最近蛋白质结构预测领域突破的启发,南...
阅读原文

历数5年89篇研究,这篇综述告诉我们深度学习中的代码数据增强怎么样了

机器之心专栏机器之心编辑部当今深度学习以及大模型的飞速发展,带来了对创新技术的不断追求。在这一进程中,代码数据增强技术显现出其不可忽视的价值。最近...
阅读原文

OpenAI安全系统负责人长文梳理:大模型的对抗攻击与防御

选自Lil’Log作者:Lilian Weng机器之心编译编辑:PandaLLM 能力强大,倘若别有用心之人用其来干坏事,可能会造成难以预料的严重后果。虽然大多数商用和开源 L...
阅读原文

多模态对齐如何做?国防科大等最新《如何弥合模态间的差距:多模态大型语言模型》综述四大类型多模态对齐方法

来源:专知这篇综述论文探讨了多模态大型语言模型(MLLMs),它们集成了像GPT-4这样的大型语言模型(LLMs),以处理多模态数据,如文本和视觉。MLLMs展示了如...
阅读原文

Science:1分钟内生成10天气象预报,DeepMind AI击败最强系统

大数据文摘授权转载自学术头条作者:闫一米在天气预报方面,人工智能(AI)颠覆了传统方法,有望以更快的速度和更低的成本实现更准确的预测。Google DeepMind...
阅读原文

Science重磅:1分钟内生成10天气象预报,DeepMind AI击败了全球最好预报系统

在天气预报方面,人工智能(AI)颠覆了传统方法,有望以更快的速度和更低的成本实现更准确的预测。Google DeepMind 推出的一款基于机器学习的天气预测模型——G...
阅读原文

大模型架构创新已死?

三石 白交发自 凹非寺量子位 | 公众号 QbitAI一场围绕大模型自研和创新的讨论,这两天在技术圈里炸了锅。起初,前阿里技术VP贾扬清,盆友圈爆料吐槽:有大厂...
阅读原文

准确率降至3%,主任务性能几乎不变!华工JHU提出全新「联邦学习攻击识别」解决方案|ICCV2023

新智元报道编辑:LRS【新智元导读】无惧联邦学习中的后门攻击!全新解决方案利用多指标和动态加权来自适应地识别后门,在难度最高的Edge-case PGD中,后门准...
阅读原文

斯坦福提出对比偏好学习:无需强化学习即可从人类反馈中学习

机器之心报道编辑:Panda W我们知道,ChatGPT 的成功离不开 RLHF 这个「秘密武器」。不过 RLHF 并不是完美无缺的,存在难以处理的优化难题。本文中,斯坦福大...
阅读原文

舍弃99%的参数,还能达到相同的性能!阿里团队发现大模型「合二为一」的黑魔法!而且不用GPU,不需重新训练

夕小瑶科技说 原创作者 | 小戏、Python动漫《龙珠》里,构想了一种“美达摩星人融合术”,通过融合术舞步就可以让譬如悟空与贝吉塔合体,成为“究极超强合体战士...
阅读原文

让大模型自主探索开放世界,北大&智源提出训练框架LLaMA-Rider

机器之心专栏机器之心编辑部大语言模型因其强大而通用的语言生成、理解能力,展现出了成为通用智能体的潜力。与此同时,在开放式的环境中探索、学习则是通用...
阅读原文

大模型落地最后一公里:111页全面综述大模型评测

机器之心专栏机器之心编辑部当前,大模型正凭借其强大的能力和无限的潜力引领着新一轮技术革命,众多科技巨头纷纷围绕大模型进行布局,进一步推动大模型不断...
阅读原文

AI生图太诡异?马里兰&NYU合力解剖神经网络,CLIP模型神经元形似骷髅头

新智元报道编辑:桃子【新智元导读】神经网络黑盒怎么解释?马里兰大学和NYU研究人员开启了新的尝试。AI黑盒如何才能解?神经网络模型在训练的时,会有些ReLU...
阅读原文

单点端到端文本检测识别框架速度提升19倍!华科、华南理工等联合发布SPTS v2

新智元报道编辑:LRS 好困【新智元导读】单点文本框标注,成本显著降低;将检测和识别解耦,并行解码提升自回归速度。近年来,场景文本阅读(Text Spotting)...
阅读原文

MetaAI提出全新验证链框架,大模型通过“三省吾身”缓解幻觉现象

大数据文摘授权转载自将门创投作者:seven_曾子曰:“吾日三省吾身”–出自《论语·学而》时至今日,生成幻觉(hallucination)仍然是大模型研究界中一个令人非常...
阅读原文