标签:方法

又一千亿级大模型问世,全面开源!

夕小瑶科技说 分享11月27日,浪潮信息发布“源2.0”基础大模型,并宣布全面开源。源2.0基础大模型包括1026亿、518亿、21亿等三种参数规模的模型,在编程、推理...
阅读原文

仅靠合成数据无法实现 AGI

点击上方蓝字关注我们“ OpenAI最新的模型Q*引发了关注,它能解决数学问题并展现出卓越的推理能力。然而,是否应该依赖合成数据引发了科技社区的讨论,有人认...
阅读原文

单个A100生成3D图像只需30秒,这是Adobe让文本、图像都动起来的新方法

机器之心报道编辑:杜伟、佳琪3D 生成是 AI 视觉领域的研究热点之一。本文中,来自 Adobe 研究院和斯坦福大学等机构的研究者利用基于 transformer 的 3D 大型...
阅读原文

谷歌:LLM找不到推理错误,但能纠正它

机器之心报道编辑:PandaLLM 找不到推理错误,但却能纠正错误!今年,大型语言模型(LLM)成为 AI 领域关注的焦点。LLM 在各种自然语言处理(NLP)任务上取得...
阅读原文

南开&山大&北理工团队开发trRosettaRNA:利用Transformer网络自动预测RNA 3D结构

将 ScienceAI设为星标第一时间掌握新鲜的 AI for Science 资讯编辑 | 萝卜皮RNA 3D 结构预测是一个长期存在的挑战。受最近蛋白质结构预测领域突破的启发,南...
阅读原文

历数5年89篇研究,这篇综述告诉我们深度学习中的代码数据增强怎么样了

机器之心专栏机器之心编辑部当今深度学习以及大模型的飞速发展,带来了对创新技术的不断追求。在这一进程中,代码数据增强技术显现出其不可忽视的价值。最近...
阅读原文

OpenAI安全系统负责人长文梳理:大模型的对抗攻击与防御

选自Lil’Log作者:Lilian Weng机器之心编译编辑:PandaLLM 能力强大,倘若别有用心之人用其来干坏事,可能会造成难以预料的严重后果。虽然大多数商用和开源 L...
阅读原文

多模态对齐如何做?国防科大等最新《如何弥合模态间的差距:多模态大型语言模型》综述四大类型多模态对齐方法

来源:专知这篇综述论文探讨了多模态大型语言模型(MLLMs),它们集成了像GPT-4这样的大型语言模型(LLMs),以处理多模态数据,如文本和视觉。MLLMs展示了如...
阅读原文

Science:1分钟内生成10天气象预报,DeepMind AI击败最强系统

大数据文摘授权转载自学术头条作者:闫一米在天气预报方面,人工智能(AI)颠覆了传统方法,有望以更快的速度和更低的成本实现更准确的预测。Google DeepMind...
阅读原文

Science重磅:1分钟内生成10天气象预报,DeepMind AI击败了全球最好预报系统

在天气预报方面,人工智能(AI)颠覆了传统方法,有望以更快的速度和更低的成本实现更准确的预测。Google DeepMind 推出的一款基于机器学习的天气预测模型——G...
阅读原文

大模型架构创新已死?

三石 白交发自 凹非寺量子位 | 公众号 QbitAI一场围绕大模型自研和创新的讨论,这两天在技术圈里炸了锅。起初,前阿里技术VP贾扬清,盆友圈爆料吐槽:有大厂...
阅读原文

后门准确率降至3%,主任务性能几乎不变!华工JHU提出全新「联邦学习后门攻击识别」解决方案|ICCV2023

新智元报道编辑:LRS【新智元导读】无惧联邦学习中的后门攻击!全新解决方案利用多指标和动态加权来自适应地识别后门,在难度最高的Edge-case PGD中,后门准...
阅读原文

斯坦福提出对比偏好学习:无需强化学习即可从人类反馈中学习

机器之心报道编辑:Panda W我们知道,ChatGPT 的成功离不开 RLHF 这个「秘密武器」。不过 RLHF 并不是完美无缺的,存在难以处理的优化难题。本文中,斯坦福大...
阅读原文

舍弃99%的参数,还能达到相同的性能!阿里团队发现大模型「合二为一」的黑魔法!而且不用GPU,不需重新训练

夕小瑶科技说 原创作者 | 小戏、Python动漫《龙珠》里,构想了一种“美达摩星人融合术”,通过融合术舞步就可以让譬如悟空与贝吉塔合体,成为“究极超强合体战士...
阅读原文

让大模型自主探索开放世界,北大&智源提出训练框架LLaMA-Rider

机器之心专栏机器之心编辑部大语言模型因其强大而通用的语言生成、理解能力,展现出了成为通用智能体的潜力。与此同时,在开放式的环境中探索、学习则是通用...
阅读原文