标签:方法

舍弃99%的参数,还能达到相同的性能!阿里团队发现大模型「合二为一」的黑魔法!而且不用GPU,不需重新训练

夕小瑶科技说 原创作者 | 小戏、Python动漫《龙珠》里,构想了一种“美达摩星人融合术”,通过融合术舞步就可以让譬如悟空与贝吉塔合体,成为“究极超强合体战士...
阅读原文

让大模型自主探索开放世界,北大&智源提出训练框架LLaMA-Rider

机器之心专栏机器之心编辑部大语言模型因其强大而通用的语言生成、理解能力,展现出了成为通用智能体的潜力。与此同时,在开放式的环境中探索、学习则是通用...
阅读原文

大模型落地最后一公里:111页全面综述大模型评测

机器之心专栏机器之心编辑部当前,大模型正凭借其强大的能力和无限的潜力引领着新一轮技术革命,众多科技巨头纷纷围绕大模型进行布局,进一步推动大模型不断...
阅读原文

AI生图太诡异?马里兰&NYU合力解剖神经网络,CLIP模型神经元形似骷髅头

新智元报道编辑:桃子【新智元导读】神经网络黑盒怎么解释?马里兰大学和NYU研究人员开启了新的尝试。AI黑盒如何才能解?神经网络模型在训练的时,会有些ReLU...
阅读原文

单点端到端文本检测识别框架速度提升19倍!华科、华南理工等联合发布SPTS v2

新智元报道编辑:LRS 好困【新智元导读】单点文本框标注,成本显著降低;将检测和识别解耦,并行解码提升自回归速度。近年来,场景文本阅读(Text Spotting)...
阅读原文

MetaAI提出全新验证链框架,大模型通过“三省吾身”缓解幻觉现象

大数据文摘授权转载自将门创投作者:seven_曾子曰:“吾日三省吾身”–出自《论语·学而》时至今日,生成幻觉(hallucination)仍然是大模型研究界中一个令人非常...
阅读原文

苹果文生图大模型亮相:俄罗斯套娃式扩散,支持1024×1024分辨率

机器之心报道编辑:杜伟、小舟习惯了 Stable Diffusion,如今终于又迎来一个俄罗斯套娃式(Matryoshka)Diffusion 模型,还是苹果做的。在生成式 AI 时代,扩...
阅读原文

最好7B模型再易主!打败700亿LLaMA2,苹果电脑就能跑|开源免费

西风 发自 凹非寺量子位 | 公众号 QbitAI花500刀“调教”的70亿参数模型,打败700亿参数的Llama 2!且笔记本就能轻松跑,效果媲美ChatGPT。重点:免费、不要钱...
阅读原文

2秒出图的文生图模型出现了!清华提出LCM,新一代图像生成里程碑

夕小瑶科技说 原创作者 | ZenMoore前言你是否用过 Midjourney 或者 DALL·E 3 来生成图像?你是否为生成一张图片要等几十秒甚至几分钟而发愁?你是否盯着图像...
阅读原文

生成的分子几乎 100% 有效,用于逆向分子设计的引导扩散模型

将 ScienceAI设为星标第一时间掌握新鲜的 AI for Science 资讯编辑 | 绿萝「从头分子设计」是材料科学的「圣杯」。生成深度学习的引入极大地推进了这一方向,...
阅读原文

马斯克的AI第一枪,被华人科学家大将打响!xAI首个研究成果:训练无限深度神经网络

大数据文摘受权转载自头部科技文 | Congerry几个月前,马斯克通过 Twitter 宣布自己的人工智能公司xAI正式成立:成立一家 xAI 公司去了解宇宙的真实本质。当...
阅读原文

1/10体量达到SOTA!谷歌发布5B参数视觉语言模型PaLI-3,更小更快却更强

新智元报道编辑:贝果 润【新智元导读】谷歌研究院和DeepMind研究人员推出最新PaLI-3视觉语言模型(VLM),模型以更小、更快、更强的特点获得大部分研究人员...
阅读原文

狂揽4k star,AI通过强化学习玩宝可梦,两万场后成功拿下

机器之心报道编辑:大盘鸡AI 的宝可梦之旅。是不是说起「口袋妖怪」,你就不困了?「口袋妖怪」是「宝可梦」的非官方译名。从 1996 年至今,它可以被分为数个...
阅读原文

LLM 的推理优化技术纵览

作者简介作者:紫气东来原文:https://zhuanlan.zhihu.com/p/642412124转载者:杨夕【LLMs九层妖塔】: https://github.com/km1994/LLMsNineStoryDemonTower推...
阅读原文

DeepMind让大模型学会归纳和演绎,GPT-4准确率提升13.7%

机器之心报道机器之心编辑部当前,大型语言模型(LLM)在推理任务上表现出令人惊艳的能力,特别是在给出一些样例和中间步骤时。然而,prompt 方法往往依赖于 ...
阅读原文
11415161718