标签:序列
LLM 的推理优化技术纵览
作者简介作者:紫气东来原文:https://zhuanlan.zhihu.com/p/642412124转载者:杨夕【LLMs九层妖塔】: https://github.com/km1994/LLMsNineStoryDemonTower推...
字节跳动李航:对语言大模型的若干观察和思考
机器之心专栏作者:ByteDance Research负责人李航本文阐述笔者对 LLM 的一些看法,主要观点如下:ChatGPT 的突破主要在于规模带来的质变和模型调教方式的发明...
别再「浪费」GPU了,FlashAttention重磅升级,实现长文本推理速度8倍提升
机器之心报道机器之心编辑部处理小说、法律文件等长文本是大模型的一个重要应用方向,但也面临速度上的挑战。FlashAttention 作者 Tri Dao 等人提出的「Flash...
用暂停token重新训练大模型,AI学会三思而后行
梦晨 发自 凹非寺量子位 | 公众号 QbitAI让ChatGPT给出答案之前多想想步骤,就能提高准确率。那么能不能省去提示词,直接把这种能力内化在大模型里呢?CMU与...
将专家知识与深度学习结合,清华团队开发DeepSEED进行高效启动子设计
将 ScienceAI设为星标第一时间掌握新鲜的 AI for Science 资讯编辑 | 萝卜皮设计具有所需特性的启动子在合成生物学中至关重要。人类专家擅长识别小样本中的强...
基于牛顿求根法,新算法实现并行训练和评估RNN,带来超10倍增速
机器之心报道编辑:Panda W人们普遍认为 RNN 是无法并行化的,因为其本质上的序列特性:其状态依赖于前一状态。这使得人们难以用长序列来训练 RNN。近日,一...
利用进化扩散进行蛋白生成,微软开源新型蛋白质生成AI框架EvoDiff
将 ScienceAI设为星标第一时间掌握新鲜的 AI for Science 资讯编辑| 紫罗进化产生了多种功能蛋白,可以精确调节细胞过程。近年来出现了深度生成模型,旨在从...
顶尖科学家如何玩转AI?DeepSpeed4Science:利用先进的AI系统优化技术实现科学发现
新智元报道编辑:LRS 好困【新智元导读】AI助力科学发现,DeepSpeed4Science计划引领新时代技术突破!在接下来的十年中,深度学习可能会彻底改变自然科学,增...
LLM吞吐量提高2-4倍,模型越大效果越好!UC伯克利、斯坦福等开源高效内存管理机制PagedAttention
新智元报道编辑:LRS【新智元导读】吞吐量上不去有可能是内存背锅!无需修改模型架构,减少内存浪费就能提高吞吐量!虽然大型语言模型(LLM)的性能表现足够...
6.7k Star量的vLLM出论文了,让每个人都能轻松快速低成本地部署LLM服务
机器之心专栏编辑:Panda利用操作系统的虚拟内存管理方法来提升LLM推理吞吐量。今年六月,来自加州大学伯克利分校等机构的一个研究团队开源了(目前已有 6700...
扩散模型新应用——微软推出蛋白质生成框架EvoDiff
夕小瑶科技说 原创作者 | 谢年年最近,微软推出了一个名为EvoDiff的通用框架,据称它可以根据蛋白质序列生成“高保真度”和“多样性”的蛋白质。这项技术的意义非...
Science重磅:Google DeepMind又一突破,AI成功预测上千万“错义突变”,有望解决人类遗传学难题
大数据文摘受权转载自学术头条作者:闫一米编辑:学术君人工智能(AI)有望解决人类遗传学中的最大挑战之一。刚刚,来自 Google DeepMind 的研究团队基于 A...
ChatGPT启发,谷歌DeepMind预测7100万基因突变!AI破译人类基因遗传密码登Science
新智元报道编辑:编辑部【新智元导读】AlphaFold之后,谷歌DeepMind再次震撼发布AI模型AlphaMissense,成功预测7100万「错义突变」,有望攻克人类遗传学难题...
哈佛、哥大开源1600万组蛋白质序列,解决AlphaFold 2训练数据私有难题!
新智元报道编辑:Aeneas【新智元导读】这个叫OpenProteinSet的开源数据集,提供1600万个开源蛋白质多序列对齐(MSA)和相关数据。它涵盖了所有蛋白质数据库的...