标签:上下文
谷歌Gemini 1.5模型来了!突破100万个tokens,能处理1小时视频【附58页技术报告】
一次能处理1小时视频、11小时音频、超过3万行代码。 编译|ZeR0 编辑|漠影 智东西2月16日报道,谷歌昨夜发布其大模型矩阵的最新力作——Gemini 1.5,并将上下文...
谷歌Gemini1.5重磅上线:最强MoE架构,100万上下文
文章转载自「机器之心」今天,谷歌宣布推出 Gemini 1.5。Gemini 1.5 建立在谷歌基础模型开发和基础设施的研究与工程创新的基础上,包括通过新的专家混合 (MoE...
谷歌Gemini1.5火速上线:MoE架构,100万上下文
机器之心报道 机器之心编辑部今天,谷歌宣布推出 Gemini 1.5。 Gemini 1.5 建立在谷歌基础模型开发和基础设施的研究与工程创新的基础上,包括通过新的专家混...
谷歌发布Gemini 1.5,多项指标碾压ChatGPT
点击上方蓝字关注我们谷歌发布了Gemini 1.5,AI模型系列的重大更新,拥有史无前例的大型上下文长度。Gemini 1.5采用新的MoE架构,效率更高。Gemini 1.5 Pro性...
谷歌Gemini 1.5深夜爆炸上线,史诗级多模态硬刚GPT-5!最强MoE首破100万极限上下文纪录
新智元报道编辑:好困 Aeneas 【新智元导读】刚刚,我们经历了LLM划时代的一夜。谷歌又在深夜发炸弹,Gemini Ultra发布还没几天,Gemini 1.5就来了。卯足劲和...
陶哲轩看了都直呼内行!谷歌等用LLM自动证明定理拿顶会杰出论文,上下文越全证得越好
新智元报道编辑:alan 【新智元导读】在软件工程顶会ESEC/FSE上,来自马萨诸塞大学、谷歌和伊利诺伊大学厄巴纳-香槟分校(UIUC)的研究人员发表了新的成果,...
击败OpenAI,权重、数据、代码全开源,能完美复现的嵌入模型Nomic Embed来了
机器之心报道 编辑:陈萍、小舟模型参数量只有 137M,5 天就能训练好。一周前,OpenAI 给广大用户发放福利,在下场修复 GPT-4 变懒的问题后,还顺道上新了 5 ...
匿名论文提出奇招!增强大模型长文本能力居然还能这么做
丰色 发自 凹非寺量子位 | 公众号 QbitAI一提到提高大模型长文本能力,就想到长度外推或者上下文窗口扩展? 不行,这些都太费硬件资源了。 来看一个奇妙新解...
英伟达新对话QA模型准确度超GPT-4,却遭吐槽:无权重代码意义不大
机器之心报道 编辑:大盘鸡、杜伟昨天,Meta、纽约大学的研究者用「自我奖励方法」,让大模型自己生成自己的微调数据,从而在 Llama 2 70B 的迭代微调后超越...
大模型笔记!以LLAMA为例,快速入门LLM的推理过程
直播预告 | 下周一晚7点,「自动驾驶新青年讲座」第35讲正式开讲,LMDrive一作、香港中文大学MMLab在读博士邵昊将主讲《LMDrive:大语言模型加持的闭环端到端...
Stability AI开年首个大模型:专写代码,支持18种编程语言,上下文100K,苹果笔记本离线就能跑
西风 发自 凹非寺量子位 | 公众号 QbitAIStability AI开年第一个大模型来了! 名为Stable Code 3B,参数27亿,专为写代码而生。 Stable Code 3B可理解处理18...
详解!大语言模型中的检索增强生成RAG技术
直播预告 | 1月17日晚7点,「多模态大模型线上闭门会」正式开讲!阿里巴巴通义实验室 NLP 高级算法专家严明参与出品,携手刘兆洋、李彦玮、文束三位青年学者...
港中文在读博士李彦玮:LLaMA-VID: 专注于长视频理解的视觉语言大模型
1月17日晚7点,智猩猩推出「多模态大模型线上闭门会」。本次闭门会由阿里巴巴通义实验室 NLP 高级算法专家严明参与出品,并聚焦于大语言模型工具调用 Control...
阿里与上交大提出 LLM 长文本计算新解法:可处理文本长达 1900k 字节、效率提升 2.4 倍
DistAttention与DistKV-LLM结合,带来云端自然语言处理新变革。编译 | 郭 思 编辑丨陈彩娴 在实际应用大模型的过程中,尤其是处理长文本的上下文信息时,如何...
开发速率飙升20倍!GPT Pilot明星项目登Github热榜,从0开始构建AI
新智元报道编辑:桃子 【新智元导读】开发者的效率倍增工具来了。AI开发者伴侣GPT Pilot可以让95%的开发者实现自动编码。又一个明星项目诞生了! GPT Pilot,...