标签：上下文

谷歌Gemini 1.5模型来了！突破100万个tokens，能处理1小时视频【附58页技术报告】

一次能处理1小时视频、11小时音频、超过3万行代码。编译|ZeR0 编辑|漠影智东西2月16日报道，谷歌昨夜发布其大模型矩阵的最新力作——Gemini 1.5，并将上下文...

阅读原文

AIGC动态

2年前 (2024)

谷歌Gemini1.5重磅上线：最强MoE架构，100万上下文

文章转载自「机器之心」今天，谷歌宣布推出 Gemini 1.5。Gemini 1.5 建立在谷歌基础模型开发和基础设施的研究与工程创新的基础上，包括通过新的专家混合 (MoE...

阅读原文

AIGC动态

2年前 (2024)

谷歌Gemini1.5火速上线：MoE架构，100万上下文

机器之心报道机器之心编辑部今天，谷歌宣布推出 Gemini 1.5。 Gemini 1.5 建立在谷歌基础模型开发和基础设施的研究与工程创新的基础上，包括通过新的专家混...

阅读原文

AIGC动态

2年前 (2024)

谷歌发布Gemini 1.5，多项指标碾压ChatGPT

点击上方蓝字关注我们谷歌发布了Gemini 1.5，AI模型系列的重大更新，拥有史无前例的大型上下文长度。Gemini 1.5采用新的MoE架构，效率更高。Gemini 1.5 Pro性...

阅读原文

AIGC动态

2年前 (2024)

谷歌Gemini 1.5深夜上线，史诗级多模态硬刚GPT-5！最强MoE首破100万极限上下文纪录

新智元报道编辑：好困 Aeneas 【新智元导读】刚刚，我们经历了LLM划时代的一夜。谷歌又在深夜发炸弹，Gemini Ultra发布还没几天，Gemini 1.5就来了。卯足劲和...

阅读原文

AIGC动态

2年前 (2024)

陶哲轩看了都直呼内行！谷歌等用LLM自动证明定理拿顶会杰出论文，上下文越全证得越好

新智元报道编辑：alan 【新智元导读】在软件工程顶会ESEC/FSE上，来自马萨诸塞大学、谷歌和伊利诺伊大学厄巴纳-香槟分校（UIUC）的研究人员发表了新的成果，...

阅读原文

AIGC动态

2年前 (2024)

击败OpenAI，权重、数据、代码全开源，能完美复现的嵌入模型Nomic Embed来了

机器之心报道编辑：陈萍、小舟模型参数量只有 137M，5 天就能训练好。一周前，OpenAI 给广大用户发放福利，在下场修复 GPT-4 变懒的问题后，还顺道上新了 5 ...

阅读原文

AIGC动态

2年前 (2024)

匿名论文提出奇招！增强大模型长文本能力居然还能这么做

丰色发自凹非寺量子位 | 公众号 QbitAI一提到提高大模型长文本能力，就想到长度外推或者上下文窗口扩展？不行，这些都太费硬件资源了。来看一个奇妙新解...

阅读原文

AIGC动态

2年前 (2024)

英伟达新对话QA模型准确度超GPT-4，却遭吐槽：无权重代码意义不大

机器之心报道编辑：大盘鸡、杜伟昨天，Meta、纽约大学的研究者用「自我奖励方法」，让大模型自己生成自己的微调数据，从而在 Llama 2 70B 的迭代微调后超越...

阅读原文

AIGC动态

2年前 (2024)

大模型笔记！以LLAMA为例，快速入门LLM的推理过程

直播预告 | 下周一晚7点，「自动驾驶新青年讲座」第35讲正式开讲，LMDrive一作、香港中文大学MMLab在读博士邵昊将主讲《LMDrive：大语言模型加持的闭环端到端...

阅读原文

AIGC动态

2年前 (2024)

Stability AI开年首个大模型：专写代码，支持18种编程语言，上下文100K，苹果笔记本离线就能跑

西风发自凹非寺量子位 | 公众号 QbitAIStability AI开年第一个大模型来了！名为Stable Code 3B，参数27亿，专为写代码而生。 Stable Code 3B可理解处理18...

阅读原文

AIGC动态

2年前 (2024)

详解！大语言模型中的检索增强生成RAG技术

直播预告 | 1月17日晚7点，「多模态大模型线上闭门会」正式开讲！阿里巴巴通义实验室 NLP 高级算法专家严明参与出品，携手刘兆洋、李彦玮、文束三位青年学者...

阅读原文

AIGC动态

2年前 (2024)

港中文在读博士李彦玮：LLaMA-VID: 专注于长视频理解的视觉语言大模型

1月17日晚7点，智猩猩推出「多模态大模型线上闭门会」。本次闭门会由阿里巴巴通义实验室 NLP 高级算法专家严明参与出品，并聚焦于大语言模型工具调用 Control...

阅读原文

AIGC动态

2年前 (2024)

阿里与上交大提出 LLM 长文本计算新解法：可处理文本长达 1900k 字节、效率提升 2.4 倍

DistAttention与DistKV-LLM结合，带来云端自然语言处理新变革。编译 | 郭思编辑丨陈彩娴在实际应用大模型的过程中，尤其是处理长文本的上下文信息时，如何...

阅读原文

AIGC动态

2年前 (2024)

开发速率飙升20倍！GPT Pilot明星项目登Github热榜，从0开始构建AI

新智元报道编辑：桃子【新智元导读】开发者的效率倍增工具来了。AI开发者伴侣GPT Pilot可以让95%的开发者实现自动编码。又一个明星项目诞生了！ GPT Pilot，...

阅读原文

AIGC动态

2年前 (2024)

1…8 91011 12…15