LongCat-2.0-Preview

LongCat-2.0-Preview – 美团推出的万亿参数级大模型预览版

美团近日揭开了其万亿参数级大模型 LongCat-2.0-Preview 的神秘面纱，这标志着在国产大模型领域迈出了重要一步。这款预览版模型不仅在参数规模上达到了惊人的 1.6T，更在技术架构和应用能力上展现出强大的实力。

LongCat-2.0-Preview 概览

LongCat-2.0-Preview 是美团倾力打造的大模型预览版，其核心亮点在于采用了混合专家（MoE）架构，使得总参数量高达 1.6 万亿，但单次计算激活的参数量仅为约 480 亿。这一设计显著提高了计算效率。模型最引人注目的能力是其超长上下文处理能力，能够支持高达 100 万（1M）token 的输入，堪比处理整本书籍或庞大的代码库。值得一提的是，LongCat-2.0-Preview 的全流程训练与推理均在5-6 万张国产加速卡上完成，英伟达算力占比为零，这在业内尚属首次，成功打通了国产芯片上万亿级大模型训推的闭环。目前，该模型已启动内测，并每日提供 1000 万的免费 Token 额度供用户体验。

LongCat-2.0-Preview 的核心功能亮点

卓越的长文本洞察力：1M token 的超长上下文窗口，让模型能够深入理解整本书籍、海量代码集或冗长的报告，从中提取关键信息。
精湛的代码生成与分析：得益于 MoE 架构对专家网络的精准调度，模型在编程任务、数学推理以及遵循复杂指令方面表现出稳定可靠的性能。
高效的多轮对话与信息检索：通过引入稀疏注意力机制，模型能够快速在漫长的对话历史中定位相关信息，有效减少重复计算，提升交互效率。
全面的多模态内容解析：结合美团在本地生活服务领域的深厚积累，模型能够深度解析复杂的业务文档以及图文混排内容，提供更丰富的理解。

LongCat-2.0-Preview 的技术基石

MoE（混合专家）精妙架构：1.6T 的总参数量中，每次计算仅激活约 48B 参数，通过智能的门控路由机制动态选择最合适的专家模块，大幅降低了推理的计算负担。
N-gram Embedding 优化：将部分专家层参数提前至 Embedding 层，引入了词组级别的建模能力，使得高频的语言模式能够被直接匹配，从而减少了逐层计算的需求。
稀疏注意力与跨层流感知索引：采用轻量化的稀疏注意力机制，并辅以跨层语义路径索引，有效规避了全量 O(n²) 的 Attention 计算，确保了在 1M 上下文下的推理延迟处于可控范围。
自研确定性算子：为了适配国产芯片生态，模型团队自主研发了 FlashAttention 反向梯度（FAG）、Scatter 类算子以及 GEMM 模块，将性能损耗控制在 5% 以内，保证了万卡集群长期训练的可复现性。
显存与通信效率的极致追求：借助 V-ZB 算法，将训练峰值显存压缩至 60GB 以下。同时，重构了专家并行（EP）、张量并行（TP）与流水线并行（PP）策略，以适应国产芯片在带宽和显存方面的约束。

如何体验 LongCat-2.0-Preview

申请内测资格：访问 LongCat 开放平台官网，点击内测申请入口，填写必要信息后提交审核。
静候审核结果：团队将对申请进行严格审核，通过后将通过邮件或短信通知您获得使用权限。
登录平台领取额度：使用审核通过的账号登录 LongCat 平台，系统将自动为您发放每日 1000 万 Token 的免费使用额度。
选择您的接入方式：您可以直接通过 Web 界面进行交互体验，或者根据提供的文档指引获取 API Key，将模型集成到您自己的应用或工作流程中。
开启长文本任务之旅：在对话框或 API 请求中输入您的长文档、代码库或复杂指令，模型将充分利用其 1M 上下文窗口和 MoE 专家网络进行推理，并迅速返回结果。

LongCat-2.0-Preview 的关键信息与使用要求

模型名称：LongCat-2.0-Preview
发布机构：美团 / LongCat 团队
模型架构：MoE，总参数量约 1.6T，激活参数量约 48B
上下文窗口：100 万（1M）token
算力基础：5–6 万张国产加速卡，实现训推全流程国产化
使用阶段：内测邀请制，需申请资格
免费额度：每日 1000 万 Token
硬件要求：用户端无需配置特殊硬件，通过云端 API 或 Web 界面即可调用

LongCat-2.0-Preview 的独特优势

完全自主可控的国产化：从模型训练到推理，完全基于国产芯片，彻底摆脱了对英伟达 CUDA 生态的依赖，有力证明了国产算力足以支撑顶级大模型的开发与运行。
业界领先的超长文本处理能力：1M 的上下文窗口结合创新的稀疏注意力机制，在处理长篇文档分析、视频脚本理解等任务时，展现出无与伦比的优势。
优化的推理成本：MoE 架构仅激活少量专家，N-gram Embedding 进一步削减了计算量，使得单位任务的推理成本远低于传统的稠密模型。
强大的工程稳定性：通过自研的确定性计算以及多层容错恢复体系，模型在万卡级国产集群上实现了长周期的稳定运行，其故障定位与复现能力已达到国际先进水平。
深厚的开源基因：LongCat 团队此前已成功开源了 Flash、Video、Image、AudioDiT 等多个重要项目，预计 LongCat-2.0 版本也将延续其开放共享的传统。

LongCat-2.0-Preview 与同类竞品之比较

对比维度	LongCat-2.0-Preview	DeepSeek-V4
发布方	美团	DeepSeek
总参数量	约 1.6T	万亿级
激活参数	约 48B	未公开具体数值
上下文窗口	1M	1M
训练算力	5–6 万张国产卡，全流程国产化	英伟达 GPU 训练，国产平台推理首发
架构特色	N-gram Embedding + 稀疏注意力	MLA + MoE
国产自主程度	训推全流程国产化，英伟达含量为 0	训练依赖英伟达，推理可跑国产芯片
开源策略	大概率延续开源	已开源
使用成本	内测阶段每日 1000 万免费 Token	V4 Flash 0.02 元/百万 Tokens，V4 Pro 0.025 元/百万 Tokens
生态定位	验证国产算力上限，深耕本地生活场景	极致性价比，服务广泛开发者