MiniMax M2.5
M2.5 是MiniMax推出的10B激活参数轻量级旗舰大模型,主打编程与Agentic能力。模型支持100 TPS超高推理速度(约为Claude Opus 3倍),支持 10+ (Go、Rust、Ko...
Gemini 3 Deep Think
Gemini 3 Deep Think 是 Google DeepMind 推出的专用推理模型,主打深度科学推理与复杂问题解决。模型在 ARC-AGI-2 基准达 84.6%,远超同类模型。
GPT‑5.3‑Codex‑Spark
GPT-5.3-Codex-Spark是OpenAI首个专为实时编程设计的轻量级模型,主打极致速度。模型运行在Cerebras WSE-3晶圆级芯片上,推理速度超1000 tokens/秒,支持128k...
MiniCPM-SALA
MiniCPM-SALA是面壁智能开源的9B端侧大模型,采用创新的SALA(稀疏-线性混合注意力)架构,75%线性注意力负责全局高效建模,用25%稀疏注意力精准捕捉关键信息...
Ming‑Flash‑Omni 2.0
Ming-flash-omni-2.0是蚂蚁集团开源的全模态大模型,采用100B总参数/6B激活参数的MoE架构。作为业界SOTA开源omni-MLLM,模型统一支持图像、视频、音频、文本...
Composer 1.5
Composer 1.5是Cursor推出的自研AI编程模型,通过将强化学习规模扩大20倍训练而成。模型是"思考型"模型,能动态生成思考token推理代码库,支持简单...
HY-1.8B-2Bit
HY-1.8B-2Bit是腾讯混元推出的首个产业级2Bit端侧大模型,模型基于1.8B模型经量化感知训练(QAT)压缩推出。HY-1.8B-2Bit等效参数量仅0.3B,大小仅300MB,内...
粤公网安备 44011502001135号