标签:自然语言处理

GLM-Z1-32B

GLM-Z1-32B是智谱公司开源的新一代推理模型,具体参数版本为GLM-Z1-32B-0414 。GLM-Z1-32B基于 GLM-4-32B-0414 基座模型开发,基于深度优化训练,在数学、代...
阅读原文

可灵2.0

可灵2.0是快手推出的新一代 AI 视频生成模型,现已上线可灵AI视频平台。平台更新包含可灵2.0(大师版)和可图2.0两大基础模型。可图2.0大幅提升图片生成质量...
阅读原文

Agent Development Kit

Agent Development Kit(ADK)是谷歌开源的首个AI智能体开发工具包,是一个代码优先的Python工具包,简化复杂AI代理的构建、评估和部署过程。ADK支持多智能体...
阅读原文

Skywork-OR1

Skywork-OR1(Open Reasoner 1)是昆仑万维推出的开源高性能推理模型系列,模型突破大模型在逻辑推理和复杂任务求解方面的能力瓶颈。Skywork-OR1包含三款模型,...
阅读原文

UNO

UNO是字节跳动推出创新的AI图像生成框架,突破传统模型在多主体生成中的局限。通过“少到多”的泛化方法,能高质量地生成单主体和多主体图像,解决了多主体场景...
阅读原文

Pika Twists

Pika Twists 是 Pika Labs 推出的 AI 视频编辑功能,能让用户轻松修改视频中的主体动作和场景,创造出奇幻效果。只需上传视频并描述需求,AI 可精准操控角色...
阅读原文

Multi-SWE-bench

Multi-SWE-bench 是字节跳动豆包大模型团队开源的首个多语言代码修复基准。在SWE-bench基础上,首次覆盖Python之外的7种主流编程语言,包括Java、TypeScript...
阅读原文

Gemini 2.5 Flash

Gemini 2.5 Flash 是 Google 推出的高效、低延迟的 AI 模型,基于 Gemini 2.5 模型构建。Gemini 2.5 Flash在保持低延迟和成本效益的同时,引入思考能力。
阅读原文

A2A

A2A(Agent2Agent)是谷歌开源的首个标准智能体交互协议,让不同框架和供应商构建的AI智能体相互协作。A2A基于标准化的通信方式,打破系统孤岛,让智能体安全...
阅读原文

Llama Nemotron

Llama Nemotron是NVIDIA推出的一系列推理模型,专注于推理和多种智能代理(agentic AI)任务。模型基于Llama开源模型,经过NVIDIA的后训练,加入推理能力,在...
阅读原文

DeepCoder-14B-Preview

DeepCoder-14B-Preview 是 Agentica 和 Together AI 联合开源的大型代码生成模型,基于 Deepseek-R1-Distilled-Qwen-14B 微调而成。DeepCoder-14B-Preview基...
阅读原文

Step-R1-V-Mini

Step-R1-V-Mini 是阶跃星辰最新推出的多模态推理模型。支持图文输入和文字输出,具备良好的指令遵循和通用能力,能高精度感知图像完成复杂推理任务。模型在视...
阅读原文

口语精灵

口语精灵是AI口语学习软件,通过先进的人工智能技术和真人语音模拟,为用户提供1V1的对话练习体验。用户可以随时随地与AI老师互动,跨越国界,学习不同地区的...
阅读原文

ACTalker

ACTalker 是用于生成逼真说话人头部视频的端到端视频扩散框架。支持单信号或多信号控制,如音频、表情等。核心架构包括并行 Mamba 结构,通过多个分支利用不...
阅读原文

Quasar Alpha

Quasar Alpha 是 OpenRouter 发布的预发布版 AI 模型。拥有 100 万 token 的超大上下文窗口,可处理超长文本和复杂文档。代码生成能力出色,生成速度快,延迟...
阅读原文
18910111220,397