标签:实时数据分析

Step-R1-V-Mini

Step-R1-V-Mini 是阶跃星辰最新推出的多模态推理模型。支持图文输入和文字输出,具备良好的指令遵循和通用能力,能高精度感知图像完成复杂推理任务。模型在视...
阅读原文

SkyReels-A2

SkyReels-A2是昆仑万维推出的可控视频生成框架,支持根据文本提示将任意视觉元素(如人物、物体、背景)组合成合成视频,严格保持与每个元素的参考图像的一致...

DeepSeek-GRM

DeepSeek-GRM是DeepSeek和清华大学研究者共同提出的通用奖励模型(Generalist Reward Modeling)。通过点式生成式奖励建模(Pointwise Generative Reward Mod...
阅读原文

rabbitOS intern

rabbitOS Intern 由 AI 初创公司 rabbit inc. 推出的 AI 原生操作系统。通过协调多个智能代理(agents)来完成复杂任务,展现出类似实习生水平的人类能力。用...

Amodal3R

Amodal3R 是条件式 3D 生成模型,能从部分可见的 2D 物体图像中推测并重建完整的 3D 形态和外观。模型基于“基础”3D 生成模型 TRELLIS 构建,通过引入掩码加权...
阅读原文

cpmGO

cpmGO (小钢炮超级助手)是面壁智能推出的全球首个纯端侧智能助手,专为汽车智能座舱设计。cpmGO 基于面壁小钢炮MiniCPM 端侧模型开发,具备视觉、语音、多...
阅读原文

OmniSQL

OmniSQL 是开源的文本到 SQL 模型,将自然语言问题高效转换为 SQL 查询语句。通过创新的数据合成框架生成了首个百万量级的文本到 SQL 数据集 SynSQL-2.5M,包...
阅读原文

RoboOS

RoboOS是智源研究院推出的首个跨本体具身大小脑协作框架。基于“大脑-小脑”分层架构,具身大脑RoboBrain负责全局感知与决策,小脑技能库负责低延迟精准执行,...
阅读原文

Vidu Q1

Vidu Q1 是清华大学人工智能研究院副院长、生数科技创始人兼首席科学家朱军教授团队推出的高可控视频大模型。在多主体细节可控、音效同步可控、画质增强等方...
阅读原文

Ideogram 3.0

Ideogram 3.0 是Ideogram推出的 AI 图像生成模型。Ideogram 3.0在图像生成质量上实现飞跃,具备高度的真实感、出色的文本渲染和强大的语言理解能力,支持生成...
阅读原文

Wispr Flow

Wispr Flow 是AI语音转文本工具,基于先进的AI技术,帮助用户在任何应用程序中实现快速语音转文字。Wispr Flow支持100多种语言,具备自动编辑、上下文感知和...
阅读原文

UniFluid

UniFluid 是谷歌 DeepMind 和麻省理工学院联合推出的,统一的自回归框架,用在联合视觉生成和理解任务。基于连续视觉标记处理多模态图像和文本输入,生成离散...
阅读原文

Skywork R1V

Skywork R1V是昆仑万维开源的首款工业界多模态思维链推理模型,具备强大的视觉链式推理能力。Skywork R1V能对视觉输入进行多步逻辑推理,解决复杂的视觉任务...
阅读原文

Command A

Command A 是 Cohere 推出的最新生成式 AI 模型,专为企业级应用设计。Command A用高性能和低硬件成本为核心优势,能在两块 GPU 上高效部署,相比其他类似模...
阅读原文

Evolving Agents

Evolving Agents 是用在创建、管理和进化 AI 代理的生产级框架。Evolving Agents支持智能代理之间的通信和协作,根据语义理解需求、基于过往经验进化,有效解...
阅读原文
1234511