多模态 - OpenI

多模态

跃问（阶跃星辰）

阶跃星辰多模态 AI 助手

ArkClaw

火山引擎出品的火山版小龙虾，7×24在线专属智能伙伴

FlowMuse AI

节点式AI视觉创作引擎

TRAE-AI编程

AI辅助编程，代码自动修复

Fotol AI是强大AI解决方案的终极中心，提供AGI技术和服务。

一个强大的统一多模态模型，支持文本到图像生成及图像编辑。

OneReach.ai

OneReach是一个用于创建高级多模态AI代理的平台，旨在提升员工和客户体验。

革命性的AI图像编辑与生成技术，结合了文字指令和视觉语境，实现精准编辑和风格转移。

腾讯混元游戏

腾讯发布的混元游戏视觉生成平台，这是依托混元大模型打造的首个工业级AIGC游戏内容生产引擎，可以优化游戏资产生成与游戏制作流程。腾讯混元游戏官网入口网址

InternVL3开源：7种尺寸覆盖文、图、视频处理，多模态能力扩展至工业图像分析

字节跳动AI编程助手，中文界面，代码智能生成

悠码 Yoma.cn

字节跳动旗下AI编程工具悠码（Yoma）

aicnn综合智能平台

领先AI智能聚合平台，助您高效办公，事半功倍。

Trae中文版

字节跳动推出免费AI编程IDE，协作提升效率，加速项目交付。

Gemini 2.5 是谷歌最智能的 AI 模型，具备推理能力。

Trae（中文版）

Trae是字节跳动推出的国内首款AI原生IDE，集成Claude3.5与GPT-4o两款顶尖AI模型，专为中文开发场景设计，将AI深度集成于IDE环境，带来更流畅、准确的开发体验。

一站式AI聚合平台

Doubao-1.5-pro

Doubao-1.5-pro 是一个高性能的稀疏 MoE 大语言模型，专注于推理性能与模型能力的极致平衡。

MNN 大模型 Android App

一款支持多模态功能的全功能大语言模型安卓应用。

CUA 是一种能够通过图形界面与数字世界交互的通用接口。

OpenAI Agents SDK

OpenAI Agents SDK 是一个用于构建自主智能体的开发工具包，简化多智能体工作流的编排。

OmniHuman-1

OmniHuman-1 是一种基于单张人像和运动信号生成人类视频的多模态框架。

CLaMP 3 是一个用于跨模态和跨语言音乐信息检索的统一框架。

Kimi k1.5 是一个通过强化学习扩展的多模态语言模型，专注于提升推理和逻辑能力。

Gemini 2.0 Family

Gemini 2.0 是谷歌推出的最新一代生成式 AI 模型，包含 Flash、Flash-Lite 和 Pro 版本。

DeepSeek Japanese

DeepSeek 是一款先进的 AI 语言模型，擅长逻辑推理、数学和编程任务，提供免费使用。

VideoLLaMA3

VideoLLaMA3是前沿的多模态基础模型，专注于图像和视频理解。

Janus-Pro-1B

Janus-Pro-1B 是一个统一多模态理解和生成的自回归框架。

Qwen2.5-VL 是一款强大的视觉语言模型，能够理解图像和视频内容并生成相应文本。

UniTok是一个用于视觉生成和理解的统一视觉分词器。

EgoLife是一个长期、多模态、多视角的日常生活AI助手项目，旨在推进长期上下文理解研究。

OmAgent.com

一个用于智能设备等的多模态原生代理框架。

12 3 4