AI工具

Maya1

Maya1 是 Maya Research 团队推出的开源语音模型,专为生成富有情感的语音而设计。模型通过自然语言描述来设计声音,支持 20 多种情绪表达,如大笑、哭泣、叹...
阅读原文

课游记AI

课游记AI是面向中小学师生的AI个性化学习平台,输入主题即可秒级生成课程大纲、教案、动画视频与练习题,覆盖语数英、科学、编程等学科。平台自研教育大模型...
阅读原文

Comfy Cloud

Comfy Cloud是ComfyUI团队推出的云端AI创作平台,允许用户通过浏览器直接运行ComfyUI工具,无需本地安装显卡或配置环境。采用NVIDIA A100 40GB GPU提供算力支...
阅读原文

Flova.ai

Flova.ai 是创新的 AI 视频创作平台,通过自然对话的方式,将用户的创意转化为完整的视频作品。用户只需输入一个核心概念,平台上的 AI 团队(包括编剧、导演...
阅读原文

Step-Audio-EditX

Step-Audio-EditX 是阶跃星辰开源的全球首个 LLM 级音频编辑大模型,主打“情感、说话风格、副语言”三轴细粒度迭代控制,可把愤怒、开心、悲伤等情绪强度任意...
阅读原文

MOOME

MOOME是沉浸式AI扮演游戏,用户能自创或邂逅多元虚拟角色,进行24小时不间断的语音、文字与剧情化互动,AI会记住每一次喜怒哀乐,提供持续、私密且逐渐深化的...
阅读原文

Medo

Medo 是百度推出的无代码AI应用开发平台,秒哒的海外版。帮助用户无需编写代码即可快速创建各种应用程序。通过其可视化界面和丰富的组件库,用户可以轻松搭建...
阅读原文

Kimi-k2 Thinking

Kimi-k2 Thinking 是月之暗面推出的具备通用 Agentic 能力和深度推理能力的人工智能模型。模型能进行多轮工具调用,支持长达 256k 的上下文处理,适合复杂任...
阅读原文

Open-o3 Video

Open-o3 Video 是北京大学和字节跳动联合开发的开源视频推理模型,通过整合显式的时空证据(关键时间戳和边界框)来实现精准的视频推理。通过精心策划的 STGR...
阅读原文

OmniVinci

OmniVinci是NVIDIA推出的全模态大语言模型,专门处理视觉、听觉、语言和推理的多模态任务。通过独特的OmnialignNet技术实现跨模态语义对齐,Temporal Embeddi...
阅读原文

UNO-Bench

UNO-Bench是美团LongCat团队推出的全模态大模型评测基准。UNO-Bench针对现有评测体系的不足,通过高质量、多样化的数据构建,精准衡量模型的单模态与全模态能...
阅读原文

Kosmos

Kosmos 是新一代 AI 科学家,由 FutureHouse 推出的自动化科研系统 Robin 升级而来。Kosmos采用结构化世界模型,能高效整合海量信息,单次运行可解析 1500 篇...
阅读原文

UniWorld V2

UniWorld V2是兔展智能和北京大学UniWorld团队推出的新一代图像编辑模型。采用创新的UniWorld-R1训练框架,首次将强化学习策略优化应用于图像编辑,通过Diffu...
阅读原文

讯飞星火X1.5

讯飞星火X1.5 是科大讯飞推出的基于全国产算力平台的深度推理大模型。模型率先攻克 MoE 模型全链路训练效率问题,端到端性能达到国际竞品效率的 93% 以上。模...
阅读原文

TapNow

TapNow 是 AI 视觉内容创作平台,通过集成多种先进的图像和视频生成模型,提供丰富的预设工作流,用户只需上传素材、选择对应工作流,能快速生成高质量的创作...
阅读原文
123283