AI工具

HunyuanWorld-Voyager

HunyuanWorld-Voyager(简称混元Voyager)是腾讯推出的业界首个支持原生3D重建的超长漫游世界模型。是新颖的视频扩散框架,能从单张图片生成用户定义相机路径...
阅读原文

Hunyuan-MT-7B

Hunyuan-MT-7B 是腾讯混元团队发布的轻量级翻译模型,参数量仅 70 亿,支持 33 个语种及 5 种民汉语言/方言互译。在国际计算语言学协会(ACL)WMT2025 比赛中...
阅读原文

LavieAI

LavieAI是专注于AI模特智能换装技术的平台。提供一系列创新的AI驱动服务,为时尚和服装行业提供高效、低成本的解决方案。LavieAI的AI模特技术拥有海量的虚拟...
阅读原文

AudioStory

AudioStory 是腾讯 ARC 实验室发布的音频生成技术,能根据自然语言描述生成高质量的长篇叙事音频。采用分而治之策略,将复杂叙事请求拆解为有序子任务,通过...
阅读原文

Open-Fiesta

Open-Fiesta 是开源的多模型 AI 聊天平台,基于 Next.js 14 构建。平台支持多种 AI 提供商(如 Gemini、OpenRouter 等)和多种模型,用户能同时选择 5 种模型...
阅读原文

Step-Audio 2 mini

Step-Audio 2 mini 是阶跃星辰发布的开源端到端语音大模型。突破传统语音模型结构,采用真端到端多模态架构,直接将原始音频输入转化为语音响应输出,时延更...
阅读原文

MobileCLIP2

MobileCLIP2是苹果公司研究人员推出的高效端侧多模态模型,是MobileCLIP的升级版本。在多模态强化训练方面进行了优化,通过在DFN数据集上训练性能更优的CLIP...
阅读原文

MAI-1-preview

MAI-1-preview 是微软人工智能团队推出的端到端训练的基础模型,为用户提供遵循指令和回答日常查询的能力。
阅读原文

InternVL3.5

InternVL3.5(书生·万象3.5)是上海人工智能实验室开源的多模态大模型,模型在通用能力、推理能力和部署效率上全面升级,提供从10亿到2410亿参数的九种尺寸版...
阅读原文

MAI-Voice-1

MAI-Voice-1 是微软人工智能团队推出的首个具有高度表现力和自然的语音生成模型。模型能在单个 GPU 上不到一秒钟内生成一分钟的音频,是目前最高效的语音系统...
阅读原文

Typeless

Typeless是智能语音转录工具,能自动去除语音中的语气词和重复内容,能根据上下文自动调整语气和格式。Typeless支持100多种语言,能添加个人词典,确保转录准...
阅读原文

Async

Async 是开源的开发者工具,为经验丰富的开发者提供结合AI编码、任务管理和代码审查的统一工作流,通过 AI 技术帮助开发者提高工作效率。
阅读原文

ReadyBase

ReadyBase 是在线 AI 驱动的PDF生成工具,将原始数据或提示快速转换为精美的 PDF 文档。用户只需输入文字、数据或图片等信息,平台会根据内容自动生成排版清...
阅读原文

VibeFlow

VibeFlow 是创新的无代码开发平台,支持用户通过自然语言描述来构建全栈 Web 应用。用户只需输入简单的提示词,VibeFlow 的 AI 引擎能自动生成完整的后端逻辑...
阅读原文

LoomlyAI

LoomlyAI 是专注于视觉内容解决方案的 AI 平台,提供 AI 模特和智能换装功能。基于 AI 模型取代传统模特拍摄,快速生成高质量的商业图片和视频,解决模特拍摄...
阅读原文
11920212223279