标签：多语言支持

绘声美音

绘声美音是免费的在线AI翻唱软件，用户无需下载，通过微信公众号使用。支持声音克隆与翻唱，用户上传3分钟以上的语音即可训练声音模型，之后可选择平台提供的...

阅读原文

AI工具

1年前 (2025)

Hika

Hika是国内五人团队开发的免费AI知识搜索工具，通过个性化交互和多维度知识探索，帮助用户获得更全面和深入的搜索结果。与传统AI搜索工具不同，不追求“一步到...

阅读原文

AI工具

1年前 (2025)

MILS

MILS（Multimodal Iterative LLM Solver）是Meta AI提出的无需训练即可赋予大型语言模型（LLM）多模态能力的方法。通过多步推理，提示LLM生成候选输出，对每...

阅读原文

AI工具

1年前 (2025)

Granola

Granola是专为频繁参加会议的人设计的AI会议助手工具。能实时转录会议内容，自动识别发言者并标注时间戳，支持用户在会议中实时添加笔记和标记重点。会议结束...

阅读原文

AI工具

1年前 (2025)

X-Prompt

X-Prompt是用于多模态视频目标分割的通用框架，解决传统方法在极端光照、快速运动和背景干扰等复杂场景下的局限性。通过预训练一个基于 RGB 数据的视频目标分...

阅读原文

AI工具

1年前 (2025)

BitsAI-CR

BitsAI-CR是字节跳动团队推出的基于大型语言模型（LLM）的自动化代码审查工具，通过两阶段处理流程实现高效代码审查：RuleChecker 负责基于 219 条规则检测潜...

阅读原文

AI工具

1年前 (2025)

Pipecat

Pipecat是开源的Python框架，专注于构建语音和多模态对话代理。基于内置的语音识别、文本转语音（TTS）和对话处理功能，简化AI服务的复杂协调、网络传输、音...

阅读原文

AI工具

1年前 (2025)

GLM-Realtime

GLM-Realtime是智谱推出的全新端到端多模态模型，具备低延迟的视频理解与语音交互能力，特别融入清唱功能，让大模型在对话中能展现歌唱才能。模型支持长达2分...

阅读原文

AI工具

1年前 (2025)

Aibiye

Aibiye是AI论文写作辅助平台，基于Multimodal+Global Thought Chain语言模型，为用户提供从开题报告到完整论文的生成服务。用户只需输入关键词、选择专业和字...

阅读原文

AI工具

1年前 (2025)

LlamaV-o1

LlamaV-o1是阿联酋穆罕默德·本·扎耶德人工智能大学等机构提出的新多模态视觉推理模型，旨在提升大型语言模型的逐步视觉推理能力。引入视觉推理链基准测试VRC-...

阅读原文

AI工具

1年前 (2025)

Kokoro-TTS

Kokoro-TTS 是 hexgrad 开发的轻量级文本转语音（TTS）模型，具有 8200 万参数。基于 StyleTTS 2 和 ISTFTNet 的混合架构，采用纯解码器设计，不使用扩散模型...

阅读原文

AI工具

1年前 (2025)

讯飞星火 X1

讯飞星火 X1 是科大讯飞于2025年1月15日发布的国内首个基于全国产算力平台训练的具备深度思考和推理能力的大模型。在解题过程中更接近人类的“慢思考”方式，仅...

阅读原文

AI工具

1年前 (2025)

星火语音同传大模型

星火语音同传大模型是科大讯飞于2025年1月15日发布的国内首个具备端到端语音同传能力的大模型。模型在内容完整度、信息准确度以及语言质量上均处于行业领先水...

阅读原文

AI工具

1年前 (2025)

Eko

Eko是Fellou AI推出的生产就绪型JavaScript框架，基于自然语言驱动的方式，帮助开发者轻松创建从简单指令到复杂流程的可靠智能代理。Eko支持所有平台，包括计...

阅读原文

AI工具

1年前 (2025)

Banger

Banger是以AI翻唱为核心的AI音乐应用，用户能通过简单的步骤将喜欢的歌曲进行翻唱创作。应用内置了大量素材模板，引入个性化算法推荐功能，支持从YouTube提取...

阅读原文

AI工具

1年前 (2025)

1…20 212223 24…62