标签：多语言支持

面灵AI

面灵AI是基于DeepSeek大模型的AI面试助手，专为求职者设计，提升面试表现。具备实时面试辅助功能，能在面试中快速解析问题并给出专业回答建议，能根据简历和...

阅读原文

AI工具

1年前 (2025)

Dolphin

Dolphin是清华大学电子工程系语音与音频技术实验室联合海天瑞声共同推出的面向东方语言的语音大模型。支持40个东方语种的语音识别，中文语种涵盖22种方言（含...

阅读原文

AI工具

1年前 (2025)

Translate Image

Translate Image 是免费的在线 AI 图片翻译工具，专为需要快速翻译图片中文字的用户设计。支持多种图片格式（如 JPG、PNG、JPEG 等），可处理产品图片、电商...

阅读原文

AI工具

1年前 (2025)

Actor Mode

Actor Mode 是 ElevenLabs 推出的AI语音生成工具，支持用户通过自己的声音指导 AI 生成语音内容。用户只需录制一段音频或上传已有音频文件，AI 能分析其语调...

阅读原文

AI工具

1年前 (2025)

Neo-1

Neo-1 是 VantAI 推出的全球首个将从头分子生成与原子级结构预测统一的AI模型。能预测生物分子结构，生成全新的分子，在设计分子胶等新型治疗药物方面表现出...

阅读原文

AI工具

1年前 (2025)

OpenDeepSearch

OpenDeepSearch 是开源的深度搜索工具，基于开源推理模型和推理代理提升搜索性能，专为 Hugging Face 的 SmolAgents 无缝集成进行优化，支持深度网络搜索和...

阅读原文

AI工具

1年前 (2025)

Elmo Chat

Elmo Chat 是 Lepton AI 推出的 Chrome 扩展工具，基于AI技术简化用户对各类内容的理解和处理。Elmo Chat能快速总结网页、YouTube 视频、Google 文档和 PDF ...

阅读原文

AI工具

1年前 (2025)

MegaTTS 3

MegaTTS 3是字节跳动与浙江大学合作推出的零样本文本到语音合成系统，采用轻量级扩散模型，参数量仅0.45B，能高效生成高质量语音。系统将语音分解为内容、音...

阅读原文

AI工具

1年前 (2025)

PaddleSpeech

PaddleSpeech 是百度飞桨团队开源的语音处理工具，提供全面的语音处理功能，包括语音识别、语音合成、声纹识别、语音翻译等。PaddleSpeech提供命令行界面、服...

阅读原文

AI工具

1年前 (2025)

TripoSG

TripoSG 是 VAST-AI-Research 团队推出的基于大规模修正流（Rectified Flow, RF）模型的高保真 3D 形状合成技术，通过大规模修正流变换器架构、混合监督训练...

阅读原文

AI工具

1年前 (2025)

TripoSF

TripoSF是VAST推出的新一代3D基础模型，突破传统3D建模在细节、复杂结构和扩展性上的瓶颈。采用SparseFlex表示方法，结合稀疏体素结构，仅在物体表面附近的区...

阅读原文

AI工具

1年前 (2025)

MeshifAI

MeshifAI 是AI文本转 3D 模型生成平台，能根据用户输入的文本提示快速生成 3D 模型，支持生成简单模型和纹理模型（PBR）两种类型，生成的模型为 .glb 格式，...

阅读原文

AI工具

1年前 (2025)

ModelEngine

ModelEngine 是华为开源的全流程 AI 开发工具链，围绕数据使能、模型使能和应用使能三大核心功能展开，解决 AI 行业化落地过程中数据工程耗时长、模型训练和...

阅读原文

AI工具

1年前 (2025)

Ideogram 3.0

Ideogram 3.0 是Ideogram推出的 AI 图像生成模型。Ideogram 3.0在图像生成质量上实现飞跃，具备高度的真实感、出色的文本渲染和强大的语言理解能力，支持生成...

阅读原文

AI工具

1年前 (2025)

Qwen2.5-Omni

Qwen2.5-Omni 是阿里开源的 Qwen 系列旗舰级多模态模型，拥有7B参数，Qwen2.5-Omni具备强大的多模态感知能力，能处理文本、图像、音频和视频输入，支持流式文...

阅读原文

AI工具

1年前 (2025)

1…9 101112 13…62