标签:多语言支持

gpt-4o-transcribe

gpt-4o-transcribe是 OpenAI 推出的高性能语音转文本模型。基于最新的语音模型架构,用海量多样化音频数据训练,精准捕捉语音细微差别,显著降低单词错误率(...
阅读原文

GPT-4o mini TTS

GPT-4o mini TTS 是 OpenAI 推出的轻量级文本转语音模型,支持将文本内容转换为自然流畅语音的同时,开发者能用指令控制语音的语调、情感和风格,例如“平静”“...

Dify-Plus

Dify-Plus 是基于 Dify 二次开发的企业级增强版项目,集成基于 gin-vue-admin 的管理中心。Dify-Plus在 Dify 基础上新增用户额度、密钥额度、Web 公开页登录...
阅读原文

Uthana

Uthana 是专注于3D角色动画生成的AI平台。平台基于简单的文字描述、参考视频或动作库搜索,快速为用户生成逼真的动画,支持适配任何骨骼结构的模型。Uthana ...
阅读原文

wcplusPro

wcplusPro 是专业的微信公众号数据采集和分析工具,支持 Windows、macOS 和 Linux 系统,免安装、解压即用。wcplusPro支持采集任意公众号的历史文章及多种阅...
阅读原文

AiSlides.chat

AiSlides.chat 是基于AI技术的对话式 PPT 制作工具。用户用自然语言输入需求或粘贴现有内容,AI 自动分析生成 PPT 大纲、逐页设计幻灯片,提供实时修改功能。...
阅读原文

AI Companion

AI Companion 是 Zoom 推出AI智能助手,基于记忆、推理、任务执行和协调四大功能,成为整个 Zoom 平台上的代理,帮助用户从重复繁琐的工作中解脱出来。AI Com...
阅读原文

GR00T N1

GR00T N1 是英伟达推出的全球首个开源基础模型,专为通用人形机器人设计。基于多模态输入(如语言和图像)实现多样化环境中的操作任务。GR00T N1 基于大规模...
阅读原文

Noiz AI

Noiz AI 是 AI 语音克隆与合成工具,专注于为用户提供高效、个性化的语音解决方案。基于自研的超大语音模型,能在3-10秒内通过简短录音克隆出与真人无异的声...
阅读原文

Claude 3.7 Max

Claude 3.7 Max 是 Cursor 推出的专为复杂代码任务设计的最新 AI 模型,称为史上最强代码助手。基于 Claude 3.7 思考模型,具备 200k 超大上下文窗口,支持处...
阅读原文

Chirp 3

Chirp 3 是谷歌云推出的高清语音合成模型,专为生成自然、生动的语音而设计。支持 248 种声音和 31 种语言,能捕捉人类语调的细微差别,语音输出更加贴近真实...
阅读原文

Same.dev

Same.dev 是 AI 前端开发工具,专注于将网页截图、设计文件或网页链接转化为前端代码。以像素级精度复制用户界面,确保生成的代码与原始设计高度一致。用户只...
阅读原文

MetaStone-L1-7B

MetaStone-L1-7B 是 MetaStone 系列中的轻量级推理模型,专为提升复杂下游任务的性能而设计。在数学和代码等核心推理基准测试中达到了并行模型的顶尖水平(SO...
阅读原文

FiaMind

FiaMind 是 AI 思维导图工具,专为高效信息管理和创意辅助而设计。有灵活的无限画布,可自由拆分组合思维导图,满足多样化布局需求,涵盖逻辑图、思维导图、...
阅读原文

MT-TransformerEngine

MT-TransformerEngine 是摩尔线程开源的高效训练与推理优化框架,专为 Transformer 模型设计。框架通过算子融合、并行加速等技术,充分基于摩尔线程全功能 GP...
阅读原文
1101112131461