标签:多语言支持
Readtheirlips
Readtheirlips 是由 Symphonic Labs 推出的一款AI软件,用于通过分析视频中人物的嘴唇运动来识别和转录口语内容。软件能解读在没有声音的情况下,或者在声音...
TikTok Voice
TikTok Voice 是基于AI技术的文字转语音(TTS)在线工具,将文本转换成各种流行于TikTok平台的声音效果。工具为用户提供多种语音选项,如女士声音、Siri声音...
LlamaCoder
LlamaCoder 是一个开源的 AI 工具,使用 Llama 3.1 405B 模型快速生成全栈应用程序。旨在提供一种替代 Claude Artifacts 的解决方案。集成了 Sandpack、Next....
Claude Dev
Claude Dev是一个集成在Visual Studio Code中的AI编程助手,基于Anthropic公司的Claude 3.5 Sonnet模型,为开发者提供自动化的编程支持。Claude Dev自动处理...
AI解说大师
AI解说大师是智能影视创作工具,基于先进的数字技术和AI大模型,让用户能够轻松生成原创解说视频。工具具备正版影视素材库、自动生成解说文案、音频和字幕智...
ConFiner
ConFiner 是一个创新的视频生成框架,由多所大学和研究机构共同推出。结合多个现成的扩散模型专家,无需额外训练可生成高质量且连贯的视频内容。
Speechnotes
Speechnotes是AI驱动的在线语音转文字工具,支持音频和视频转录、翻译及语音输入笔记。具备语音命令、自动大写、易于导入导出等特点,提供便捷的口述和转录体...
Nemotron-Mini-4B-Instruct
Nemotron-Mini-4B-Instruct是英伟达推出的一款开源小型语言模型,专为角色扮演、检索增强生成(RAG)和函数调用任务优化。模型通过蒸馏、剪枝和量化技术优化...
Faster Whisper
Faster Whisper 是一个基于OpenAI Whisper模型的高效语音识别工具,运用CTranslate2引擎实现快速推理。在保持高准确度的同时,提升语音转写速度,降低内存使...
Qwen2.5-Coder
Qwen2.5-Coder 是阿里Qwen 团队推出的全系列代码生成模型,推动开源代码语言模型的发展。在代码生成、代码推理、代码修复等任务上表现出色。系列涵盖了不同规...