标签:多语言支持

Readtheirlips

Readtheirlips 是由 Symphonic Labs 推出的一款AI软件,用于通过分析视频中人物的嘴唇运动来识别和转录口语内容。软件能解读在没有声音的情况下,或者在声音...
阅读原文

TikTok Voice

TikTok Voice 是基于AI技术的文字转语音(TTS)在线工具,将文本转换成各种流行于TikTok平台的声音效果。工具为用户提供多种语音选项,如女士声音、Siri声音...
阅读原文

LlamaCoder

LlamaCoder 是一个开源的 AI 工具,使用 Llama 3.1 405B 模型快速生成全栈应用程序。旨在提供一种替代 Claude Artifacts 的解决方案。集成了 Sandpack、Next....
阅读原文

LongCite

ongCite是由清华大学推出的项目,旨在提升大型语言模型(LLMs)在长文本问答任务中的可信度和可验证性。项目通过生成细粒度的句子级引用,使用户能验证模型的...
阅读原文

Claude Dev

Claude Dev是一个集成在Visual Studio Code中的AI编程助手,基于Anthropic公司的Claude 3.5 Sonnet模型,为开发者提供自动化的编程支持。Claude Dev自动处理...
阅读原文

AI解说大师

AI解说大师是智能影视创作工具,基于先进的数字技术和AI大模型,让用户能够轻松生成原创解说视频。工具具备正版影视素材库、自动生成解说文案、音频和字幕智...

ConFiner

ConFiner 是一个创新的视频生成框架,由多所大学和研究机构共同推出。结合多个现成的扩散模型专家,无需额外训练可生成高质量且连贯的视频内容。

M2UGen

M2UGen是先进的多模态音乐理解和生成框架,由腾讯PCG ARC实验室与新加坡国立大学联合推出。结合了大型语言模型(LLM)的能力,能处理包括文本、图像、视频和...
阅读原文

Speechnotes

Speechnotes是AI驱动的在线语音转文字工具,支持音频和视频转录、翻译及语音输入笔记。具备语音命令、自动大写、易于导入导出等特点,提供便捷的口述和转录体...
阅读原文

Nemotron-Mini-4B-Instruct

Nemotron-Mini-4B-Instruct是英伟达推出的一款开源小型语言模型,专为角色扮演、检索增强生成(RAG)和函数调用任务优化。模型通过蒸馏、剪枝和量化技术优化...
阅读原文

E2B

E2B 是致力于构建自动化云平台的开发者工具辅助平台,专注于为AI代理和应用程序开发开源代码解释层。E2B 提供支持多种大型语言模型(LLM)和AI框架的基础设施...
阅读原文

Sudo AI

Sudo AI 是一个基于AI技术提供3D模型生成服务的平台,通过文本或图像输入快速创建3D模型,主要服务于游戏领域的模型创建。平台以高效、易用和创新技术,降低...
阅读原文

Faster Whisper

Faster Whisper 是一个基于OpenAI Whisper模型的高效语音识别工具,运用CTranslate2引擎实现快速推理。在保持高准确度的同时,提升语音转写速度,降低内存使...
阅读原文

Qwen2.5-Coder

Qwen2.5-Coder 是阿里Qwen 团队推出的全系列代码生成模型,推动开源代码语言模型的发展。在代码生成、代码推理、代码修复等任务上表现出色。系列涵盖了不同规...
阅读原文

Qwen2.5

Qwen2.5 是阿里通义千问团队最新开源的最强AI大模型,具有多种参数规模的模型,包括 0.5B、1.5B、3B、7B、14B、32B 和 72B。模型在预训练时使用了最新的大规...
阅读原文
1181920212235