标签:多语言支持

ConFiner

ConFiner 是一个创新的视频生成框架,由多所大学和研究机构共同推出。结合多个现成的扩散模型专家,无需额外训练可生成高质量且连贯的视频内容。

M2UGen

M2UGen是先进的多模态音乐理解和生成框架,由腾讯PCG ARC实验室与新加坡国立大学联合推出。结合了大型语言模型(LLM)的能力,能处理包括文本、图像、视频和...
阅读原文

Speechnotes

Speechnotes是AI驱动的在线语音转文字工具,支持音频和视频转录、翻译及语音输入笔记。具备语音命令、自动大写、易于导入导出等特点,提供便捷的口述和转录体...
阅读原文

Nemotron-Mini-4B-Instruct

Nemotron-Mini-4B-Instruct是英伟达推出的一款开源小型语言模型,专为角色扮演、检索增强生成(RAG)和函数调用任务优化。模型通过蒸馏、剪枝和量化技术优化...
阅读原文

E2B

E2B 是致力于构建自动化云平台的开发者工具辅助平台,专注于为AI代理和应用程序开发开源代码解释层。E2B 提供支持多种大型语言模型(LLM)和AI框架的基础设施...
阅读原文

Sudo AI

Sudo AI 是一个基于AI技术提供3D模型生成服务的平台,通过文本或图像输入快速创建3D模型,主要服务于游戏领域的模型创建。平台以高效、易用和创新技术,降低...
阅读原文

Faster Whisper

Faster Whisper 是一个基于OpenAI Whisper模型的高效语音识别工具,运用CTranslate2引擎实现快速推理。在保持高准确度的同时,提升语音转写速度,降低内存使...
阅读原文

Qwen2.5-Coder

Qwen2.5-Coder 是阿里Qwen 团队推出的全系列代码生成模型,推动开源代码语言模型的发展。在代码生成、代码推理、代码修复等任务上表现出色。系列涵盖了不同规...
阅读原文

Qwen2.5

Qwen2.5 是阿里通义千问团队最新开源的最强AI大模型,具有多种参数规模的模型,包括 0.5B、1.5B、3B、7B、14B、32B 和 72B。模型在预训练时使用了最新的大规...
阅读原文

AI Hugging

AI Hugging 是一个基于AI技术的在线平台,用户通过上传照片或输入文字描述来创建个性化的拥抱视频。使用先进的AI算法分析图像中的人物,将静态照片转化为动态...
阅读原文

Ovis1.6

Ovis1.6是阿里国际AI团队推出的多模态大模型,在多模态权威综合评测基准OpenCompass上取得了优异的成绩,特别是在30亿参数以下的模型中综合得分排名第一,超...
阅读原文

Tripo 2.0

Tripo 2.0 是 VAST 公司推出的一款创新的 3D 模型生成服务,融合 DiT 和 U-Net 模型的复合架构,能快速生成具有丰富细节和高质量材质的 3D 模型。Tripo 2.0的...
阅读原文

Videotoword.ai

Videotowords.ai是一款AI驱动的在线服务,能将视频和音频文件转换成文字。基于先进的语音识别技术,支持多达98种语言的转录,提供自动生成摘要、快速准确的转...
阅读原文

RushChat AI

RushChat AI 是一个先进的对话式AI平台,专注于提供沉浸式和个性化的聊天体验。基于自然语言处理和机器学习技术,支持用户与定制的AI角色进行逼真的对话。
阅读原文

Toorch

Toorch是由零一万物推出的一款AI新闻阅读器,旨在提供高效、个性化的移动搜索体验。支持连续对话功能,形成时间线结构,方便用户追踪和回顾历史对话。
阅读原文
1444546474860