标签：多语言支持

AI Chat-avatar

AI Chat-avatar 是 AI 驱动的数字人交互助手，通过高度个性化的互动体验提升沟通效率与用户参与度。具备多语言支持，能实时翻译并进行自然对话，打破语言障碍...

阅读原文

AI工具

1年前 (2025)

EliGen

EliGen是浙江大学和阿里巴巴集团联合开发的新型的实体级可控图像生成框架，通过引入区域注意力机制，无需额外参数即可将实体提示和任意形状的空间掩码无缝集...

阅读原文

AI工具

1年前 (2025)

Hibiki

Hibiki是Kyutai Labs开源的用在同时语音翻译的解码器模型，能实时将一种语言的语音翻译成另一种语言的语音或文本。Hibiki基于多流语言模型架构，同步处理源语...

阅读原文

AI工具

1年前 (2025)

Ola

Ola是清华大学、腾讯 Hunyuan 研究团队和新加坡国立大学 S-Lab 合作开发的全模态语言模型。通过渐进式模态对齐策略，逐步扩展语言模型支持的模态，从图像和文...

阅读原文

AI工具

1年前 (2025)

BEN2

BEN2（Background Erase Network 2）是Prama LLC开发的深度学习模型，专门用于从图像和视频中快速移除背景并提取前景。基于创新的置信度引导抠图（CGM）管道...

阅读原文

AI工具

1年前 (2025)

播记

播记是专为播客创作者设计的智能节目笔记（Shownotes）生成工具。通过AI技术，能快速提取播客音频中的关键信息，自动生成包含节目主题、嘉宾介绍、重要观点、...

阅读原文

AI工具

1年前 (2025)

SANA 1.5

SANA 1.5 是英伟达联合MIT、清华、北大等机构推出的新型高效的线性扩散变换器（Linear Diffusion Transformer），用于文本到图像生成任务。在 SANA 1.0 的基...

阅读原文

AI工具

1年前 (2025)

倍客AI

倍客AI是专注于 AI 内容创作的平台，通过人工智能技术为商业摄影、广告设计、电商展示等领域提供高效、高质量的创意解决方案。平台的核心功能包括 AI 商图、A...

阅读原文

AI工具

1年前 (2025)

JoyGen

JoyGen是京东科技和香港大学推出的，音频驱动的3D说话人脸视频生成框架，专注于实现精确的唇部与音频同步及高质量的视觉效果。JoyGen结合音频特征和面部深度...

阅读原文

AI工具

1年前 (2025)

Le Chat APP

Le Chat APP是法国人工智能初创公司Mistral AI推出的AI对话助手应用。支持自然语言对话、实时网页搜索、文档分析和图像生成等功能。Le Chat提供基础版免费使...

阅读原文

AI工具

1年前 (2025)

s1

s1是斯坦福大学和华盛顿大学的研究团队开发的低成本、高性能的AI推理模型。模型通过“蒸馏”技术从谷歌的Gemini 2.0 Flash Thinking Experimental模型中提取推...

阅读原文

AI工具

1年前 (2025)

LipRead Pro

LipRead Pro 是基于先进 AI 技术的视频唇读工具，能将视频中的唇部动作转换为文字。采用最新的深度学习模型，支持多种语言和口音，应用于内容创作、无障碍辅...

阅读原文

AI工具

1年前 (2025)

LOOK

LOOK是实时AI时尚设计工具，专为时尚设计师开发。LOOK基于先进的AIGC技术，将设计概念即时转化为视觉呈现，简化传统设计流程。设计师在Procreate中绘制草图时...

阅读原文

AI工具

1年前 (2025)

MnnLlmApp

MnnLlmApp 是阿里巴巴基于 MNN-LLM 框架开源的 Android 手机应用，支持各类大语言模型（LLM）在手机上离线运行。具备多模态功能，能实现文本生成文本、图像生...

阅读原文

AI工具

1年前 (2025)

qeen.ai

qeen.ai 是谷歌和 DeepMind 前员工为电子商务企业提供自主 AI Agent平台，帮助商家优化内容创作、营销和对话销售。 AI Agent 基于专有的 RL-UI 技术，实时从...

阅读原文

AI工具

1年前 (2025)

1…19 202122 23…62