标签:多语言支持

Sync Labs

Sync Labs 是一款AI视频配音工具,使用 AI 技术实现了实时口型同步,支持用户将任何语言的音频与视频中的人物进行同步。Sync Labs支持多种语言,适用于电影、...
阅读原文

MDT-A2G

MDT-A2G是复旦大学和腾讯优图联合推出的AI模型,专门用于根据语音内容同步生成相应的手势动作。MDT-A2G模仿人类在交流时自然产生的手势,计算机能更加生动和...
阅读原文

Falcon Mamba 7B

Falcon Mamba 7B是阿联酋技术创新研究所(TII)推出的开源AI大模型,性能超越了Meta的Llama 3.1-8B等模型。Falcon Mamba 7B采用编码器-解码器结构和多头注意...
阅读原文

醒蓝AI

醒蓝AI是一款AI照片生成工具,支持一键生成AI形象照,用户能够轻松制作工作形象照、写真照、证件照和AI换脸照片。醒蓝AI还提供API接口和定制化解决方案,满足...
阅读原文

UniTalker

UniTalker是推出的音频驱动3D面部动画生成模型,能根据输入的音频生成逼真的面部动作。采用统一的多头架构模型,用带有不同标注的数据集,支持多语言和多种音...
阅读原文

Grok-2

Grok-2是xAI公司推出的新一代AI模型,提供卓越的聊天、编程和推理能力。在学术基准测试中,Grok-2在GPQA、MMLU、MMLU-Pro和MATH等领域的表现超越了前代Grok-1...
阅读原文

晓象

晓象是光启慧语推出的AI克隆产品,基于自研可信大模型,创建各领域知识博主的AI分身。模拟知识博主的声音、风格和表达方式,生成个性化的内容。
阅读原文

微博嘴替

微博嘴替是一个微博账户AI趣味分析应用,专为微博用户设计。微博嘴替通过分析用户的微博资料和内容,生成犀利、幽默风趣和个性化的吐槽。
阅读原文

Boogie AI

Boogie AI是一款AI跳舞软件,使用AI技术将用户上传的照片转化为舞蹈视频。自发布以来,Boogie AI迅速在美国iOS端免费应用排行榜上升至第18位,并在一个月内下...
阅读原文

LabelU

LabelU 是一款开源的多模态数据标注工具,支持图像、视频和音频的标注,具备拉框、多边形、标点、标线、分类、描述等图像标注能力,能满足目标检测、图像分类...
阅读原文

Subtitle Edit

Subtitle Edit是一款免费开源的多功能字幕编辑器,支持超过300种字幕格式,包括SRT、MicroDVD和Sub Station Alpha等。具备字幕同步、创建、翻译、音频波形可...
阅读原文

神采PromeAI

神采PromeAI是一款专为设计师打造的AI设计助手。适合建筑师、室内设计师、产品设计师和游戏动漫设计师使用,通过强大的AIGC模型风格库,用户能通过简单的文字...
阅读原文

Linly-Dubbing

Linly-Dubbing是一个开源的智能视频多语言AI配音和翻译工具,能自动将视频内容翻译成多种语言,并生成字幕。通过WhisperX和FunASR进行精准语音识别,基于Edge...
阅读原文

Odyssey

Odyssey是一个好莱坞级的AI视频生成和编辑工具,OdysseyML提供技术支持,通过训练四个高级生成模型,专注于创造精细的几何图形、逼真的材质、震撼的光照效果...
阅读原文

Glyph-ByT5

Glyph-ByT5-v2由微软亚洲研究院、清华大学、北京大学和利物浦大学联合开发的多语言视觉文本渲染项目。Glyph-ByT5-v2支持10种不同语言的准确视觉文本渲染,审...
阅读原文
1404142434461