标签:实时翻译

AI赚钱副业~AI生成影视解说,半个月涨粉变现3.5W+!

这两年大家都在感叹生活不易,然而我想说的是,机会还是有的,但问题不在于有没有,而在于你是否能够认准机会,然后抓住它。 接触过很多咨询项目的人,发现...

Voice-Pro:一站式音频处理解决方案集转录翻译与语音合成于一体

Voice-Pro是开源的多功能音频处理工具,集成语音转文字(STT)、文本转语音(TTS)、实时翻译、YouTube视频下载和人声分离等多种功能。工具支持超过100种语言...
阅读原文

聊会小天:智能AI伴侣助您心灵成长与情感支持

聊会小天是由西湖心辰基于自研的西湖大模型推出的AI心理陪伴产品。它结合认知行为疗法、叙事疗法和人本主义疗法,经过近三年的专业训练,具备心理咨询技能。...
阅读原文

吱意:智能多模态翻译与创作平台助力全球沟通与创意表达

吱意是AI多模态翻译平台,提供视频翻译、智能配音和音频转写等功能。平台基于智能语音识别技术和神经网络翻译技术,为用户提供专业高效的视频在线翻译服务。...
阅读原文

跃问视频:智能生成视频的全新工具助力创意无限

跃问视频是阶跃星辰推出的AI视频生成工具,支持多种视频创作主题,例如城市、科幻、自然、跑车、美食等。用户可以通过跃问视频官方提供的视频示例获得创意灵...
阅读原文

VoicePen.ai:智能内容生成工具助你轻松创建多媒体博客文章

VoicePen.ai 是AI驱动的内容创作工具,能将音频、视频、语音备忘录和网站内容快速转换成博客文章。VoicePen.ai 用粘贴链接或上传文件,自动生成引人入胜的内...
阅读原文

Heeyo

Heeyo是一款专为3至11岁儿童设计的智能AI学习伙伴,提供2000多种互动学习游戏,涵盖阅读、科学、智力问答等。Heeyo AI学习伙伴支持20种语言,由顶尖教育机构...
阅读原文

VoiceCraft

VoiceCraft是一个由德克萨斯大学奥斯汀分校研究团队开源的神经编解码器语言模型,专注于零样本语音编辑和文本到语音(TTS)任务。该模型采用Transformer架构...
阅读原文

Voice Engine

Voice Engine是OpenAI最新推出的一项AI语音合成和声音克隆技术,能够利用简短的15秒音频样本和文本输入,生成接近原声的自然听起来的语音。该项技术自2022年...
阅读原文

VASA-1

VASA-1是由微软亚洲研究院提出的一个将静态照片转换为对口型动态视频的生成框架,能够根据单张静态人脸照片和一段语音音频,实时生成逼真的3D说话面部动画。
阅读原文

PuLID

PuLID是字节跳动的团队开源的一种个性化文本到图像生成技术,通过对比对齐和快速采样方法,实现了无需调整模型的高效ID定制,轻松实现图像换脸效果。
阅读原文

Fish Speech

Fish Speech是一款由Fish Audio开发的开源的文本到语音(TTS)工具,支持中文、英文和日文。通过约15万小时的多语种数据训练,实现了接近人类水平的语音合成...
阅读原文

EchoMimic

EchoMimic是阿里蚂蚁集团推出的AI数字人开源项目,赋予静态图像以生动语音和表情。通过深度学习模型结合音频和面部标志点,创造出高度逼真的动态肖像视频。不...
阅读原文

Whisper-Medusa

Whisper-Medusa是aiOla推出的开源AI语音识别模型,结合了OpenAI的Whisper技术与aiOla的创新,Whisper-Medusa引入了多头注意力机制,实现了并行处理,显著提升...
阅读原文

汉王语音王

汉王语音王是汉王科技推出的智能语音APP,集成了AI语音记录、翻译与同声传译功能。基于自研的多模态大模型,支持高准确率转写、拍录同步、智能总结和实时翻译...
阅读原文
123