标签:实时翻译

WPS接入DeepSeek,秒变办公神器!

WPS 大家经常用来日常写作,虽然本身提供了AI功能,但可惜需要会员,本文教你三分钟接入最火的DeepSeek,让WPS秒变办公神器。 DeepSeek API申请地址:http:/...
阅读原文

AI赚钱副业~AI生成影视解说,半个月涨粉变现3.5W+!

这两年大家都在感叹生活不易,然而我想说的是,机会还是有的,但问题不在于有没有,而在于你是否能够认准机会,然后抓住它。 接触过很多咨询项目的人,发现...

Veo 3

Veo 3是谷歌I/O开发者大会上发布的新一代视频生成模型。Veo 3是谷歌首个可生成视频背景音效的模型,能合成画面,能为鸟鸣、街头交通等场景配上相应的音效,可...
阅读原文

Speech-02

Speech-02 是 MiniMax 推出的新一代文本到语音(TTS)模型。模型基于回归 Transformer 架构,实现零样本语音克隆,仅需几秒参考语音能生成高度相似的目标语音...
阅读原文

Audio-SDS

Audio-SDS是NVIDIA AI研究团队推出的创新技术,将Score Distillation Sampling(SDS)技术扩展至文本条件音频扩散模型,为音频处理领域带来了重大突破。无需...
阅读原文

LTXV-13B

LTXV-13B 是Lightricks推出的开源 AI 视频生成模型,拥有 130 亿参数。具备极高的生成速度,比同类产品快 30 倍,能在普通消费级显卡(如 4090/5090)上运行...
阅读原文

Parakeet TDT 0.6B

Parakeet TDT 0.6B 是英伟达推出的开源自动语音识别(ASR)模型。采用FastConformer编码器和TDT解码器架构,通过预测文本标记及其持续时间加速推理,减少计算...
阅读原文

Eagle 2.5

Eagle 2.5是英伟达推出的视觉语言模型,专注于长上下文多模态学习的 AI 模型,参数规模仅为 8B。参数量较小,但在处理高分辨率图像和长视频序列方面表现出色...
阅读原文

Trae 插件

Trae 插件是 Trae 旗下新一代 AI 编程助手(原 MarsCode 编程助手),以插件形态集成在本地 IDE 之中,兼容性强、使用灵活。提升开发效率和代码质量。支持100...
阅读原文

破壳AI口语

破壳AI口语是AI英语口语学习应用,基于AI技术为用户提供个性化口语练习体验。破壳AI口语涵盖生活、校园、旅游、职场等多场景对话,帮助用户提升流利度、语法...
阅读原文

Nova Sonic

Nova Sonic 是亚马逊推出的新型生成式 AI 语音模型。将语音理解与生成能力整合到一个模型中,能根据说话者的语调、风格等声学上下文调整生成的语音响应,对话...
阅读原文

口语精灵

口语精灵是AI口语学习软件,通过先进的人工智能技术和真人语音模拟,为用户提供1V1的对话练习体验。用户可以随时随地与AI老师互动,跨越国界,学习不同地区的...
阅读原文

Dolphin

Dolphin是清华大学电子工程系语音与音频技术实验室联合海天瑞声共同推出的面向东方语言的语音大模型。支持40个东方语种的语音识别,中文语种涵盖22种方言(含...
阅读原文

Translate Image

Translate Image 是免费的在线 AI 图片翻译工具,专为需要快速翻译图片中文字的用户设计。支持多种图片格式(如 JPG、PNG、JPEG 等),可处理产品图片、电商...
阅读原文

Chirp 3

Chirp 3 是谷歌云推出的高清语音合成模型,专为生成自然、生动的语音而设计。支持 248 种声音和 31 种语言,能捕捉人类语调的细微差别,语音输出更加贴近真实...
阅读原文

TicVoice 7.0

TicVoice 7.0 是出门问问推出的第七代高品质 TTS(语音合成)引擎,基于新一代语音生成模型 Spark-TTS 。TicVoice 7.0基于创新的 BiCodec 编码方式,将语音分...
阅读原文

Pinch

Pinch 是创新的实时 AI 语音翻译视频会议平台,专为打破语言障碍而设计,支持超过 30 种语言的即时语音翻译。提供两种翻译模式:口译模式和同声传译模式,分...
阅读原文
1235