标签:智能语音识别

云界AI

云界AI是开源在线AI绘画工具,集成了文生图、图生图、条件生图和模型训练等多种创意生图功能。用户通过简单的文本描述或上传图片,快速生成具有创意的艺术作品。
阅读原文

Zeemo

Zeemo 是一款AI驱动的视频字幕生成工具,能自动检测并转录多达95种语言的语音,将字幕翻译成113种语言。工具为视频创作者提供快速、高效的方式增加视频的全球...
阅读原文

我在AI

我在AI是一款先进的AI智能体聊天平台,基于AI技术,特别是自然语言处理(NLP),实现与人的自然语言对话,回答各种问题,给予情感支持。用户定制个性化的AI智...
阅读原文

百度智能云一见

百度智能云一见是百度智能云推出的视觉大模型平台,旨在基于领先的视觉大模型技术和丰富的场景化算法方案,实现专业级视觉AI应用的平民化。平台打通从模型生...
阅读原文

MM1.5

MM1.5是苹果公司推出的多模态大型语言模型,旨在增强文本丰富图像理解、视觉指代和定位以及多图像推理能力。模型基于数据为中心的训练方法,在大规模预训练、...
阅读原文

YouTube Transcript

YouTube Transcript是一个基于AI技术自动生成YouTube视频文字记录的在线服务。支持用户将视频内容转换成文字稿,便于内容创作者添加字幕、学生和研究人员简化...
阅读原文

ssemble

ssemble是一款运用人工智能技术的在线视频编辑平台,能将长视频智能切割成适合短视频平台的内容。通过AI驱动的内容识别,ssemble快速定位视频中的高光时刻,...
阅读原文

Mellum

Mellum 是 JetBrains 推出的一款专为开发者设计的大型语言模型(LLM),旨在提升 AI 驱动的开发工具。通过深度集成 JetBrains IDE,提供低延迟、高准确度的代...
阅读原文

Whispo

Whispo是AI驱动的语音转录工具,支持用户按住Ctrl键录制语音,在释放键时自动将转录的文本插入到正在用的任何支持文本输入的应用程序中。工具的数据处理完全...
阅读原文

讯飞星火PC版

讯飞星火PC版是科大讯飞推出的电脑端AI对话产品,具备强大的跨领域知识理解和语言处理能力。通过自然对话方式,用户可以进行写作、搜索、问答、翻译等多种任...
阅读原文

咔哒

咔哒是基于AI技术的智能图片处理软件。能识别各种场景和物体,自动为照片匹配合适的滤镜和效果,快速提升照片质量。咔哒AI能针对不同场景进行优化,如夜景和...
阅读原文

芊芊妙音

芊芊妙音是AI配音和变声软件,提供丰富的音色包和音频处理功能,让用户轻松改变自己的声音,进行配音创作。软件用海量音色包、文字提取功能、作品保存与分享...
阅读原文

SlideSpeak

SlideSpeak是AI驱动平台,专门设计来增强用户处理演示文稿和文档的能力。允许用户上传PowerPoint、Word或PDF文件,用人工智能快速生成演示文稿或提取文档摘要...
阅读原文

Hertz-Dev

Hertz-Dev是Standard Intelligence推出的开源音频模型,拥有8.5亿参数。Hertz-Dev包括音频自动编码器hertz-codec、音频VAE学习先验hertz-vae和一个66亿参数的...
阅读原文

米可智能

米可智能是AI音视频创作平台,提供一站式视频翻译、声音克隆和AI配音服务。基于视频翻译功能,将音视频中的语音翻译成多种语言,保留原声和背景音乐,支持20...
阅读原文
123