标签:语音识别
DupDub:智能内容创作平台助您快速生成高质量视频、文本与音频内容
DupDub是出门问问推出的创新AI内容生成平台,旨在帮助内容创作者高效制作视频、文本和音频内容。提供AI写作、文本转语音、AI头像动画化和视频编辑等功能,支...
SAM 2.1:Meta开源的先进视觉分割模型提升图像处理精度与效率
SAM 2.1(全称Segment Anything Model 2.1)是Meta(Facebook的母公司)推出的先进视觉分割模型,用于图像和视频。基于简单的Transformer架构和流式记忆设计...
金舟AI助手:创新设计与卓越性能的完美结合提升您的生活品质
金舟AI助手是创新的营销内容创作平台,基于人工智能和大数据技术,为创作者、品牌主和营销服务公司提供高效的内容创作解决方案。平台能快速生成富有创意和针...
DynaSaur:Adobe创新推出的多功能大语言模型代理框架提升创作效率与智能化体验
DynaSaur是Adobe Research推出的大型语言模型(LLM)代理框架,突破传统LLM代理系统受限于预定义动作集合的限制。框架支持代理动态创建和组合动作,基于生成...
Takin AudioLLM:创新零样本语音生成模型助力个性化语音合成体验
Takin AudioLLM是喜马拉雅Everest团队推出的一系列高质量零样本语音生成模型,包括Takin TTS、Takin VC和Takin Morphing。模型用最新的大型语言模型技术,专...
Meta开源大礼包:探索图像分割、语音识别、文本处理等前沿科技的无限可能!
原标题:一文看尽Meta开源大礼包!全面覆盖图像分割、语音、文本、表征、材料发现、密码安全性等 文章来源:新智元 内容字数:6434字Meta开源AI项目推动技术...
AI酱:实时多语言对话的二次元风格AI助手
AI酱是二次元风格的AI多语言智能聊天APP,提供了多个二次元萌妹和帅哥形象,用户可以与这些角色进行面对面的即时对话。应用基于语音识别能力和人工智能技术,...
滴文:智能化标书定制服务助力高效投标管理
滴文是在线服务平台,基于AI技术简化标书的制作和交付流程。在短时间内生成多页标书文档,满足紧急交付需求。平台提供多行业覆盖的标书模板,确保输出的标书...
LEOPARD:腾讯AI Lab推出的视觉语言模型赋能多模态理解与生成
LEOPARD是腾讯AI Lab西雅图实验室推出的视觉语言模型,专为理解和处理含有大量文本的多图像任务设计。LEOPARD基于两个主要技术创新:一是策划约一百万条专门...
颠覆语音通话体验:字节跳动豆包大模型实现实时互动新
原标题:字节跳动豆包大模型支持实时语音通话 文章来源:小夏聊AIGC 内容字数:3297字豆包大模型实时语音通话使用教程 随着人工智能技术的快速发展,豆包大...
跃问视频:智能生成视频的全新工具助力创意无限
跃问视频是阶跃星辰推出的AI视频生成工具,支持多种视频创作主题,例如城市、科幻、自然、跑车、美食等。用户可以通过跃问视频官方提供的视频示例获得创意灵...
讯飞星辰:个性化AI大模型定制训练平台助力智能应用创新
讯飞星辰是科大讯飞推出的AI大模型定制训练平台,创建你的专属定制大模型。讯飞星辰汇集20多个行业内知名的优质模型,如星火大模型、Llama3等,支持零代码微...
讯飞星辰:智能定制化AI大模型训练平台助力行业创新与升级
讯飞星辰是科大讯飞推出的AI大模型定制训练平台,创建你的专属定制大模型。讯飞星辰汇集20多个行业内知名的优质模型,如星火大模型、Llama3等,支持零代码微...