标签:智能语音识别

AI赚钱副业~AI生成影视解说,半个月涨粉变现3.5W+!

这两年大家都在感叹生活不易,然而我想说的是,机会还是有的,但问题不在于有没有,而在于你是否能够认准机会,然后抓住它。 接触过很多咨询项目的人,发现...

Sky-T1

Sky-T1是加州大学伯克利分校Sky Computing实验室的研究团队NovaSky发布的开源推理AI模型,名为Sky-T1-32B-Preview。是首个开源推理模型,训练数据集和代码均...
阅读原文

豆包向量化API

豆包向量化API是由字节跳动研发的语义向量化模型,名为Doubao-embedding,主要面向向量检索的使用场景,支持中、英双语,能处理最长4K的上下文长度。
阅读原文

Hi.AI

Hi.AI 是 AI 聊天应用,用户能创建具有独特个性的数字朋友,与各种 AI 角色进行沉浸式聊天。用户可以与名人、虚构人物或历史人物的 AI 版本就任何话题展开对...
阅读原文

Ingredients

Ingredients是强大的框架,基于将多个特定身份(ID)照片与视频扩散Transformer相结合,用在定制视频创作。Ingredients基于三个核心模块实现高度定制化的视频...
阅读原文

Fineshare VoiceTrans

Fineshare VoiceTrans 是实时 AI 变声器,能轻松改变自己的声音,适应不同的场景和需求。Fineshare VoiceTrans 提供多种功能,包括真实的 AI 变声、零延迟的...
阅读原文

百度AI搜

百度AI搜是百度基于文心大模型打造的桌面端AI搜索引擎。整合了百度搜索引擎、百度健康、百度律临、百度文库、百度教育等多个内容生态,确保搜索结果的可靠性...
阅读原文

TECHSPECS

TECHSPECS(TechSpecs Ray)是创新的AI驱动媒体播放器,通过实时AI字幕技术革新您的视听体验。支持99种语言的字幕生成,打破了语言障碍,让全球用户都能享受...
阅读原文

Wavy

Wavy是AI驱动的照片编辑应用,基于先进的AI技术,将用户的照片转换成具有艺术感的杰作。Wavy主要功能包括AI艺术生成器、视觉放大、即时艺术创作、照片提升和...
阅读原文

WIME

WIME是上海微盟企业发展有限公司推出的AI电商内容创作平台,专为电商和新媒体领域设计。基于AI技术,帮助用户一键生成多风格图片和文案,实现从创意到成品的...
阅读原文

ERA-42:星动纪元全新端到端原生机器人大模型实现智能化交互与高效任务执行

ERA-42是北京星动纪元推出的端到端原生机器人大模型,与自研的五指灵巧手星动XHAND1结合,能完成100多种复杂灵巧操作任务。ERA-42无需预编程,具备快速学习新...
阅读原文

Veo 2:高分辨率4K视频生成的先进AI模型,助力创意无限

Veo 2 是 Google DeepMind 推出的 AI 视频生成模型,能根据文本或图像提示生成高质量视频内容。Veo 2支持高达 4K 分辨率的视频制作,理解镜头控制指令,能模...
阅读原文

Step-1o:国内首个千亿参数端到端语音大模型震撼发布,性提升语音识别与合成能力

Step-1o是阶跃星辰推出的国内首个千亿参数端到端语音大模型。模型支持语音、文本等混合形式的输入和输出,可以快速反应并随时打断,提供最便捷的互动体验;同...
阅读原文

I2V-01-Live:海螺AI创新图生视频模型助力创意内容生成与视觉表现提升

I2V-01-Live是海螺AI推出的图生视频模型,能将静态二维图像转化为动态视频。模型基于深度学习技术,增强动作的流畅度和生动性,让人物或对象的动作更加自然和...
阅读原文

小羊标书:智能标书生成工具助力高效招标文档创建与管理

小羊标书是AI驱动的标书生成工具,旨在简化和加速标书制作过程。用户只需上传招标文件,系统能自动解析关键信息,智能生成标书大纲和内容。支持用户自定义目...
阅读原文

吱意:智能多模态翻译与创作平台助力全球沟通与创意表达

吱意是AI多模态翻译平台,提供视频翻译、智能配音和音频转写等功能。平台基于智能语音识别技术和神经网络翻译技术,为用户提供专业高效的视频在线翻译服务。...
阅读原文
123