标签:智能语音助手
AI赚钱副业~AI生成影视解说,半个月涨粉变现3.5W+!
这两年大家都在感叹生活不易,然而我想说的是,机会还是有的,但问题不在于有没有,而在于你是否能够认准机会,然后抓住它。 接触过很多咨询项目的人,发现...
Chonkie:多种文本分块技术:基于Token、单词、句子与语义的分析方法
Chonkie是轻量级、快速且功能丰富的RAG(Retrieval-Augmented Generation)分块库,为文本处理设计。Chonkie支持基于Token、单词、句子和语义的多种分块方法...
声动视界:AI视频工具在带货短视频领域的翻译与配音功能
声动视界是面向带货短视频的AI视频工具。提供视频翻译、文本转语音和视频配音等功能,支持100多种语言,助力用户将产品推广至全球市场。基于音频合成技术,声...
Heeyo – 专为3至11岁儿童设计的智能AI学习伙伴
Heeyo是一款专为3至11岁儿童设计的智能AI学习伙伴,提供2000多种互动学习游戏,涵盖阅读、科学、智力问答等。Heeyo AI学习伙伴支持20种语言,由顶尖教育机构...
VASA-1 – 微软推出的静态照片对口型视频生成框架
VASA-1是由微软亚洲研究院提出的一个将静态照片转换为对口型动态视频的生成框架,能够根据单张静态人脸照片和一段语音音频,实时生成逼真的3D说话面部动画。
Mem0 – 一款开源的大语言模型记忆增强工具
Mem0 是一款开源的大语言模型记忆增强工具,能够让 AI 拥有长期、适应性强的记忆。通过自适应记忆系统,AI能实现跨应用记住用户的偏好和交互,提供连贯且不断...
汉王语音王 – 汉王科技推出的智能语音APP
汉王语音王是汉王科技推出的智能语音APP,集成了AI语音记录、翻译与同声传译功能。基于自研的多模态大模型,支持高准确率转写、拍录同步、智能总结和实时翻译...
HeadGAP – 字节跳动推出的3D头像生成模型
HeadGAP是字节跳动和上海科技大学共同推出的3D头像生成模型,仅用少量图片快速生成逼真的3D头像。采用先验学习和个性化创建阶段的框架,基于大规模多视角动态...
MyShell – 构建、共享和管理 AI 应用的开发平台
MyShell 是一个构建、共享和管理 AI 应用的开发平台,提供三种模式,包括经典、开发和无代码模式,适应不同技能水平的创作者。MyShell 旨在简化 AI 应用程序...
Eagle – 英伟达推出的多模态大模型,擅长高分辨率图像处理
Eagle是英伟达推出的多模态大模型,擅长处理高达1024×1024像素的图像,显著提升视觉问答和文档理解能力。Eagle模型采用多专家视觉编码器架构,通过简单高效的...
VoxInstruct – 清华推出的开源语音合成技术,支持多语言和跨语言合成
VoxInstruct 是由清华大学开源的语音合成技术,能根据人类语言指令生成高度符合用户需求的语音。系统采用统一的多语言编解码器语言建模框架,将传统的文本到...
Draw an Audio – 中科院联合美团推出的视频生成音频系统
Draw an Audio 是中国科学院自动化研究所和美团点评的研究人员推出的视频生成音频系统。根据视频内容自动生成匹配的声音效果,类似于电影制作中的 Foley 艺术...
纸飞机AI – AI虚拟陪伴产品,提供类真人的互动对话体验
纸飞机AI是北京智能涌现科技推出的AI虚拟陪伴产品,它通过先进的人工智能技术让用户能够创造具有个性化特征的AI智能体,AI智能体能够与用户进行类似真人的互...
Zona – AI音乐生成器,将想像快速转化为专业歌曲
Zona 是App-Vision推出的AI音乐生成器,通过用户的想法和想象力,无需乐器可创作出美妙的音乐。Zona 提供直观、有趣的界面,用户随时随地创作音乐,就像随身...
Emu3 – 北京智源推出的统一输入与生成多模态模型
Emu3是由北京智源人工智能研究院推出的一款原生多模态世界模型,采用智源自研的多模态自回归技术路径,在图像、视频、文字上联合训练,使模型具备原生多模态...
Kimi探索版 – Kimi 推出的深度推理AI搜索功能
Kimi探索版 是 Kimi 新增的深度推理AI搜索功能,通过理解、拆解问题,再进行搜索和推理给出答案,搜索量是普通版的10倍,一次搜索即可精读500个页面。新功能...
12