标签:智能语音助手

HeadGAP

HeadGAP是字节跳动和上海科技大学共同推出的3D头像生成模型,仅用少量图片快速生成逼真的3D头像。采用先验学习和个性化创建阶段的框架,基于大规模多视角动态...
阅读原文

MyShell

MyShell 是一个构建、共享和管理 AI 应用的开发平台,提供三种模式,包括经典、开发和无代码模式,适应不同技能水平的创作者。MyShell 旨在简化 AI 应用程序...
阅读原文

Eagle

Eagle是英伟达推出的多模态大模型,擅长处理高达1024×1024像素的图像,显著提升视觉问答和文档理解能力。Eagle模型采用多专家视觉编码器架构,通过简单高效的...
阅读原文

VoxInstruct

VoxInstruct 是由清华大学开源的语音合成技术,能根据人类语言指令生成高度符合用户需求的语音。系统采用统一的多语言编解码器语言建模框架,将传统的文本到...
阅读原文

Draw an Audio

Draw an Audio 是中国科学院自动化研究所和美团点评的研究人员推出的视频生成音频系统。根据视频内容自动生成匹配的声音效果,类似于电影制作中的 Foley 艺术...
阅读原文

纸飞机AI

纸飞机AI是北京智能涌现科技推出的AI虚拟陪伴产品,它通过先进的人工智能技术让用户能够创造具有个性化特征的AI智能体,AI智能体能够与用户进行类似真人的互...
阅读原文

Zona

Zona 是App-Vision推出的AI音乐生成器,通过用户的想法和想象力,无需乐器可创作出美妙的音乐。Zona 提供直观、有趣的界面,用户随时随地创作音乐,就像随身...
阅读原文

Emu3

Emu3是由北京智源人工智能研究院推出的一款原生多模态世界模型,采用智源自研的多模态自回归技术路径,在图像、视频、文字上联合训练,使模型具备原生多模态...
阅读原文

Kimi探索版

Kimi探索版 是 Kimi 新增的深度推理AI搜索功能,通过理解、拆解问题,再进行搜索和推理给出答案,搜索量是普通版的10倍,一次搜索即可精读500个页面。新功能...
阅读原文

AI产品榜

AI产品榜(aicpb.com)是一个专注于AI产品领域的榜单,由李榜主主导,联合30位AI领域公众号主理人发布。这份榜单涵盖了100个细分领域,通过对10,000+AI产品(...
阅读原文

ASSEMBO.AI

ASSEMBO.AI 是一个AI驱动的平台,支持用户在1分钟内快速简单地为电商产品生成高质量的营销图片和视频。适用于Shopify、Amazon、TikTok和Instagram等电商平台。
阅读原文

叨叨

叨叨是由上海自古红蓝人工智能科技有限公司开发的一款结合AI和社交养成元素的记账软件。提供一个虚拟的AI伴侣,用户在轻松的聊天互动中完成日常记账和学习活动。
阅读原文

Surya

Surya是一款功能强大的开源OCR(光学字符识别)工具包,专门设计用在文档识别,支持超过90种语言的识别。Surya能准确识别出文档中的文本,分析文本的阅读顺序...
阅读原文

FunASR

FunASR是由阿里巴巴达摩院开源的语音识别工具包,提供包括语音识别(ASR)、语音活动检测(VAD)、标点恢复、语言模型、说话人验证、说话人分离及多说话人ASR...
阅读原文

maket

maket是基于生成式AI技术的建筑设计软件,简化设计流程,让任何人能轻松规划和设计新建或翻新项目。maket提供自动化楼层平面图生成、风格探索、设计元素定制...
阅读原文
123