标签:情感识别

AI赚钱副业~AI生成影视解说,半个月涨粉变现3.5W+!

这两年大家都在感叹生活不易,然而我想说的是,机会还是有的,但问题不在于有没有,而在于你是否能够认准机会,然后抓住它。 接触过很多咨询项目的人,发现...

EchoMimicV2:革新数字人生成技术实现个性化虚拟形象定制

EchoMimicV2是蚂蚁集团推出的半身人体动画(数字人)生成方法,基于参考图片、音频剪辑和手部姿势序列生成高质量动画视频,确保音频内容与半身动作的一致性。...
阅读原文

多模态情感智能:西湖心辰CEO醒辰的前瞻性探索与应用揭秘

2024中国生成式AI大会(上海站)12月5-6日举办~
阅读原文

塔猫ChatPPT

塔猫ChatPPT是基于AI技术的智能PPT生成工具,能通过用户输入的关键词、大纲或完整文稿,一键生成结构清晰、设计专业的PPT文档 。用户无需具备专业的设计技能...
阅读原文

EMO

EMO(Emote Portrait Alive)是一个由阿里巴巴集团智能计算研究院的研究人员开发的框架,一个音频驱动的AI肖像视频生成系统,能够通过输入单一的参考图像和语...
阅读原文

腾讯元宝APP

腾讯元宝APP是腾讯于5月30日最新推出的一款基于腾讯混元大模型的AI助手应用,旨在通过先进的人工智能技术,为用户提供办公、学习、创作和生活等方面的辅助。
阅读原文

MOFA-Video

MOFA-Video是由腾讯AI实验室和东京大学的研究人员开源的一个可控性的图像生成视频的模型,该技术利用生成运动场适应器对图像进行动画处理以生成视频。
阅读原文

SadTalker

SadTalker是西安交通大学、腾讯AI实验室和蚂蚁集团联合推出的开源AI数字人项目。SadTalker专注于通过单张人脸图像和语音音频,利用3D运动系数生成逼真的说话...
阅读原文

Musicfy AI

Musicfy AI是一个AI音乐创作平台,基于人工智能技术简化了音乐制作流程。用户可以上传自己的声音样本,Musicfy AI将学习并模拟这些声音,创建个性化的AI声音...
阅读原文

HeadGAP

HeadGAP是字节跳动和上海科技大学共同推出的3D头像生成模型,仅用少量图片快速生成逼真的3D头像。采用先验学习和个性化创建阶段的框架,基于大规模多视角动态...
阅读原文

山海大模型

山海大模型是云知声推出的多模态AI大模型,具备丰富的知识储备和多模态交互能力。山海大模型能通过文本、音频、图像等多种形式与用户进行实时互动,提供信息...
阅读原文

OmniCorpus

OmniCorpus是一个大规模多模态数据集,包含86亿张图像和16960亿个文本标记,支持中英双语。由上海人工智能实验室联合多所知名高校及研究机构共同构建。OmniCo...
阅读原文

Sunoify

Sunoify是AI驱动的音乐创作平台,使用先进的人工智能技术将文字、表情符号、图片或产品网址转化为个性化的音乐作品。用户可以通过简单的界面选择创作模式,输...
阅读原文

Predis.ai

Predis.ai 是一款专为社交媒体设计的人工智能营销工具,能帮助用户快速生成引人入胜的视频和图像内容,提供AI驱动的内容分析。支持品牌语言的内容生成,支持...
阅读原文

MLE-bench

MLE-bench 是 OpenAI 推出的一个基准测试工具,旨在衡量AI代理(AI Agent)在机器学习工程任务中的表现。测试包含75个来自 Kaggle 的竞赛任务,覆盖自然语言...
阅读原文

PersonaTalk

PersonaTalk是字节跳动推出的基于注意力机制的两阶段框架,用在实现高保真度和个性化的视觉配音。PersonaTalk能在合成与目标音频精准唇形同步的视频的同时,...
阅读原文
12