标签:音频
AI赚钱副业~AI生成影视解说,半个月涨粉变现3.5W+!
这两年大家都在感叹生活不易,然而我想说的是,机会还是有的,但问题不在于有没有,而在于你是否能够认准机会,然后抓住它。 接触过很多咨询项目的人,发现...
微信公众号悄悄上线AI音色克隆,微信的一小步,却是AI的一大步。
大数据文摘受权转载自数字生命卡兹克 作者:卡兹克 这篇文章,可能是我有史以来最特殊的一篇文章。 因为当你点开右上角的三个点,点击听全文的时候。 可能你...
今天,智谱「新清影」上线,率先进入有声视频生成时代!还要继续开源宠粉
夕小瑶科技说 原创作者 | 夕小瑶编辑部来,你先把手机音量打开,然后去“听”下面一段视频: 你是不是一脸懵逼?不知道我想表达什么? 视频是AI生成的并不奇怪...
百度又放大招!视觉生成模型 Hallo2 或将落地数字人等场景
作者 | 华卫 近日,百度联合复旦大学等发布 Hallo2,一个可以生成长达数小时且分辨率为 4K 的人物动画的视觉模型。Hallo2 目前已经在 GitHub 平台开源,供全...
刚刚,我们感受了一波最「像人」的国产AI,模型还是开源的
机器之心原创 作者:杜伟、蛋酱今年 5 月,OpenAI 首次展示了 GPT-4o 的语音功能,无论是对话的响应速度还是与真人声音的相似度,都颇为惊艳。特别是它允许用...
NotebookLM核心负责人访谈: 项目不到 10个人,体验惊艳全球,但它还只是个技术demo
难以置信,在 2024 年,Google 还能推出全行业叫好的惊艳项目——不是商业化产品,而是在设计、体验上让行业学到一课的小项目。 在上周的 OpenAI Dev Day 上,S...
谷歌这款AI应用凭什么在一年后爆红?大神卡帕西:或是下一个ChatGPT
来源:AI前线 编译:核子可乐、Tina 它实际是一款可由最终用户定制的 RAG 产品。或是下一个 ChatGPT?最近几天,人们似乎对一款已经不新鲜的 AI 助手 Noteboo...
Meta又给OpenAI一记重击,视频生成Movie Gen震撼登场,甚至可以配音、编辑
机器之心报道 编辑:Panda、大盘鸡视频生成领域真是越来越卷且越来越迈向实用性! 在 OpenAI Sora 难产的时候,Meta 首次公开展示了自家的「用于媒体的突破性...
大神卡帕西安利爆火AI应用,称「或是下一个ChatGPT」
衡宇 发自 凹非寺量子位 | 公众号 QbitAI大神卡帕西墙裂推荐! 甚至预言这个AI应用,有可能开启「和ChatGPT一样大的机会」。 它就是来自谷歌的实验性AI产品,...
三只羊卢总的录音AI到底能不能做出来?我的答案是:当然能。
大数据文摘受权转载自数字生命卡兹克 作者:卡兹克 今天凌晨,N多人给我发了一张图,说警方通报了,问我到底怎么看三只羊录音是不是AI这事。 还有朋友跟我说...
150万条多语种音频数据!浙大清华发布语音伪造检测框架SafeEar,兼顾隐私保护|CCS 2024
新智元报道编辑:LRST 【新智元导读】SafeEar是一种内容隐私保护的语音伪造检测方法,其核心是设计基于神经音频编解码器的解耦模型,分离语音声学与语义信息...
开源版GPT-4o来了,AI大神Karpathy盛赞!67页技术报告全公开
新智元报道编辑:alan 【新智元导读】两个多月前那个对标GPT-4o的端到端语音模型,终于开源了。大神Karpathy体验之后表示:nice!前段时间技惊四座、剑指GPT-...
开源版《Her》来了,技术报告已公开!大神Karpathy:它很有个性
一水 发自 凹非寺量子位 | 公众号 QbitAI大神Karpathy鼎力推荐,开源版「Her」Moshi再引关注! (Moshi)的性格非常有趣,它会突然断断续续,有时会无缘无故...
字节音乐大模型炸场!Seed-Music发布,支持一键生成高质量歌曲、片段编辑等
机器之心发布 机器之心编辑部高质量音乐生成、高灵活音乐编辑,Seed-Music 再次打开了 AI 音乐创作的天花板。放假期间,本 i 人又领教了被 e 人支配的恐惧。 ...
字节AI版小李子一开口:黄风岭,八百里
叨乐 发自 凹非寺量子位 | 公众号 QbitAI字节和浙大联合研发的项目Loopy火了! 只需一帧图像,一段音频,就能生成一段非常自然的视频! 研究团队还放出了Loop...
音频驱动人像视频模型:字节Loopy、CyberHost研究成果揭秘
机器之心发布 机器之心编辑部近期,来自字节跳动的视频生成模型 Loopy,一经发布就在 X 上引起了广泛的讨论。Loopy 可以仅仅通过一张图片和一段音频生成逼真...