标签：音频

WPS接入DeepSeek，秒变办公神器！

WPS 大家经常用来日常写作，虽然本身提供了AI功能，但可惜需要会员，本文教你三分钟接入最火的DeepSeek，让WPS秒变办公神器。 DeepSeek API申请地址：http:/...

阅读原文

AI教程

1年前 (2025)

AI赚钱副业~AI生成影视解说，半个月涨粉变现3.5W+！

这两年大家都在感叹生活不易，然而我想说的是，机会还是有的，但问题不在于有没有，而在于你是否能够认准机会，然后抓住它。接触过很多咨询项目的人，发现...

使用教程

2年前 (2024)

微信公众号悄悄上线AI音色克隆，微信的一小步，却是AI的一大步。

大数据文摘受权转载自数字生命卡兹克作者：卡兹克这篇文章，可能是我有史以来最特殊的一篇文章。因为当你点开右上角的三个点，点击听全文的时候。可能你...

阅读原文

AIGC动态

2年前 (2024)

今天，智谱「新清影」上线，率先进入有声视频生成时代！还要继续开源宠粉

夕小瑶科技说原创作者 | 夕小瑶编辑部来，你先把手机音量打开，然后去“听”下面一段视频：你是不是一脸懵逼？不知道我想表达什么？视频是AI生成的并不奇怪...

阅读原文

AIGC动态

2年前 (2024)

百度又放大招！视觉生成模型 Hallo2 或将落地数字人等场景

作者 | 华卫近日，百度联合复旦大学等发布 Hallo2，一个可以生成长达数小时且分辨率为 4K 的人物动画的视觉模型。Hallo2 目前已经在 GitHub 平台开源，供全...

阅读原文

AIGC动态

2年前 (2024)

刚刚，我们感受了一波最「像人」的国产AI，模型还是开源的

机器之心原创作者：杜伟、蛋酱今年 5 月，OpenAI 首次展示了 GPT-4o 的语音功能，无论是对话的响应速度还是与真人声音的相似度，都颇为惊艳。特别是它允许用...

阅读原文

AIGC动态

2年前 (2024)

NotebookLM核心负责人访谈：项目不到 10个人，体验惊艳全球，但它还只是个技术demo

难以置信，在 2024 年，Google 还能推出全行业叫好的惊艳项目——不是商业化产品，而是在设计、体验上让行业学到一课的小项目。在上周的 OpenAI Dev Day 上，S...

阅读原文

AIGC动态

2年前 (2024)

谷歌这款AI应用凭什么在一年后爆红？大神卡帕西：或是下一个ChatGPT

来源：AI前线编译：核子可乐、Tina 它实际是一款可由最终用户定制的 RAG 产品。或是下一个 ChatGPT？最近几天，人们似乎对一款已经不新鲜的 AI 助手 Noteboo...

阅读原文

AIGC动态

2年前 (2024)

Meta又给OpenAI一记重击，视频生成Movie Gen震撼登场，甚至可以配音、编辑

机器之心报道编辑：Panda、大盘鸡视频生成领域真是越来越卷且越来越迈向实用性！在 OpenAI Sora 难产的时候，Meta 首次公开展示了自家的「用于媒体的突破性...

阅读原文

AIGC动态

2年前 (2024)

大神卡帕西安利爆火AI应用，称「或是下一个ChatGPT」

衡宇发自凹非寺量子位 | 公众号 QbitAI大神卡帕西墙裂推荐！甚至预言这个AI应用，有可能开启「和ChatGPT一样大的机会」。它就是来自谷歌的实验性AI产品，...

阅读原文

AIGC动态

2年前 (2024)

三只羊卢总的录音AI到底能不能做出来？我的答案是：当然能。

大数据文摘受权转载自数字生命卡兹克作者：卡兹克今天凌晨，N多人给我发了一张图，说警方通报了，问我到底怎么看三只羊录音是不是AI这事。还有朋友跟我说...

阅读原文

AIGC动态

2年前 (2024)

150万条多语种音频数据！浙大清华发布语音伪造检测框架SafeEar，兼顾隐私保护｜CCS 2024

新智元报道编辑：LRST 【新智元导读】SafeEar是一种内容隐私保护的语音伪造检测方法，其核心是设计基于神经音频编解码器的解耦模型，分离语音声学与语义信息...

阅读原文

AIGC动态

2年前 (2024)

开源版GPT-4o来了，AI大神Karpathy盛赞！67页技术报告全公开

新智元报道编辑：alan 【新智元导读】两个多月前那个对标GPT-4o的端到端语音模型，终于开源了。大神Karpathy体验之后表示：nice！前段时间技惊四座、剑指GPT-...

阅读原文

AIGC动态

2年前 (2024)

开源版《Her》来了，技术报告已公开！大神Karpathy：它很有个性

一水发自凹非寺量子位 | 公众号 QbitAI大神Karpathy鼎力推荐，开源版「Her」Moshi再引关注！（Moshi）的性格非常有趣，它会突然断断续续，有时会无缘无故...

阅读原文

AIGC动态

2年前 (2024)

字节音乐大模型炸场！Seed-Music发布，支持一键生成高质量歌曲、片段编辑等

机器之心发布机器之心编辑部高质量音乐生成、高灵活音乐编辑，Seed-Music 再次打开了 AI 音乐创作的天花板。放假期间，本 i 人又领教了被 e 人支配的恐惧。 ...

阅读原文

AIGC动态

2年前 (2024)

字节AI版小李子一开口：黄风岭，八百里

叨乐发自凹非寺量子位 | 公众号 QbitAI字节和浙大联合研发的项目Loopy火了！只需一帧图像，一段音频，就能生成一段非常自然的视频！研究团队还放出了Loop...

阅读原文

AIGC动态

2年前 (2024)

音频驱动人像视频模型：字节Loopy、CyberHost研究成果揭秘

机器之心发布机器之心编辑部近期，来自字节跳动的视频生成模型 Loopy，一经发布就在 X 上引起了广泛的讨论。Loopy 可以仅仅通过一张图片和一段音频生成逼真...

阅读原文

AIGC动态

2年前 (2024)

12 3…6