标签:语音

人人都能当周杰伦!Suno作曲,ChatGPT写词,网友用Transformer造出神曲!

编译 | 核子可乐、Tina 输入音乐流派风格、内容主题,仅需几秒钟内就可生成 2 分钟音乐...... 近日,人工智能初创企业 Suno 对外发布了 Suno 模型 V3 版本,...
阅读原文

开源AI掌机爆火,首批预售2.5小时抢光!

鱼羊 发自 凹非寺量子位 | 公众号 QbitAI火爆一时的AI硬件Rabbit R1还没来得及发货,有人已经替他们开源了。 设备名叫01 Light,通过它你可以直接语音操控电...
阅读原文

微软NaturalSpeech语音合成推出第三代,网友惊呼:超自然!实至名归

机器之心专栏 机器之心编辑部SOTA 语音合成效果。 文本到语音合成(Text to Speech,TTS)作为生成式人工智能(Generative AI 或 AIGC)的重要课题,在近年来...
阅读原文

ICLR 2024 | 为音视频分离提供新视角,清华大学胡晓林团队推出RTFS-Net

机器之心专栏 机器之心编辑部视听语音分离(AVSS)技术旨在通过面部信息从混合信号中分离出目标说话者的声音。这项技术能够应用于智能助手、远程会议和增强现...
阅读原文

内含教程丨音色克隆模型 GPT-SoVITS,5 秒语音就能克隆出相似度 95% 的声音

编辑:xixi,李宝珠 RVC 创始人开源了一款音色克隆项目 GPT-SoVITS,仅需提供 5 秒语音样本,便可收获相似度达到 80%~95% 的克隆语音。「语音」是人类接触 AI...
阅读原文

ElevenLabs 推出人工智能音效模型

点击上方蓝字关注我们“ElevenLabs计划推出新的文本转声音模型,让创作者通过描述想象力生成音效。该公司早已研究AI技术,此次新模型填补了AI视频生成缺乏音频...
阅读原文

语音生成的「智能涌现」:10万小时数据训练,亚马逊祭出10亿参数BASE TTS

机器之心报道 编辑:蛋酱伴随着生成式深度学习模型的飞速发展,自然语言处理(NLP)和计算机视觉(CV)已经经历了根本性的转变,从有监督训练的专门模型,转...
阅读原文

每周编辑精选|希尔贝壳语音数据集系列上线、中国学者建立乳腺癌预后评分系统 MIRS

🏮新春佳节,归程千里为团圆 🏮人间烟火,年味浓浓阖家欢 辞别玉兔,金龙迎春。明晚就是大年三十除夕夜了!HyperAI超神经在这里提前祝大家新春快乐~龙行龘龘(d...
阅读原文

Nature | 揭秘人类语言产生的神经元机制:单个神经元如何编码自然语言

引言语音作为人类最基本的交流方式之一,其复杂性和精细度一直是神经科学研究的重点。近年来,随着科技的进步,特别是高密度神经电极技术如Neuropixels的出现...
阅读原文

个性经济时代,MiniMax 语音大模型如何 To C?

AI rapper,正式出道。作者丨王 悦 编辑丨陈彩娴 大约一个月前,距离 GPT Store 上线还有两周,一位名为 Kyle Tryon 的国外开发者在个人博客上分享了其基于 C...
阅读原文

实测讯飞星火V3.5:全语音交互比肩GPT-4!超逼真唠嗑让你根本停不下来

白交 梦晨 发自 凹非寺量子位 | 公众号 QbitAI“2024年上半年对标GPT-4”,这是23年科大讯飞全球1024开发者节现场给出的承诺。 今天,2024刚开年,讯飞星火就迎...
阅读原文

AI哄女友应用上线爆火;OpenAI CEO赴韩讨论AI芯片合作;AI语音克隆创企跻身独角兽丨AIGC大事日报

01/23 全球AIGC产业要闻 1、OpenAI CEO本周将赴韩讨论AI芯片合作 2、Anthropic被曝毛利率为50%~55% 3、Alphabet X实验室裁员数十人 4、AI语音克隆公司ElevenL...
阅读原文

1分钟复刻明星语音,这家AI创企开年跻身独角兽

鱼羊 发自 凹非寺量子位 | 公众号 QbitAI2024年第一个月,又一AI初创公司跻身独角兽: 专注于AI语音合成的ElevenLabs,刚刚完成8000万美元(约合人民币5.7亿...
阅读原文

AI每日要闻:1月22日

点击上方蓝字关注我们特斯拉全自动驾驶系统重大更新:FSD Beta v12采用神经网络,放弃代码驱动特斯拉最新全自动驾驶系统更新FSD Beta v12向非员工推出,采用...
阅读原文

GPT-5,奥特曼最新剧透

梦晨 发自 凹非寺量子位 | 公众号 QbitAIGPT-5的消息越来越藏不住了,连OpenAI CEO奥特曼都不再遮遮掩掩—— 开始在各种公开场合频繁造势,不断挑动科技圈的神...
阅读原文