标签:语音
AI赚钱副业~AI生成影视解说,半个月涨粉变现3.5W+!
这两年大家都在感叹生活不易,然而我想说的是,机会还是有的,但问题不在于有没有,而在于你是否能够认准机会,然后抓住它。 接触过很多咨询项目的人,发现...
语音AI赛道全解析:市场规模超 50 亿,最有机会的场景在哪里?
「未来,消费者更可能倾向于与 AI 沟通,而非人工客服,因为这将成为解决问题的最高效途径。」 这篇来自 Bessemer Venture Partners 的报告,是目前为止对语...
Alexa 做了 10 年,销量 4000 万台,却还是一个智能闹钟
十年前,2014 年 11 月 6 日,Alexa 发布,对贝佐斯来说,这个项目代表着未来。 名字来源于《星际迷航》中的「计算机」,语音控制的全能 AI 助手。 「从科幻...
大模型重塑智能硬件!人手一个智能助手的时代来了?
▲图像由AI生成 能“动口”解决的事情,不用总是“动手”啦。 作者|徐豫 编辑|漠影 在生成式AI浪潮的影响下,智能硬件开始出现全新的人机交互体验。 AI智能助手更...
大规模、动态「语音增强/分离」新基准!清华发布移动音源仿真平台SonicSim,含950+小时训练数据
新智元报道编辑:LRST 【新智元导读】清华大学推出的SonicSim平台和SonicSet数据集针对动态声源的语音处理研究提供了强有力的工具和数据支持,有效降低了数据...
国产最强语音大模型诞生,MaskGCT宣布开源,声音效果媲美人类
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
大模型重塑版讯飞输入法来了!能懂每个人的AI输入
搭载讯飞星火端侧输入大模型、讯飞星火语音大模型的讯飞输入法14.0亮相。 作者|程茜 编辑|漠影 智东西10月28日报道,讯飞输入法又上新,这次是端侧大模型重塑...
谷歌AI播客刚火,Meta就开源了平替,效果一言难尽
机器之心报道 编辑:杜伟、陈陈随着谷歌和 Meta 相继推出基于大语言模型的 AI 播客功能,将极大地丰富人类用户与 AI 智能体互动的体验。上个月,谷歌宣布对旗...
CNCC 落幕:国产大模型已经进化到能在横店给我们点咖啡
多模态 AI 之所以能成为趋势,是因为其触达了人类智能的本质。作者丨朱可轩 编辑丨陈彩娴 今年到 CNCC 现场参会的朋友,想必都对 CNCC 2024 举办所在地——超过...
智能眼镜这个被忽略的功能,他们已经离不开了
字幕是 一种 权利字幕,已经成了现代人的「外挂」。通勤嘈杂,摸鱼易露馅,学习会分心,听和看并用,才能避免进度条白白走了冤枉路。 然而,对一些人来说,字...
震惊!AI竟然学会了100种撒娇方式,让我分不清是人是鬼
夕小瑶科技说 原创作者 | 夕小瑶编辑部最近,我的AI助手简直像是开了挂一样!不仅能说会道,还能……撒娇?!而且是100种花式撒娇,招招致命,让我毫无招架之力...
刚刚,我们感受了一波最「像人」的国产AI,模型还是开源的
机器之心原创 作者:杜伟、蛋酱今年 5 月,OpenAI 首次展示了 GPT-4o 的语音功能,无论是对话的响应速度还是与真人声音的相似度,都颇为惊艳。特别是它允许用...
开源数字人实时对话:形象可自定义,支持语音输入,对话首包延迟可低至3s|已上线阿里ModelScope魔搭社区
池炜恒(池化) 投稿量子位 | 公众号 QbitAI开源数字人实时对话Demo来了~ 支持语音输入和实时对话,数字人形象可自定义的那种。 生成的数字人效果belike: ...
高通骁龙 8 至尊版发布,主频超 4GHz,Benchmark 6 多核破 1 万
牙膏 挤爆高通的骁龙旗舰芯片这几年的命名几经变更,比如前几年突然出现的骁龙 888,主要图一个吉利,后面变成了骁龙 8 Gen1、Gen2、Gen3,到了今年骁龙移动...
SAM 2.1上新、Lingua代码库发布,一Meta开源工具来袭
机器之心报道 机器之心编辑部今天,Meta 分享了一系列研究和模型,这些研究和模型支撑 Meta 实现高级机器智能(AMI)目标,同时也致力于开放科学和可复现...
Voice-first,闭关做一款语音产品的思考
三个月前我在硅谷沉浸式泡了两个多月把产品上的整体感受和几个趋势简短写在了这里,在和不同的创业者交流研究了 40 多个产品后,最终回归到了“语音”这个方向...