标签:实时
AI赚钱副业~AI生成影视解说,半个月涨粉变现3.5W+!
这两年大家都在感叹生活不易,然而我想说的是,机会还是有的,但问题不在于有没有,而在于你是否能够认准机会,然后抓住它。 接触过很多咨询项目的人,发现...
每帧都是AI实时生成的,全球首款AI游戏问世了!
机器之心报道 编辑:佳琪、泽南欢迎来到 Transformer 的世界。两个月前,我们对 AI 游戏的认知刚刚被谷歌 GameNGen 颠覆。他们实现了历史性的突破,从此不再...
突发!OpenAI正式发布ChatGPT网络搜索,彻底颠覆谷歌!
开讲预告11月7日晚7点,上海 AI Lab OpenGVLab 博士后研究员 罗根,将以《Mono-InternVL: 突破原生多模态大模型性能瓶颈》为主题进行直播讲解,欢迎扫码报名~...
大模型重塑智能硬件!人手一个智能助手的时代来了?
▲图像由AI生成 能“动口”解决的事情,不用总是“动手”啦。 作者|徐豫 编辑|漠影 在生成式AI浪潮的影响下,智能硬件开始出现全新的人机交互体验。 AI智能助手更...
GPT-4o、NotebookLM带来的AI语音新变化,声网们是怎么想的?
GPT-4o 的语音演示,引燃了行业对于 AI 产品语音实时交互的想象,完全实时、可随时打断的 AI 助手,正成为新的 趋势。 而 Google Labs 推出的 NotebookLM,则...
实时音视频领域拓荒者的十年
谁能抓住这波实时对话式AI的机遇?作者丨张 进 编辑丨陈彩娴 2015 年,声网将WebRTC大会引入中国,筹办了第一届面向国内开发者、业务人员和用户的RTC(实时视...
智能眼镜这个被忽略的功能,他们已经离不开了
字幕是 一种 权利字幕,已经成了现代人的「外挂」。通勤嘈杂,摸鱼易露馅,学习会分心,听和看并用,才能避免进度条白白走了冤枉路。 然而,对一些人来说,字...
开源数字人实时对话:形象可自定义,支持语音输入,对话首包延迟可低至3s|已上线阿里ModelScope魔搭社区
池炜恒(池化) 投稿量子位 | 公众号 QbitAI开源数字人实时对话Demo来了~ 支持语音输入和实时对话,数字人形象可自定义的那种。 生成的数字人效果belike: ...
乏善可陈的第二届OpenAI开发者大会,果然没有掀起太大波澜
机器之心报道 编辑:杨文、杜伟OpenAI宫斗后的 DevDay 开发者大会,没有什么惊喜。OpenAI 的宫斗大戏刚落下帷幕,今日凌晨就在旧金山召开了第二届 DevDay 开...
在线教程丨1 步生成 SOTA 级别图像,Hyper-SD 一键启动教程上线!
作者:xixi 编辑:李姝,李宝珠 Hyper-SD 是由字节跳动开源的一种先进的扩散模型加速技术,能够快速生成高质量图像。「Hyper-SD 实时绘画生图」已上线至 Hype...
通义千问、MiniMax、智谱、Soul都来了,就差你了!
GenAI 的快速发展正在为各行各业带来变革,例如超拟人化的 AI 社交、全新的人机交互体验、全新的内容生产方式等等,这背后得益于大语言模型能力的不断进化,...
阿里通义上新PPT创作!PC端“效率”功能三合一,听读写一站搞定
鱼羊 衡宇 发自 凹非寺量子位 | 公众号 QbitAI这年头,哪有人上班不发疯的(doge)。 就拿PPT来说,赵晓卉“PPTSD”这词儿一出,那真是戳到了打工人心坎上。 对...
谷歌推世界首个AI游戏引擎,2000亿游戏产业恐颠覆!0代码生成游戏,老黄预言成真
新智元报道编辑:编辑部 【新智元导读】炸裂!世界上首个完全由AI驱动的游戏引擎来了。谷歌研究者训练的GameNGen,能以每秒20帧实时生成DOOM的游戏画面,画面...
视频生成要有自己的系统!尤洋团队历时半年开源VideoSys
机器之心报道 编辑:张倩视频时代需要自己的基础设施。VideoSys 的目标是使视频生成对于每个人而言都简便、迅速且成本低廉。自今年起,OpenAI 的 Sora 和其他...
直播版Deepfake太恐怖!单张照片实时视频换脸,5分钟安装不挑硬件
白交 衡宇 发自 凹非寺量子位 | 公众号 QbitAI马斯克“最新直播”,不好好扣他那polo衫扣子,拿个手机打光晃来晃去。 看他脑袋左转右转,嘴角扬起的微笑,ak都...
Sam Altman亲自确认:下周开始推送GPT-4o实时语音功能!
9月6-7日,2024全球AI芯片峰会将在北京召开。目前,AMD人工智能事业部高级总监王宏强,清华大学交叉信息研究院助理教授、北极雄芯创始人马恺声,珠海芯动...