标签:模型

杀疯了!谷歌卷视频到语音,逼真音效让AI视频告别无声!

机器之心报道 编辑:杨文AI圈这遍地开花的大好局面,让吃瓜群众们甚是惊喜。 这几天,大洋彼岸杀疯了! Luma 的热乎劲儿还没过去,昨晚 Runway 就甩出一个王...
阅读原文

大模型压缩量化方案怎么选?无问芯穹Qllm-Eval量化方案全面评估:多模型、多参数、多维度

机器之心发布 作者:李师尧(无问芯穹TechView)基于 Transformer架构的大型语言模型在各种基准测试中展现出优异性能,但数百亿、千亿乃至万亿量级的参数规模...
阅读原文

字节打造大模型TTS:不仅能高保真合成,而且支持调整编辑

机器之心报道 编辑:Panda通过高保真合成语音与真人语音无异。 首先来听一段《凡人修仙传》:你猜的没错,这段有声书并非来自某个专业制作团队,而是一个 AI ...
阅读原文

清华等高校推出首个开源大模型水印工具包MarkLLM,支持近10种最新水印算法

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

联创用ChatGPT写的一行代码让公司损失上万美元!网友:老板自己写的,找不到人背锅了

作者|Asim Shrestha 译者|核子可乐 编辑|冬梅编者按:ChatGPT 在编程时的使用已经非常广泛。近日,一支国外技术团队在利用 ChatGPT 生成代码进行开发时遇...
阅读原文

小红书、携程统统靠边站,Google Gemini 打造个性化旅游新体验

嘉宾 | 姚旭晨 编辑 | 李忠良 在现代旅游时代,传统导游面临着 Pokémon Go 和 Google Gemini 等创新技术的竞争。这些数字伴侣提供 7x24 全天候的可访问性、丰...
阅读原文

全球首个开源类Sora猛升级,16秒720p画质电影感拉满!代码权重全开源

新智元报道编辑:编辑部 【新智元导读】抢先OpenAI一步的「国产Sora」,再给开源社区带来亿点点震撼:权重代码全开源!16秒720p高清画质一键生成,人物渲染逼...
阅读原文

AI教父Hinton:我支持超级AI取代人类!

新智元报道编辑:乔杨 好困 【新智元导读】「AI教父」Geoffrey Hinton在最近的采访中表达了自己对AI智能的理解——LLM并不是简单的统计模型,已经具备了理解能...
阅读原文

CVPR 2024 Highlight | 北航等发布「时间特征维护」:无需训练,极致压缩加速Diffusion

新智元报道编辑:LRST 好困 【新智元导读】拯救4bit扩散模型精度,仅需时间特征维护——以超低精度量化技术重塑图像内容生成!近日,北航、莫纳什、UT Austin联...
阅读原文

王者归来!AI视频巨头Runway深夜发布Gen-3,演示暴打Sora惊艳网友

新智元报道编辑:Aeneas 桃子 【新智元导读】太震撼了!AI视频老牌选手Runway出手了,深夜发布的Gen-3在保真度、一致性和精细程度上再次重磅升级,画面细节直...
阅读原文

苹果发布会后刷屏的 iPad 计算器,最大的亮点不是算术

iPad 计算器 来了暌违十四年,iPad 迎来了一项「史诗级更新」——原生计算器。 苹果高管克雷格·费德里吉曾说过,希望让用户看到(iPad 版的计算器)时会惊叹「...
阅读原文

端侧大模型火了,但CPU被低估了|甲子光年

当前端侧推理的起点,未来端侧推理的支点。作者|赵健 大模型火了之后,GPU也火了。一时间,GPU的持有量几乎成为了评估大模型成败的“度量衡”。 GPU很好,但不...
阅读原文

Runway发布Gen-3 Alpha:用100万美元拍500部电影的时代来了!|甲子光年

Runway CTO:将在“几天内”向付费用户提供。作者|王艺‍‍‍ 编辑|赵健‍ 文生视频领域又有新模型来卷了。 北京时间6月17日晚九点,Runway发布了其最新的视频大...
阅读原文

王者归来!Runway震撼发布Gen3,文生视频再填重磅!

点击上方蓝字关注我们“摘要:Runway发布Gen-3 Alpha,AI视频生成技术取得显著进步,支持多种视频创作功能,引领行业新潮流。Runway 推出了其最新力作——Gen-3 ...
阅读原文

苹果 AI 揭秘:自研大模型会怎么用,和 OpenAI 是怎么合作的?

WWDC 之后,关于苹果的自研大模型,以及苹果和 OpenAI 合作的细节,我们似乎所知甚少。 腾讯科技的记者在 WWDC 及相关圆桌结束之后,注意到两份重要的资料: ...
阅读原文