标签:模块

字节AI版小李子一开口:黄风岭,八百里

叨乐 发自 凹非寺量子位 | 公众号 QbitAI字节和浙大联合研发的项目Loopy火了! 只需一帧图像,一段音频,就能生成一段非常自然的视频! 研究团队还放出了Loop...
阅读原文

RTX3090可跑,360AI团队开源最新视频模型FancyVideo,红衣大叔都说好

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

蜘蛛侠妖娆起舞,下一代ControlNet来了!贾佳亚团队推出,即插即用,还能控制视频生成

克雷西 发自 凹非寺量子位 | 公众号 QbitAI只用不到10%的训练参数,就能实现ControlNet一样的可控生成! 而且SDXL、SD1.5等Stable Diffusion家族的常见模型都...
阅读原文

“在线版FLUX”已支持ControlNet,无需部署开箱即用,还能在线训练LoRA模块

克雷西 发自 凹非寺量子位 | 公众号 QbitAI“FLUX在线版”,新增一系列重磅功能! ControlNet、LoRA等重要模块都悉数到齐,而且开箱即用,无需自行配置工作流。...
阅读原文

iPhone 新增「灭霸」功能,去广告更丝滑了

灭霸出现 浏览器 至此干净一个稍微有些年头的梗: 在互联网出现之前,最小的粒子是夸克,在互联网出现之后,最小的粒子是广告上的那个叉。 现在,苹果打算将...
阅读原文

全球首个!清华/上海交大等联合构建面向糖尿病诊疗的视觉-大语言模型,登 Nature 子刊

作者:梅菜 编辑:李宝珠 清华大学团队联手上海交通大学团队、新加坡国立大学及新加坡国家眼科中心团队,成功构建全球首个面向糖尿病诊疗的视觉-大语言模型集...
阅读原文

寡姐带货国风Polo衫,马斯克穿牛仔走红毯!虚拟试衣新框架火了,只需两张图30秒即生成

种政 投稿自 凹非寺量子位 | 公众号 QbitAI只需两张图像,不到30秒,就能让马斯克穿牛仔走红毯~ 或者让寡姐带货国风Polo衫~ 就是二次元换装也不在话下。 来自...
阅读原文

彻底摒弃人工标注,AutoAlign方法基于大模型让知识图谱对齐全自动化

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

英伟达官宣全面开源GPU内核驱动,两年迭代至最强版本!下一代Blackwell全用开源

新智元报道编辑:庸庸 【新智元导读】英伟达全面转向开源GPU内核模块,历史将再次见证Linux社区开源的力量。英伟达宣布全面转向开源GPU内核模块! 这次开源行...
阅读原文

快手开源LivePortrait,GitHub 6.6K Star,实现表情姿态极速迁移

机器之心发布‍‍ 机器之心编辑部近日,快手可灵大模型团队开源了名为LivePortrait的可控人像视频生成框架,该框架能够准确、实时地将驱动视频的表情、姿态迁移...
阅读原文

新国立祭出视频生成“无限宝石“:2300帧仅需5分钟,提速100倍

夕小瑶科技说 原创作者 | Axe_越天下武功唯快不破—— 火云邪神 前一段时间,想必大家都有被各种文生视频给刷屏,但当看完之后,不知道大家是否都有一种意犹未...
阅读原文

理想汽车最新成果:基于MLLM的闭环规划智能体PlanAgent | 讲座预告

「自动驾驶新青年讲座」由智猩猩企划,致力于邀请全球知名高校、顶尖研究机构以及优秀企业的新青年,主讲在环境感知、精准定位、决策规划、控制执行等自动驾...
阅读原文

半小时教你手搓AI视频通话,还有懒人版代码已开源

克雷西 发自 凹非寺量子位 | 公众号 QbitAIGPT-4o的“AI视频通话”一鸽再鸽,但网友却是急不可耐想要体验。 于是,一位名叫Santiago(我们叫他三哥)的博主,用...
阅读原文

“千脑计划”正式启动,加入人工智能混战 | 追问观察

追问快读: 1. 今天的神经网络建立在1980年之前的神经科学基础之上,从那以后,人类掌握了更多新的关于神经科学的知识,“千脑计划”希望利用这些知识,通过大...
阅读原文

GPT-4顶替大学生参加考试,94%作弊未被揭穿!AI作弊毫无破绽

新智元报道编辑:编辑部 【新智元导读】真实的大学考试,已经被AI渗透了!英国雷丁大学的一项研究发现,在大学考试中,有94%的AI生成内容完全没有被老师发现...
阅读原文
1234