标签:特征

字节AI版小李子一开口:黄风岭,八百里

叨乐 发自 凹非寺量子位 | 公众号 QbitAI字节和浙大联合研发的项目Loopy火了! 只需一帧图像,一段音频,就能生成一段非常自然的视频! 研究团队还放出了Loop...
阅读原文

阿里8B模型拿下多页文档理解新SOTA,324个视觉token表示一页,缩减80%

mPLUG团队 投稿量子位 | 公众号 QbitAI高效多页文档理解,阿里通义实验室mPLUG团队拿下新SOTA。 最新多模态大模型mPLUG-DocOwl 2,仅以324个视觉token表示单...
阅读原文

全球灾难风险研究所:评估大型语言模型接管灾难的风险

这篇研究报告主要内容围绕评估大型语言模型(LLMs)接管灾难的风险展开。报告从现有AI接管理论出发,通过对当前LLMs的特性与潜在接管灾难所需特征的对比分析...
阅读原文

MoE再下一城!港大提出AnyGraph:首次开启「图大模型」Scaling Law之路

新智元报道编辑:LRST 【新智元导读】AnyGraph聚焦于解决图数据的核心难题,跨越多种场景、特征和数据集进行预训练。其采用混合专家模型和特征统一方法处理结...
阅读原文

防AI换脸视频诈骗,中电金信联合复旦提出多模态鉴伪法,还入选顶会ACM MM

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

港大黄超团队推出AnyGraph, 首次揭秘图大模型的Scaling Law

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

防止黑客重建人脸,浙大&阿里人脸隐私保护新方案

金帅帆 投稿量子位 | 公众号 QbitAI对人脸数据安全的担忧,有新解了! 浙江大学与阿里安全部联手,推出了新的人脸隐私保护方案FaceObfuscator。 不法分子即使...
阅读原文

浙大李玺团队:指代表达理解新方法,ScanFormer粗到细迭代消除视觉冗余

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

一文读懂孤立森林

大数据文摘受权转载自数据派THU 作者:贾恩东编辑:黄继彦本文将介绍在异常检测领域中的一种具有线性时间复杂度和较高精准度且在学术界和工业界都有着不错反...
阅读原文

4秒看完2小时电影!阿里发布通用多模态大模型mPLUG-Owl3 | 开源

阿里mPLUG团队 投稿量子位 | 公众号 QbitAI4秒看完2小时电影,阿里团队新成果正式亮相—— 推出通用多模态大模型mPLUG-Owl3,专门用来理解多图、长视频。 具体...
阅读原文

蜘蛛侠妖娆起舞,下一代ControlNet来了!贾佳亚团队推出,即插即用,还能控制视频生成

克雷西 发自 凹非寺量子位 | 公众号 QbitAI只用不到10%的训练参数,就能实现ControlNet一样的可控生成! 而且SDXL、SD1.5等Stable Diffusion家族的常见模型都...
阅读原文

以「垂直模型」引领AIGC商业化落地,FancyTech的技术路径是什么?

机器之心原创 机器之心编辑部我们正在见证又一轮技术革新,这一次是 AIGC 为个体提供表达自我的工具,让创作变得更加容易和普及,但背后的推动力却并不是「大...
阅读原文

北大王选所:让多模态大模型更懂人类在做什么|ECCV 2024

北京大学王选计算机研究所雷廷 投稿量子位 | 公众号 QbitAI只用提示词,多模态大模型就能更懂场景中的人物关系了。 北京大学最新提出多模态提示学习(Conditi...
阅读原文

AI美女全军覆没!赛博照妖镜下集体变“鬼”,AI代码拆台AI生图

明敏 克雷西 发自 凹非寺量子位 | 公众号 QbitAI赛博照妖镜下,AI美女全变鬼。 来看它的牙。 把图像饱和度拉满,AI人像的牙齿就会变得非常诡异,边界模糊不清...
阅读原文

LLM可解释性的未来希望?稀疏自编码器是如何工作的,这里有一份直观说明

机器之心报道 编辑:Panda简而言之:矩阵 → ReLU 激活 → 矩阵在解释机器学习模型方面,稀疏自编码器(SAE)是一种越来越常用的工具(虽然 SAE 在 1997 年左右...
阅读原文
1237