标签:特征

AI赚钱副业~AI生成影视解说,半个月涨粉变现3.5W+!

这两年大家都在感叹生活不易,然而我想说的是,机会还是有的,但问题不在于有没有,而在于你是否能够认准机会,然后抓住它。 接触过很多咨询项目的人,发现...

transformer的细节到底是怎么样的?Transformer 连环18问!

来源: https://www.zhihu.com/question/362131975/answer/3058958207 作者:爱问问题的王宸@知乎(已授权) 编辑:极市平台 为什么想通过十八个问题的方式总...
阅读原文

视觉定位新SOTA!华人团队开源革新框架SegVG,边界框转为分割信号 | ECCV 2024

新智元报道编辑:LRST 【新智元导读】SegVG是一种新的视觉定位方法,通过将边界框注释转化为像素级分割信号来增强模型的监督信号,同时利用三重对齐模块解决...
阅读原文

高效评估多模态预训练对齐质量,中科大提出模态融合率MIR

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

大模型内部也有功能分区,MIT团队揭示其“大脑”结构

来源:DeepTech深科技 AI 的“大脑”究竟长什么样? 近期,来自美国麻省理工学院的研究团队通过稀疏自编码器(SAE,Sparse Autoencoder)在大语言模型的激活空...
阅读原文

AI自己「长出」了类似大脑的「脑叶」?新研究揭示LLM特征的惊人几何结构

机器之心报道 编辑:张倩、蛋酱大型语言模型在学习概念时竟然会形成令人惊讶的几何结构,比如代码和数学特征会形成一个「叶(lobe)」,类似于我们在做磁共振...
阅读原文

MIT大牛新发现:LLM和人类大脑结构类似,存在脑叶分区!

夕小瑶科技说 分享来源 | 新智元LLM居然长「脑子」了? 就在刚刚,MIT传奇大牛Max Tegmark团队的新作,再次炸翻AI圈。 论文地址:https://arxiv.org/abs/2410...
阅读原文

AI「长脑子」了?LLM惊现「人类脑叶」结构并有数学代码分区,MIT大牛新作震惊学界!

新智元报道编辑:编辑部 HYZ 【新智元导读】Max Tegmark团队又出神作了!他们发现,LLM中居然存在人类大脑结构一样的脑叶分区,分为数学/代码、短文本、长篇...
阅读原文

杰弗里·辛顿:从小语言到大语言,人工智能究竟如何理解人类?

来源:返朴 演讲:杰弗里·辛顿 翻译:陈国华(北京外国语大学外国语言研究所教授)2024 年 4 月 8 日辛顿获得尤利西斯奖章,以表彰他对计算机科学人工智能领...
阅读原文

中科大成果斩获图学习“世界杯”单项冠军,霸榜蛋白质功能预测任务超1年 | TPAMI 2024

MIRA Lab 投稿量子位 | 公众号 QbitAI中科大成果,拿下图学习“世界杯”单项冠军! 由中科大王杰教授团队(MIRA Lab)提出的首个具有最优性保证的大语言模型和...
阅读原文

150万条多语种音频数据!浙大清华发布语音伪造检测框架SafeEar,兼顾隐私保护|CCS 2024

新智元报道编辑:LRST 【新智元导读】SafeEar是一种内容隐私保护的语音伪造检测方法,其核心是设计基于神经音频编解码器的解耦模型,分离语音声学与语义信息...
阅读原文

ECCV 2024 oral | 首次基于深度聚类的多模态融合,上交、伯克利提出双向结构对齐的融合网络新SOTA!

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

港大新型图基础模型AnyGraph:挑战Scaling Law,精准建模多样化结构模式和特征空间

AnyGraph团队 投稿量子位 | 公众号 QbitAI新型图基础模型来了—— AnyGraph,基于图混合专家(MoE)架构,专门为实现图模型跨场景泛化而生。 通过MoE架构、路由...
阅读原文

ECCV 2024 | 一眼临摹:瞥一眼就能模仿笔迹的AI

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

字节AI版小李子一开口:黄风岭,八百里

叨乐 发自 凹非寺量子位 | 公众号 QbitAI字节和浙大联合研发的项目Loopy火了! 只需一帧图像,一段音频,就能生成一段非常自然的视频! 研究团队还放出了Loop...
阅读原文

阿里8B模型拿下多页文档理解新SOTA,324个视觉token表示一页,缩减80%

mPLUG团队 投稿量子位 | 公众号 QbitAI高效多页文档理解,阿里通义实验室mPLUG团队拿下新SOTA。 最新多模态大模型mPLUG-DocOwl 2,仅以324个视觉token表示单...
阅读原文
1237