标签:表征

AI赚钱副业~AI生成影视解说,半个月涨粉变现3.5W+!

这两年大家都在感叹生活不易,然而我想说的是,机会还是有的,但问题不在于有没有,而在于你是否能够认准机会,然后抓住它。 接触过很多咨询项目的人,发现...

评估大模型不看输出看「内在」,上交大新测试指标入选NeurIPS 2024

上交大MIFA实验室 魏来 投稿量子位 | 公众号 QbitAI能够深入大模型内部的新评测指标来了! 上交大MIFA实验室提出了全新的大模型评估指标Diff-eRank。 不同于...
阅读原文

深度解读快手可图大模型的技术演进与应用探索

演讲嘉宾|李岩,快手可图大模型团队负责人 编辑 |蔡芳芳 策划 |AICon 全球人工智能开发与应用大会 图像与视频生成技术逐渐成为多个行业关注的焦点,特别...
阅读原文

你和ChatGPT理解语言的方式一样吗?从表征对齐角度比较人工神经网络与生物大脑

导语ChatGPT 理解语言的方式和人类一样吗?卷积神经网络和人脑视觉系统的表征有哪些类似之处?不同信息处理系统之间的差异要如何定量刻画?本文介绍了表征对...
阅读原文

谢赛宁新作:表征学习有多重要?一个操作刷新SOTA,DiT训练速度暴涨18倍

新智元报道编辑:乔杨 【新智元导读】在NLP领域,研究者们已经充分认识并认可了表征学习的重要性,那么视觉领域的生成模型呢?最近,谢赛宁团队发表的一篇研...
阅读原文

任意尺寸大规模场景生成新策略!慕尼黑工大提出无限三维场景生成模型LT3SD!一作孟权博士讲座预告

近期,3D扩散模型在物体生成领域已取得了显著进展,目前已能够生成精细且逼真的三维物体。然而,当尝试将这些模型应用于更广泛的三维场景生成时,却受到了空...
阅读原文

ICML’24研讨会杰出论文奖!清华AIR&商汤研究院提出全新的具身多模态表征预训练方法 | 讲座预告

近年来,以谷歌RT系列为代表的视觉-语言-控制模型(VLCM,Vision-Language-Control Model)受到广泛关注。VLCM 智能体可以通过视觉理解环境,并执行人类语言...
阅读原文

扩散模型训练方法一直错了!谢赛宁:Representation matters

机器之心报道 编辑:Panda、小舟Representation matters. Representation matters. Representation matters.是什么让纽约大学著名研究者谢赛宁三连呼喊「Repr...
阅读原文

不出所料!Jürgen又站出来反对Hinton得诺奖,Nature也炮轰提名过程不透明

机器之心报道 编辑:蛋酱、佳琪今年的诺贝尔物理学奖颁给了两位享誉盛名的 AI 研究者 John J. Hopfield 和 Geoffrey E. Hinton,这确实让很多人感到意外。 第...
阅读原文

5秒内快速生成、直出工业级PBR资产,三维扩散模型3DTopia-XL开源

AIxiv 专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心 AIxiv 专栏接收报道了 2000 多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了...
阅读原文

字节音乐大模型炸场!Seed-Music发布,支持一键生成高质量歌曲、片段编辑等

机器之心发布 机器之心编辑部高质量音乐生成、高灵活音乐编辑,Seed-Music 再次打开了 AI 音乐创作的天花板。放假期间,本 i 人又领教了被 e 人支配的恐惧。 ...
阅读原文

搜索图片有新招了!北大课题组提出图像检索新方法,输入草图or艺术or低分辨率 | ECCV 2024

李昊 投稿量子位 | 公众号 QbitAI从一大堆图片中精准找图,有新招了!论文已经中了ECCV 2024。 北京大学袁粒课题组,联合南洋理工大学实验室,清华自动化所提...
阅读原文

Emory提出最新PolygonGNN框架:可捕捉通用多边形内外的空间关系 | KDD 2024

新智元报道编辑:LRST 【新智元导读】PolygonGNN是一种新型框架,用于学习包括单一和多重多边形在内的多边形几何体的表征,它通过异质可见图来捕捉多边形内外...
阅读原文

八问八答搞懂Transformer内部运作原理

机器之心报道 机器之心编辑部七年前,论文《Attention is all you need》提出了 transformer 架构,颠覆了整个深度学习领域。 如今,各家大模型都以 transfor...
阅读原文

打乱/跳过Transformer层会怎样?最新研究揭开其信息流动机制,一口气解答8大问题

西风 发自 凹非寺量子位 | 公众号 QbitAITransformer中的信息流动机制,被最新研究揭开了: 所有层都是必要的吗?中间层在做同样的事吗?层的顺序重要吗? 如...
阅读原文

斯坦福博士图解AlphaFold 3:超多细节+可视化还原ML工程师眼中的AF3

新智元报道编辑:乔杨 庸庸 【新智元导读】AlphaFold 3的论文太晦涩?没关系,斯坦福大学的两位博士生「图解」AlphaFold 3 ,将模型架构可视化,同时不遗漏任...
阅读原文
1235