标签:语义
微软让MoE长出多个头,大幅提升专家激活率
机器之心报道 编辑:Panda WMH-MoE 能优化几乎所有专家,实现起来非常简单。混合专家(MoE)是个好方法,支持着现在一些非常优秀的大模型,比如谷歌家的 Gemi...
立即预约 Google I/O 2024 会议直播!百科详解一夜爆火的全新神经网络架构 KAN
📢 Google I/O 2024 Keynote 主题演讲将于 5 月 15 日(下周三)凌晨 1 点举行,届时 HyperAI超神经会在视频号和 B 站实时转播,立即预约不错过↓ 直播结束后...
今日arXiv最热NLP大模型论文:NAACL24实锤语言学对大模型“负优化”,抽象语义表示+思维链有损表现
夕小瑶科技说 原创作者 | Richard大语言模型正以势不可挡的姿态席卷自然语言处理领域。在这个语言模型大显神威的时代,很多任务都转变为了端到端的文本生成任...
LeCun上月球?南开、字节开源StoryDiffusion让多图漫画和长视频更连贯
机器之心报道 编辑:杨文、亚鹂有了 StoryDiffusion,更加一致性的图像和视频生成得到了保障。两天前,图灵奖得主 Yann LeCun 转载了「自己登上月球去探索」...
今日arXiv最热联邦学习论文:通信成本降低94%,中科院计算所发布个性化联邦学习方法
夕小瑶科技说 原创作者 | Richard引言:你的隐私,联邦来守护!想象一下,未来你的手机就像一位贴心的私人助理,能够洞察你的喜好、日程,甚至预测你的情绪。...
ICLR 2024 | 跨领域准确进行零样本异常检测,浙大等提出AnomalyCLIP
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
别再说国产大模型技术突破要靠 Llama 3 开源了
SuperBench评测显示,Llama 3不敌国产大模型。作者丨张进 编辑丨陈彩娴 近日,千呼万唤之下,Meta终于发布了开源大模型Llama 3的 8B 和 70B 版本,再次震动 A...
CVPR 2024 | 字节提出新一代数据集COCONut,比COCO粒度分割更密集
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
谷歌DeepMind发布Gecko:专攻检索,与大7倍模型相抗衡
机器之心报道 编辑:陈萍Gecko 是一种通用的文本嵌入模型,可用于训练包括文档检索、语义相似度和分类等各种任务。 文本嵌入模型在自然语言处理中扮演着重要...
CVPR 2024 | 更高效、更准确的拖拽编辑 Drag Your Noise
新加坡管理大学何盛烽团队联合华南师范大学在CVPR 2024上发表了工作《Drag Your Noise: Interactive Point-based Editing via Diffusion Semantic Propagatio...
关于 RAG、AI Agent、多模态,我们的理解与探索
嘉宾 | 王元编辑 | 李忠良引言:在这个快速发展的数字时代,生成式 AI 不仅仅是一个概念,而是正在被塑造成为未来技术生态系统的核心。随着 LLM 的崛起,我们...
提升生成式零样本学习能力,视觉增强动态语义原型方法入选CVPR 2024
机器之心专栏 机器之心编辑部虽然我从来没见过你,但是我有可能「认识」你 —— 这是人们希望人工智能在「一眼初见」下达到的状态。 为了达到这个目的,在传统...
颜水成/程明明新作!Sora核心组件DiT训练提速10倍,Masked Diffusion Transformer V2开源
新智元报道编辑:LRS 好困 【新智元导读】Masked Diffusion Transformer V2在ImageNet benchmark 上实现了1.58的FID score的新SoTA,并通过mask modeling表征...
清华NLP组发布InfLLM:无需额外训练,「1024K超长上下文」100%召回!
新智元报道编辑:LRS 【新智元导读】挖掘大模型固有的长文本理解能力,InfLLM在没有引入额外训练的情况下,利用一个外部记忆模块存储超长上下文信息,实现了...
从问题到解法!对于大模型RAG技术的一些复盘思考
智猩猩和智东西发起主办的2024中国生成式AI大会将于4月18-19日在北京举办。主会场将进行开幕式、大模型专场、AI Infra专场和AIGC应用专场;分会场将进行具身...