语义 - 第 3 页

微软让MoE长出多个头，大幅提升专家激活率

机器之心报道编辑：Panda WMH-MoE 能优化几乎所有专家，实现起来非常简单。混合专家（MoE）是个好方法，支持着现在一些非常优秀的大模型，比如谷歌家的 Gemi...

阅读原文

AIGC动态

2年前 (2024)

立即预约 Google I/O 2024 会议直播！百科详解一夜爆火的全新神经网络架构 KAN

? Google I/O 2024 Keynote 主题演讲将于 5 月 15 日（下周三）凌晨 1 点举行，届时 HyperAI超神经会在视频号和 B 站实时转播，立即预约不错过↓ ‍ 直播结束后...

阅读原文

AIGC动态

2年前 (2024)

今日arXiv最热NLP大模型论文：NAACL24实锤语言学对大模型“负优化”，抽象语义表示+思维链有损表现

夕小瑶科技说原创作者 | Richard大语言模型正以势不可挡的姿态席卷自然语言处理领域。在这个语言模型大显神威的时代，很多任务都转变为了端到端的文本生成任...

阅读原文

AIGC动态

2年前 (2024)

LeCun上月球？南开、字节开源StoryDiffusion让多图漫画和长视频更连贯

机器之心报道编辑：杨文、亚鹂有了 StoryDiffusion，更加一致性的图像和视频生成得到了保障。两天前，图灵奖得主 Yann LeCun 转载了「自己登上月球去探索」...

阅读原文

AIGC动态

2年前 (2024)

今日arXiv最热联邦学习论文：通信成本降低94%，中科院计算所发布个性化联邦学习方法

夕小瑶科技说原创作者 | Richard引言：你的隐私，联邦来守护！想象一下，未来你的手机就像一位贴心的私人助理，能够洞察你的喜好、日程，甚至预测你的情绪。...

阅读原文

AIGC动态

2年前 (2024)

ICLR 2024 | 跨领域准确进行零样本异常检测，浙大等提出AnomalyCLIP

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术...

阅读原文

AIGC动态

2年前 (2024)

别再说国产大模型技术突破要靠 Llama 3 开源了

SuperBench评测显示，Llama 3不敌国产大模型。作者丨张进编辑丨陈彩娴近日，千呼万唤之下，Meta终于发布了开源大模型Llama 3的 8B 和 70B 版本，再次震动 A...

阅读原文

AIGC动态

2年前 (2024)

CVPR 2024 | 字节提出新一代数据集COCONut，比COCO粒度分割更密集

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术...

阅读原文

AIGC动态

2年前 (2024)

谷歌DeepMind发布Gecko：专攻检索，与大7倍模型相抗衡

机器之心报道编辑：陈萍Gecko 是一种通用的文本嵌入模型，可用于训练包括文档检索、语义相似度和分类等各种任务。文本嵌入模型在自然语言处理中扮演着重要...

阅读原文

AIGC动态

2年前 (2024)

CVPR 2024 | 更高效、更准确的拖拽编辑 Drag Your Noise

新加坡管理大学何盛烽团队联合华南师范大学在CVPR 2024上发表了工作《Drag Your Noise: Interactive Point-based Editing via Diffusion Semantic Propagatio...

阅读原文

AIGC动态

2年前 (2024)

关于 RAG、AI Agent、多模态，我们的理解与探索

嘉宾 | 王元编辑 | 李忠良引言：在这个快速发展的数字时代，生成式 AI 不仅仅是一个概念，而是正在被塑造成为未来技术生态系统的核心。随着 LLM 的崛起，我们...

阅读原文

AIGC动态

2年前 (2024)

提升生成式零样本学习能力，视觉增强动态语义原型方法入选CVPR 2024

机器之心专栏机器之心编辑部虽然我从来没见过你，但是我有可能「认识」你 —— 这是人们希望人工智能在「一眼初见」下达到的状态。为了达到这个目的，在传统...

阅读原文

AIGC动态

2年前 (2024)

颜水成/程明明新作！Sora核心组件DiT训练提速10倍，Masked Diffusion Transformer V2开源

新智元报道编辑：LRS 好困【新智元导读】Masked Diffusion Transformer V2在ImageNet benchmark 上实现了1.58的FID score的新SoTA，并通过mask modeling表征...

阅读原文

AIGC动态

2年前 (2024)

清华NLP组发布InfLLM：无需额外训练，「1024K超长上下文」100%召回！

新智元报道编辑：LRS 【新智元导读】挖掘大模型固有的长文本理解能力，InfLLM在没有引入额外训练的情况下，利用一个外部记忆模块存储超长上下文信息，实现了...

阅读原文

AIGC动态

2年前 (2024)

从问题到解法！对于大模型RAG技术的一些复盘思考

智猩猩和智东西发起主办的2024中国生成式AI大会将于4月18-19日在北京举办。主会场将进行开幕式、大模型专场、AI Infra专场和AIGC应用专场；分会场将进行具身...

阅读原文

AIGC动态

2年前 (2024)

标签：语义