Project DIGITS

Project DIGITS 是 NVIDIA 推出的个人 AI 超级计算机,能为 AI 研究人员、数据科学家和学生提供强大的计算能力。Project DIGITS基于 NVIDIA Grace Blackwell ...
阅读原文

Edicho

Edicho 是香港科技大学、蚂蚁集团、斯坦福大学和香港中文大学推出的,基于扩散模型的图像编辑方法,能在多图像间实现一致性编辑。Edicho用免训练的方法,无需...
阅读原文

Mobile-Agent

Mobile-Agent 是具有移动性的智能代理软件实体,能在网络的各个节点之间移动,代表用户或其他代理进行工作。能根据具体情况中断当前执行,移动至另一设备上恢...
阅读原文

VideoRAG

VideoRAG是用于长视频理解的检索增强生成(Retrieval-Augmented Generation)技术。通过提取视频中的视觉对齐辅助文本,帮助大型视频语言模型(LVLMs)更好地...
阅读原文

轻创AI论文写作

轻创AI论文写作是创新的人工智能写作工具,旨在帮助用户高效地完成论文写作任务。通过先进的深度学习算法和大数据分析技术,能根据用户提供的主题和关键词,...
阅读原文

SPRIGHT

SPRIGHT(SPatially RIGHT)是亚利桑那州立大学 、Intel 实验室 、Hugging Face 、华盛顿大学等机构联合推出的,专注于空间关系的大型视觉-语言数据集,能解...
阅读原文

LIGER

LIGER是Meta AI等机构推出的混合检索模型,结合生成式检索和密集检索的优点。LIGER用生成式检索模块生成有限的候选项目集,基于密集检索对候选项目进行排序和...
阅读原文

SeedVR

SeedVR是南洋理工大学和字节跳动推出的扩散变换器模型,能实现高质量的通用视频修复。SeedVR基于引入移位窗口注意力机制,采用大尺寸(64×64)窗口和边界处的...
阅读原文

OpenAI智能体曝本月诞生!比谷歌Anthropic慢,竟是担心prompt攻击

原标题:OpenAI智能体曝本月诞生!比谷歌Anthropic慢,竟是担心prompt攻击 文章来源:新智元 内容字数:3288字OpenAI智能体发布延迟:安全问题成最大阻碍 Op...
阅读原文

纯视觉方案,精准操控电脑和手机!港大Aria-UI登顶,超越Claude 3.5

原标题:纯视觉方案,精准操控电脑和手机!港大Aria-UI登顶,超越Claude 3.5 文章来源:新智元 内容字数:13458字Aria-UI:纯视觉GUI智能交互的革命性突破 ...
阅读原文

剑指专业领域零部件级3D生成!Meta联手牛津推出全新多视图扩散模型

原标题:剑指专业领域零部件级3D生成!Meta联手牛津推出全新多视图扩散模型 文章来源:新智元 内容字数:4918字Meta与牛津大学合作推出PartGen:实现零部件级...
阅读原文

“要点脸吧!”大模型巨头“吸血”网站资源无底线,被惹怒的开发者来“复仇”了!

在 Mozilla 处理 Firefox 网络兼容性问题的工程师 Dennis Schubert 近期指责大模型公司疯狂爬取内容导致网站负载过高而运行变慢的帖子火了
阅读原文

北航&ZGCLAB 提出首个检索增强生成基准测试工具库 XRAG

XRAG为RAG各策略与多种评测指标提供简单的配置方法,只需点点点就可以评测啦!
阅读原文

独家丨前微软亚研院视觉专家胡瀚加入腾讯,负责混元多模态大模型

胡瀚是计算机视觉领域通用架构Swim Transformer的核心作者之一。
阅读原文