前微软亚研院视觉专家胡瀚加入腾讯，负责混元多模态大模型

AIGC动态2年前 (2025)发布大数据文摘

450 0 0

胡瀚是计算机视觉领域通用架构Swim Transformer的核心作者之一。

原标题：前微软亚研院视觉专家胡瀚加入腾讯，负责混元多模态大模型
文章来源：大数据文摘
内容字数：2974字

腾讯混元大模型迎来新负责人：前微软亚洲研究院首席研究员胡瀚

本文总结了AI科技评论独家报道：前微软亚洲研究院视觉计算组首席研究员胡瀚加入腾讯，接替离职的刘威，负责多模态大模型研发工作。

胡瀚的学术背景和职业经历
胡瀚拥有清华大学本科和博士学位，师从周杰教授，博士论文获2016年中国人工智能学会优秀博士论文奖。他曾在宾夕法尼亚大学GRASP实验室进行访问研究，后加入百度深度学习研究所(IDL)，担任Tech Leader。2016年加入微软亚洲研究院视觉计算组，担任首席研究员。
Swin Transformer及其影响
胡瀚作为核心作者参与了具有里程碑意义的论文《Swin Transformer: Hierarchical Vision Transformer using Shifted Windows》的创作。该论文解决了当时业界关于Transformer和卷积神经网络的争论，Swin Transformer的性能优于当时的许多主流网络，成为计算机视觉领域通用的backbone，并获得了ICCV最佳论文奖（马尔奖）。
胡瀚加入腾讯的意义
胡瀚加入腾讯，接替了离职的刘威，负责混元大模型的多模态研发工作。这表明腾讯在多模态大模型领域持续投入，并希望借助胡瀚在计算机视觉领域的深厚积累，进一步提升混元大模型的能力。
刘威的贡献和离职
刘威曾是腾讯AI Lab的负责人之一，在计算机视觉和多模态领域取得了显著成就，参与了腾讯混元大模型的早期研发工作，包括CV基础大模型、多模态理解大模型、文生图、文生视频大模型等。其离职消息在十一月下旬被媒体报道。
腾讯混元大模型的最新进展
腾讯混元大模型已陆续推出文生文、文生图、3D生成等能力，并在12月3日开源了130亿参数量的文生视频能力，被认为是混元系列大模型当前的最后一块重要拼图，标志着腾讯在多模态大模型领域取得了新的进展。

总而言之，胡瀚的加入为腾讯混元大模型注入了新的活力，预示着腾讯在AI领域，特别是多模态大模型领域的持续发力。胡瀚在Swin Transformer上的突出贡献以及他在计算机视觉领域的深厚积累，将助力腾讯混元大模型在未来取得更大的突破。