胡瀚是计算机视觉领域通用架构Swim Transformer的核心作者之一。
腾讯混元大模型迎来新负责人:前微软亚洲研究院首席研究员胡瀚
本文总结了AI科技评论独家报道:前微软亚洲研究院视觉计算组首席研究员胡瀚加入腾讯,接替离职的刘威,负责多模态大模型研发工作。
胡瀚的学术背景和职业经历
胡瀚拥有清华大学本科和博士学位,师从周杰教授,博士论文获2016年中国人工智能学会优秀博士论文奖。他曾在宾夕法尼亚大学GRASP实验室进行访问研究,后加入百度深度学习研究所(IDL),担任Tech Leader。2016年加入微软亚洲研究院视觉计算组,担任首席研究员。
Swin Transformer及其影响
胡瀚作为核心作者参与了具有里程碑意义的论文《Swin Transformer: Hierarchical Vision Transformer using Shifted Windows》的创作。该论文解决了当时业界关于Transformer和卷积神经网络的争论,Swin Transformer的性能优于当时的许多主流网络,成为计算机视觉领域通用的backbone,并获得了ICCV最佳论文奖(马尔奖)。
胡瀚加入腾讯的意义
胡瀚加入腾讯,接替了离职的刘威,负责混元大模型的多模态研发工作。这表明腾讯在多模态大模型领域持续投入,并希望借助胡瀚在计算机视觉领域的深厚积累,进一步提升混元大模型的能力。
刘威的贡献和离职
刘威曾是腾讯AI Lab的负责人之一,在计算机视觉和多模态领域取得了显著成就,参与了腾讯混元大模型的早期研发工作,包括CV基础大模型、多模态理解大模型、文生图、文生视频大模型等。其离职消息在十一月下旬被媒体报道。
腾讯混元大模型的最新进展
腾讯混元大模型已陆续推出文生文、文生图、3D生成等能力,并在12月3日开源了130亿参数量的文生视频能力,被认为是混元系列大模型当前的最后一块重要拼图,标志着腾讯在多模态大模型领域取得了新的进展。
总而言之,胡瀚的加入为腾讯混元大模型注入了新的活力,预示着腾讯在AI领域,特别是多模态大模型领域的持续发力。 胡瀚在Swin Transformer上的突出贡献以及他在计算机视觉领域的深厚积累,将助力腾讯混元大模型在未来取得更大的突破。
联系作者
文章来源:大数据文摘
作者微信:
作者简介:普及数据思维,传播数据文化