前微软亚研院视觉专家胡瀚加入腾讯,负责混元多模态大模型

胡瀚是计算机视觉领域通用架构Swim Transformer的核心作者之一。

前微软亚研院视觉专家胡瀚加入腾讯,负责混元多模态大模型

原标题:前微软亚研院视觉专家胡瀚加入腾讯,负责混元多模态大模型
文章来源:大数据文摘
内容字数:2974字

腾讯混元大模型迎来新负责人:前微软亚洲研究院首席研究员胡瀚

本文总结了AI科技评论独家报道:前微软亚洲研究院视觉计算组首席研究员胡瀚加入腾讯,接替离职的刘威,负责多模态大模型研发工作。

  1. 胡瀚的学术背景和职业经历

    胡瀚拥有清华大学本科和博士学位,师从周杰教授,博士论文获2016年中国人工智能学会优秀博士论文奖。他曾在宾夕法尼亚大学GRASP实验室进行访问研究,后加入百度深度学习研究所(IDL),担任Tech Leader。2016年加入微软亚洲研究院视觉计算组,担任首席研究员。

  2. Swin Transformer及其影响

    胡瀚作为核心作者参与了具有里程碑意义的论文《Swin Transformer: Hierarchical Vision Transformer using Shifted Windows》的创作。该论文解决了当时业界关于Transformer和卷积神经网络的争论,Swin Transformer的性能优于当时的许多主流网络,成为计算机视觉领域通用的backbone,并获得了ICCV最佳论文奖(马尔奖)。

  3. 胡瀚加入腾讯的意义

    胡瀚加入腾讯,接替了离职的刘威,负责混元大模型的多模态研发工作。这表明腾讯在多模态大模型领域持续投入,并希望借助胡瀚在计算机视觉领域的深厚积累,进一步提升混元大模型的能力。

  4. 刘威的贡献和离职

    刘威曾是腾讯AI Lab的负责人之一,在计算机视觉和多模态领域取得了显著成就,参与了腾讯混元大模型的早期研发工作,包括CV基础大模型、多模态理解大模型、文生图、文生视频大模型等。其离职消息在十一月下旬被媒体报道。

  5. 腾讯混元大模型的最新进展

    腾讯混元大模型已陆续推出文生文、文生图、3D生成等能力,并在12月3日开源了130亿参数量的文生视频能力,被认为是混元系列大模型当前的最后一块重要拼图,标志着腾讯在多模态大模型领域取得了新的进展。

总而言之,胡瀚的加入为腾讯混元大模型注入了新的活力,预示着腾讯在AI领域,特别是多模态大模型领域的持续发力。 胡瀚在Swin Transformer上的突出贡献以及他在计算机视觉领域的深厚积累,将助力腾讯混元大模型在未来取得更大的突破。


联系作者

文章来源:大数据文摘
作者微信:
作者简介:普及数据思维,传播数据文化

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...
第五届
全国人工智能大赛

总奖金超 233 万!

报名即将截止