视觉如何模型统一?牛津大学Shuyang Sun博士论文《迈向统一视觉感知》全面阐述

视觉如何模型统一?牛津大学Shuyang Sun博士论文《迈向统一视觉感知》全面阐述

AIGC动态欢迎阅读

原标题:视觉如何模型统一?牛津大学Shuyang Sun博士论文《迈向统一视觉感知》全面阐述
关键字:视觉,粒度,报告,任务,模型
文章来源:人工智能学家
内容字数:0字

内容摘要:


来源:专知
来自牛津大学Shuyang (Kevin) Sun博士论文《Towards Unified Visual Perception 》值得关注!探讨统一视觉感知系统的构建。
Shuyang (Kevin) Sun
牛津大学Torr视觉组的DPhil(博士)学生,导师为Philip Torr教授和Victor Prisacariu教授。曾在悉尼大学SIGMA实验室攻读硕士学位,师从Ouyang Wanli教授。有幸与谷歌研究院的Weijun Wang和Liang-Chieh Chen,Intel ISL的Vladlen Koltun、Philipp Krähenbühl和René Ranftl紧密合作。于2016年在中国大学获得软件工程学士学位。目前,他的研究重点是构建具有统一感知的综合视觉系统。
https://kevin-ssy.github.io/
本论文通过利用视觉Transformer(Vision Transformers, ViTs)的能力,探索计算机视觉中视觉感知的前沿领域,旨在创建一个统一的框架来应对跨任务和跨粒度的挑战。我们从人类视觉系统在不同细节层次处理


原文链接:视觉如何模型统一?牛津大学Shuyang Sun博士论文《迈向统一视觉感知》全面阐述

联系作者

文章来源:人工智能学家
作者微信:
作者简介:

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...