AIGC动态欢迎阅读
原标题:微软Florence-2官宣开源,一统视觉基础模型!华人团队联手打造
关键字:模型,任务,数据,图像,视觉
文章来源:新智元
内容字数:0字
内容摘要:
新智元报道编辑:桃子
【新智元导读】等了半年,微软视觉基础模型Florence-2终于开源了。它能够根据提示,完成字幕、对象检测、分割等各种计算机视觉和语言的任务。网友们实测后,堪称「游戏规则改变者」。一统视觉界的基础模型终于开源了!
最近,微软团队悄悄放出了Florence-2权重和代码,而且任何人皆可试玩。
去年11月,Florence-2首次发布之初,凭借惊艳的能力在全网掀起轩然。
只需要一个提示,就可以指示模型完成诸如字幕、对象检测、分割等各种各样的CV和CV语言任务。
Figure的首席执行官将其称之为,「计算机视觉领域的重大突破」。在大多数基准中,Florence-2甚至打败了多数数十亿美元的模型,就像Phi-3一样,表明了数据质量非常重要。
现在,模型的所有权重代码,已经放在开源平台Hugging Face上了,还有MIT许可证,随取随用。
体验后的网友称,它就是许多视觉任务的游戏规则改变者,不仅有极高精度,还有炸裂的速度。就看这铺屏的标注能力,简直强大到令人发指!
它竟然还可以识别出镜子。更多精彩演示Florence-2更多案例如下,高密度的区域标注,能够将复杂区
原文链接:微软Florence-2官宣开源,一统视觉基础模型!华人团队联手打造
联系作者
文章来源:新智元
作者微信:AI_era
作者简介:智能+中国主平台,致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展,关注人机融合、人工智能和机器人对人类社会与文明进化的影响,领航中国新智能时代。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...