微软Florence-2官宣开源，一统视觉基础模型！华人团队联手打造

AIGC动态2年前 (2024)发布新智元

AIGC动态欢迎阅读

原标题：微软Florence-2官宣开源，一统视觉基础模型！华人团队联手打造
关键字：模型,任务,数据,图像,视觉
文章来源：新智元
内容字数：0字

内容摘要：

新智元报道编辑：桃子
【新智元导读】等了半年，微软视觉基础模型Florence-2终于开源了。它能够根据提示，完成字幕、对象检测、分割等各种计算机视觉和语言的任务。网友们实测后，堪称「游戏规则改变者」。一统视觉界的基础模型终于开源了！
最近，微软团队悄悄放出了Florence-2权重和代码，而且任何人皆可试玩。
去年11月，Florence-2首次发布之初，凭借惊艳的能力在全网掀起轩然。
只需要一个提示，就可以指示模型完成诸如字幕、对象检测、分割等各种各样的CV和CV语言任务。
Figure的首席执行官将其称之为，「计算机视觉领域的重大突破」。在大多数基准中，Florence-2甚至打败了多数数十亿美元的模型，就像Phi-3一样，表明了数据质量非常重要。
现在，模型的所有权重代码，已经放在开源平台Hugging Face上了，还有MIT许可证，随取随用。
体验后的网友称，它就是许多视觉任务的游戏规则改变者，不仅有极高精度，还有炸裂的速度。就看这铺屏的标注能力，简直强大到令人发指！
它竟然还可以识别出镜子。更多精彩演示Florence-2更多案例如下，高密度的区域标注，能够将复杂区

原文链接：微软Florence-2官宣开源，一统视觉基础模型！华人团队联手打造