AI发展方向——从pipeline到end2end

AIGC动态1年前 (2024)发布 JioNLP

AIGC动态欢迎阅读

原标题：AI发展方向——从pipeline到end2end
关键字：模型,目标,滤波器,数据,图像
文章来源：JioNLP
内容字数：0字

内容摘要：

荷楼~~，大家好，我是 JioNLP。
这些天我在做图像目标检测与跟踪。
我越做越感觉，这块 AI 任务的建模方式和处理方式存在很多的问题。
我先分开说说目标检测和目标跟踪两块技术发展情况。
目标检测——yolo目前流行的目标检测还是YOLO，这个模型已经迭代到了 YOLOv8，修修补补，更新迭代了这么多版本，我认为不是一件好事，这说明目标检测领域存在瓶颈和局限性，已经很长时间没有人能做出突破了。
YOLO 系列模型最早是把 R-CNN 那套东西按在地上锤的，这其中蕴含了 AI 发展的非常典型的思路。
R-CNN 为代表的这类模型，有很强的人类对目标检测任务的假设，那就是，先标定不同大小的框，然后再对框住的图像做图像分类。
它把目标检测任务完全分割成了两个阶段，先选定框，然后再去做分类标定类别。这是一种典型的 pipeline 式的处理方式。
而 YOLO 模型一举采用 end2end 端到端的方式掀了 R-CNN 模型的桌子。
目标检测不就是想要框的坐标、类别吗？那神经网络直接预测并输出坐标、类别就好啦！别管坐标这种概念对于图像来说有多抽象。只要还归香农信息论管辖，那就交给神经网络去

原文链接：AI发展方向——从pipeline到end2end