AI发展方向——从pipeline到end2end

AIGC动态4个月前发布 JioNLP
6 0 0

AI发展方向——从pipeline到end2end

AIGC动态欢迎阅读

原标题:AI发展方向——从pipeline到end2end
关键字:模型,目标,滤波器,数据,图像
文章来源:JioNLP
内容字数:0字

内容摘要:


荷楼~~,大家好,我是 JioNLP。
这些天我在做图像目标检测与跟踪。
我越做越感觉,这块 AI 任务的建模方式和处理方式存在很多的问题。
我先分开说说目标检测和目标跟踪两块技术发展情况。
目标检测——yolo目前流行的目标检测还是YOLO,这个模型已经迭代到了 YOLOv8,修修补补,更新迭代了这么多版本,我认为不是一件好事,这说明目标检测领域存在瓶颈和局限性,已经很长时间没有人能做出突破了。
YOLO 系列模型最早是把 R-CNN 那套东西按在地上锤的,这其中蕴含了 AI 发展的非常典型的思路。
R-CNN 为代表的这类模型,有很强的人类对目标检测任务的假设,那就是,先标定不同大小的框,然后再对框住的图像做图像分类。
它把目标检测任务完全分割成了两个阶段,先选定框,然后再去做分类标定类别。这是一种典型的 pipeline 式的处理方式。
而 YOLO 模型一举采用 end2end 端到端的方式掀了 R-CNN 模型的桌子。
目标检测不就是想要框的坐标、类别吗?那神经网络直接预测并输出坐标、类别就好啦!别管坐标这种概念对于图像来说有多抽象。只要还归香农信息论管辖,那就交给神经网络去


原文链接:AI发展方向——从pipeline到end2end

联系作者

文章来源:JioNLP
作者微信:jionlp
作者简介:我是一只程序员,关注 AI、数据挖掘、数据分析、C、C++、音视频、机器人。 同时还喜欢聊各种小说、故事。

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...