AIGC动态欢迎阅读
内容摘要:
大数据文摘受权转载自数据派THU
作者:贾恩东编辑:黄继彦本文将介绍在异常检测领域中的一种具有线性时间复杂度和较高精准度且在学术界和工业界都有着不错反响的算法:孤立森林。异常检测是机器学习研究领域中和现实应用联系紧密,有广泛的直接需求的一大类问题。这一类问题的解决方案往往可以直接应用于网络安全中的攻击检测,金融交易欺诈检测,敌方活动的军事异常监测,罕见疾病侦测,和噪声数据
过滤等实际业务,具有较为明显的商业价值。
背景介绍
我们先来简单了解一下孤立森林算法所属的机器学习分类领域,即异常检测。异常检测 (anomaly detection),或者又被称为“离群点检测” (outlier detection),指的是在数据中发现不符合预期行为模式的特别数据的问题。在不同的应用领域中,这些不一致模式的特别数据通常被称为异常、异常值、不一致观察、离群值、异常、畸变、意外、特殊性或污染物。但对于“异常”的具体定义,在不同的问题上往往其实并没有标准答案,甚至在同一个问题上,在不同的角度下,所谓何为“异常”的答案可能也不尽然相同。事实上,正常和异常之间的界限往往是不清晰的。在靠近边界处,正常观测常被
原文链接:一文读懂孤立森林
联系作者
文章来源:大数据文摘
作者微信:
作者简介:
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...