鲁棒模型拟合:解决什么问题?

简述鲁棒模型拟合(Robust Model Fitting),对于基本问题的各种概念进行解释与举例。

我参考了相关的研究论文与维基百科,就不一一列举了。

这里先介绍一下什么是模型拟合。

模型拟合

模型拟合(Model Fitting)指从一组观测数据中,给定合适的模型的情况下,利用数据来估计模型的参数。

拟合不是某一种特定的方法,而是指的是能够将一组数据,按照给定模型的规律方程化的方法全体。所求取的参数是在模型的参数空间内能够”最好“的解释数据的参数

其中回归分析 是模型拟合的一种方法。分为 线性回归 和 非线性回归。

拟合还有其他的方法,例如:指数平滑,ARIMA,VAR 等。

实例

在实际应用中,我们可以运用线性最小二乘拟合一组数据点。例如:

给定一组 $m$ 个二维数据点

并给出模型函数 $f$ 与参数 $\beta$

目的寻找参数 $\beta$ 使得模型函数最“拟合”数据。理想情况下,模型与数据完全没有偏差。通常这是不可能的,一般是一个超定问题,数据点数大于参数个数 $m>n$ 。此时,最小二乘是找到残差(residual)平方和的最小可能值:

从而求解最佳参数 $\beta$

image-20190307093617538image-20190307093629970

最小二乘法的缺陷

最小二乘法对于数据的噪声点是非常敏感的,当数据存在outliers,最小二乘法会出现很大的偏差。

image-20190307101523552

鲁棒模型拟合

所谓鲁棒性(Robustness),又可称做顽健性耐操性。在计算机科学领域,就是指在一个计算机系统在运行期间对抗错误与处理错误地能力。在模型拟合中,可以狭义的理解为对抗噪声的能力。

在真实环境下,数据不可避的存在噪声点。

鲁棒模型拟合,指在存在噪声的情况下,估计给定模型的参数。换句话说,就是使得模型拟合对于噪声不敏感。

一个合格的鲁棒模型拟合算法,能够不受大量离群点影响(鲁棒性),准确的估计出数据中的模型个数与各个模型的参数(有效性)。

我们将属于一个模型实例的点称为该模型的内点(Inliers),不属于任何模型实例的点,称为离群点(Outliers)。一般的界定方法是,对于一个模型假设,点与模型的残差 $\delta$ 大于某个阈值为outlier,而小于该阈值的视为inlier。如下图,模型假设是绿点连接成的直线,红色点为该模型的outliers。蓝色点则是“支持”该模型的inliers。这也是判断模型假设好坏与否的标准。

image-20190307104017416

最经典的算法是RANSAC,出自:Fischler, M. A., & Bolles, R. C. (1981). Random sample consensus: a paradigm for model fitting with applications to image analysis and automated cartography. Communications of the ACM (Vol. 24). Morgan Kaufmann Publishers, Inc. https://doi.org/10.1145/358669.358692

难点

目前,鲁棒模型拟合存在的难点在于

  1. 大量的离群点(outliers>90%)
  2. 数据集中存在多个模型。
    • 模型的数量未知
    • 各自内点的个数不平衡
    • 模型实例之间会互相干扰:对于一个模型而言,其余模型的内点也被视为outliers,被称作pseudo-outliers

例如:

二维平面点集上的圆形拟合,图中存在大量非真实模型离群点的干扰与4个相交的真实圆形构成的点集。

image-20190307095839142

三维直线的拟合

image-20190307101027419

实际应用

模型拟合不仅可以运用与点集的形状模型估计,还用于计算机视觉中真实场景中的参数模型的估计。例如三维重构,图片全景拼接,运动分割,平面估计。

本质上是对于单应性矩阵基础矩阵的估计。(Homography/Fundamental Matrix Estimation)

如下图,对于一个真实物体,进行两个不同角度的拍摄(角度不能过大),特征提取匹配后,会存在错误的无效噪声点的匹配,这时候可以根据 相机拍摄的对极几何 特性,利用拟合方法,各个真实平面从视角A到视角B的变换所对应的单应性/基础矩阵。 从而找到真实平面。

🛰️在之后的文章会详细的介绍 对极几何。

image-20190307105307803