本文转自公众号 泡泡机器人SLAM
今天介绍的文章是——基于格拉斯曼流形的可扩展非刚体稠密SFM。
本文完成对多种图像的稠密非刚性运动结构(NRSfM)的建模任务。现有技术常常受到扩展性,昂贵的计算和噪声测量的困扰。此外,最近的NRSfM方法通常要么采用少量的稀疏特征点,要么忽略形状变形的局部非线性,因此不能可靠地模拟复杂的非刚性变形。为了解决这些问题,在本文中,我们通过对Grassmann流形上的问题建模,提出了一种新的稠密NRSfM方法。具体而言,我们假设复杂的非刚性变形是局部线性子空间的空间和时间的集合。这种稠密表示对于非刚体变形在架构上是允许的。我们在几个合成和真实基准数据集上提供实时结果。结果表明,我们的方法除了具有可扩展性和比现有技术方法更精确之外,对噪声更具鲁棒性,并可推广到其它非线性变形。
介绍
为了处理稠密的NRSFM问题,本文提出了一种新的的NRSfM算法,对着这个算法,作者坚持这样的假设:由变换形状而来的低维线性子集是局部有效的。Grassmann流形是拓扑丰富的非线性流形,其中的每个点表示欧几里得空间的所有右不变子空间的集合。它有一个非常有用的特性,它的点可以嵌入对称矩阵的空间,因此,在本文提出的问题中,为了模拟非线性形状,使用Grassmannian将形状表示为嵌入到更高维欧几里得空间中的一组“平滑”低维表面。
算法流程
本文提供的算法流程伪代码如下:
主要结果
作者用之前的算法与本文算法进行测试比较,使用的是稠密NRSFM数据集。
首先在面部序列数据集。该数据集由4个不同的脸部序列组成,其中28,880个特征点在多个帧上进行跟踪。 脸部序列1,2是10帧长的视频,而脸部序列3,4是99帧长的视频。 这是一个具有挑战性的数据集,主要是由于每个序列中不同的旋转频率和变形。 图一显示了使用本文方法获得的定性重建结果与面序列4的基础真值相比较。表一列出了我们的方法与其他竞争方法的性能比较。
图一 重建结果
表一 重建误差比较
通过对单目相机拍摄的人脸部表情,扭动的背部以及跳动的心脏建模测试性能,结果如下:
图二 a为面部序列 b为背部序列 c为跳动的心脏
表二 3D重构误差分析
最后,为了评估在真实变形方面的表现,我们使用kinect纸和kinect tshirt数据集。这个数据集提供了稀疏的SIFT特征轨迹每个场景都有密集的3D点云帧。结果如下:
图三 kinect tshirt (74,000点, 313 帧) and kinect paper(58,000点, 193帧)重构结果
原文论文下载:
Scalable Dense Non-rigid Structure-from-Motion A Grassmannian Perspective.pdf