粒子滤波器技术在非线性和非高斯系统中的优越性决定了它的广泛应用。此外,粒子滤波器的多模态处理能力是其广泛使用的原因之一。在国际上,粒子滤波已经应用于各个领域。
现在通过粒子模拟解决了传统分析方法无法解决的问题。
在模型选择,动态系统的故障检测和诊断,基于粒子的假设检验,粒子多模型,粒子似然比检测和其他方法已经出现。
在参数估计方面,静态参数通常作为扩展状态向量的一部分,但由于参数是静态的,因此粒子将快速退化为样本。为避免退化,常用的方法是人为地增加静态参数的动态噪声。
核心平滑方法和Doucet等人提出的点估计方法。避免参数的直接采样,并使用粒子框架下的最大似然估计(ML)和最大期望值(EM)算法直接估计未知参数。
揭开粒子过滤的神秘面纱
粒子滤波器(PF:粒子滤波器)的思想基于蒙特卡罗方法,该方法使用粒子集来表示概率,并且可以用于任何形式的状态空间模型。
核心思想是通过从后验概率中提取随机状态粒子来表达其分布。它是一种顺序重要性采样方法(Sequential Importance Sampling)。
简单来说,粒子滤波方法是指通过找到在状态空间中传播的一组随机样本来近似概率密度函数并用样本均值替换积分运算来获得状态最小方差分布的过程。
这里的样本是指粒子,当样本数N→α时,它可以近似任何形式的概率密度分布。
虽然算法中的概率分布只是实际分布的近似值,但由于非参数特征,在解决非线性滤波问题时可以摆脱随机量必须满足高斯分布的约束,并能表达出来。比高斯模型更广泛的分布。
它还具有更强的能力来模拟可变参数的非线性特征。因此,粒子滤波可以基于观测和控制量准确地表达后验概率分布,这可以用于解决SLAM问题。
粒子滤波的发展
马尔可夫链蒙特卡罗改进策略
马尔可夫链蒙特卡罗(MCMC)方法通过构造具有良好收敛性的马尔可夫链来从目标分布产生样本。在SIS的每次迭代中,MCMC被组合以将粒子移动到不同的位置以避免退化,并且马尔可夫链可以将粒子推向更接近概率密度函数(PDF)。使样本分布更合理。
Unscented粒子滤波器(UPF)
Unscented卡尔曼滤波器(UKF)由Julier等人提出。EKF(扩展卡尔曼滤波器)使用一阶泰勒展开近似非线性项,并用高斯分布近似状态分布。UKF类似于EKF,其高斯分布近似于状态分布,但是没有线性化,仅使用少量称为Sigma点的样本。
在这些点通过非线性模型之后,所获得的均值和方差可以精确到非线性展开泰勒的二阶项,这使得非线性滤波更准确。Merwe等人提出使用UKF来生成PF的重要性分布,称为Unscented Particle Filter(UPF)。UKF生成的重要性分布大于实际状态PDF的重叠,估计精度更高。
数据科学与机器人中的粒子滤波
粒子滤波器现在广泛用于金融市场模型的估计,特别是随机波动率模型。
粒子滤波器方法是递归贝叶斯滤波器,当模型是非线性的并且当噪声不是高斯时,它提供了方便且有吸引力的方法来近似后验分布。
这些技术为许多问题提供了一般解决方案,其中线性化和高斯近似是难以处理的或者会产生太低的性能。非高斯噪声假设和对状态变量的约束的结合也可以以自然的方式执行。此外,粒子滤波器方法非常灵活,易于实现,可并行化并且适用于非常一般的设置。
使用粒子滤波器进行机器人定位
一个室内机器人在办公室内导航:
机器人在地图上的近似位置
粒子滤波器解决了应用机器人中的许多问题。假设我们可能有我们想要跟踪的移动对象。也许这些物体是战斗机和导弹,或者我们正在追踪人们在田野里打板球。这并不重要。让我们考虑一下三维机器人问题的特征:
局部姿势的初始假设是有噪声的,因为我们可以看到点遍布 格(地图)。随着机器人进一步移动,粒子会聚,这解释了粒子的会聚。
在仓库中导航的室内机器人可以使用粒子滤波器根据测距传感器(如2D激光扫描仪)的输入进行定位,或者可用于融合传感器输入并确定道路上的车道标记。无人机可以使用粒子滤波器来优化光流。
强化学习算法和粒子滤波器
在人工智能的背景下,强化学习是一种动态编程,它使用奖励和惩罚系统来学习和完善算法。
基于粒子滤波器的强化学习(RL)算法计算成本低,并且具有非常低的存储器占用空间。包括基于粒子过滤器的直接全局策略搜索的RL算法将在由所选策略参数化定义的策略空间中执行搜索。
粒子滤波器可以是RL算法的核心概念,可以通过创建粒子来指导探索和利用,每个粒子代表整个策略。由于粒子滤波器执行全局搜索的能力,所得到的RL算法应该能够在策略空间中进行直接全局搜索,这是对基于传统本地搜索的策略RL的显着改进。
这增加了价值,因为它继承了粒子滤波器的许多优点,其中包括:
粒子滤波的不利因素
虽然粒子滤波算法可以作为解决SLAM问题的有效手段,但算法中仍存在一些问题。主要问题是需要大量样本来近似接近系统的后验概率密度。机器人面临的环境越复杂,描述后验概率分布所需的样本就越多,算法就越复杂。
因此,可以有效减少样本数量的自适应采样策略是算法的重点。此外,重新采样阶段可能导致样本有效性和多样性的损失,导致样本耗尽。如何保持粒子的有效性和多样性以及克服样本的耗尽也是重新采样该算法的重点。
在强化学习中,粒子滤波器作为全局搜索方法的一员,通常需要更多的试验才能收敛,因为搜索的范围是最大可能的 – 整个政策空间。
粒子滤波器没有严格的收敛证明。理论上,我们用全球搜索方法交换了”局部收敛的证据”,这种方法没有全局收敛的证据,但至少保证不会陷入局部最优。
声明:本站部分文章内容及图片转载于互联 、内容不代表本站观点,如有内容涉及侵权,请您立即联系本站处理,非常感谢!