- カルマンフィルタとは、誤差を持つ観測値から、観測できない真値を推定する方法
- 位置の推定、物体の追跡、異常検知などに用いられる
- 例:ロボットの距離センサと車輪の回転数(どちらも誤差を持つ)から実際の位置を推定
- 状態空間モデルとは、複数の状態とそれを駆動する入力があり、状態の動的な変化を表すのに適したモデル
- 状態空間モデルは、時間が離散か連続か、線形か非線形か、確率変数がモデルの中に1つでもあるか、係数が時不変(定数)か時変か、によって理論体系が異なる
- ここではもっとも単純な離散時間線形確率(かつ定数係数)のモデルを考える
$\boldsymbol{x}(k) \in \boldsymbol{R}^n$ : 状態変数 / state variables -
$y(k)$ : 観測量 / observation variable -
$v(k) \sim N(0,\sigma^2_v)$ : システム雑音 / system noise -
$w(k) \sim N(0,\sigma^2_w)$ : 観測雑音 / observation noise -
$\boldsymbol{b} \in \boldsymbol{R}^n$ : 駆動ベクトル / driving vector -
$\boldsymbol{c} \in \boldsymbol{R}^n$ : 観測ベクトル / observation vector -
$\boldsymbol{A} \in \boldsymbol{R}^{n \times n}$ : システム行列 / system matrix
- カルマンフィルタは観測できる$y(k)$から直接観測できない$\boldsymbol{x}(k)$を推定する
- このため、カルマンフィルタを以下の問題に置き換え、これを解いてみる
最小平均二乗誤差推定値(Minimum Mean Square Error, MMSE)を求める
Kalman Filtering Problem
Using the time series of observed data
- ARMAモデルとSARIMAXモデルを取り上げる
- 前提:対象システムの構造は未知でシステムを駆動する入力は観測できず、システムの出力である時系列データのみを観測できる
- ARMA = Auto Regressive Moving Average (自己回帰移動平均)
- 離散時間線形の確率系を表す
$u(k)$ : input,$y(k)$ : output
$z^{-1}$ : 遅延演算子($z^{-1}y(k)=y(k-1)$) - パラメータ$a_i,b_j$: 実数
- 次数$(p,q)$: 因果性より$p \geq q$ (proper)
- トレンドとは、時系列データの重要な周波数成分に、その期間より長いスパンでなだらかに変化するもの
- 一定値(バイアス)
- 一次式型(右肩上がり下がり)
- 周期型(サイン波で表現可能、季節性とも)
- このうち、一次式型のトレンドを除外するモデル:ARIMA
$d=1$ のときにおいて、$y'(k) = y(k)-y(k-1) = (1-z^{-1})^dy(k)$ - つまり、ARIMAモデルは$y'(k)$に対するARMAモデルと同じだといえる
- 季節性変動のあるデータを扱う
- 週次、月次、四半期次、年次、……
- 季節性変動を除去してシステム同定を行うモデル:
SARIMAX (Seasonnal ARIMA with eXogenous model) - 式は複雑なので割愛
- 未来の東京の気温を予測してみよう
