JSAI2023 4日目感想 : 時系列予測における人工データを用いたデータ拡張

背景

時系列データ予測において訓練データの足りなさが問題で、データを水増しするか転移学習するかしないと予測精度が上がらない。

関連研究

自動生成した人工的な時系列データ(人工データ)を用いてモデルを事前に学習しておく転移学習を行った研究がある(すげー)。しかし、タスクは時系列分類であり、予測ではない。

時系列予測手法ではNeural Laplaceが提案されている。これは元々の時系列データを関数で表現したものをラプラス変換して得られる像関数をモデル化するらしい(すげー)。

提案手法

元データに人工データを追加したものを訓練データとし、さっきのNeural Laplaceを用いて学習させる。なお、この時の目的関数を、先行研究での予測系列のみを対象とした誤差から、入力系列も含めた誤差に変更する。

結果

予備実験として、さっき再定義した目的関数でもちゃんと学習できるか確かめた。また、メインの実験として予測性能を確かめたところ、人工データ+元データによって予測性能が向上することがわかった。また、元データの数を半分に減らしても問題なかった。

感想

人工データは元データと全く関係のないデータなのに予測性能が上がるのはすごいと思った。ラプラス空間上で人工データと元データとの親和性が高かったのか、人工データによってモデルの正規化が行われたのかはわからないが、人工データの有用性が確かめられましたね、といった感じ。