本研究の目的は、多次元(多要素)の時系列推移するデータの解析と予測です。具体的には、東証プライムに上場している全企業の株価の終値をある程度長期的に収集し、これを学習データとして着目した企業の株価を予測することです。この目的を達成するには、ディープラーニングにおいて単純なニューラルネットワークに基づいたモデルではなく、時系列データから予測値を導出することに適したモデルを使用する必要があります。
以下に時系列データから予測値を出力するモデルの例を示します。
①カレントニューラルネットワーク (RNN)
・Vanilla RNN
・Long Short-Term Memory (LSTM)
・Gated Recurrent Unit (GRU)
②時系列データ向けの応用モデル:
・Time Delay Neural Network (TDNN)
・Echo State Network (ESN)
・Clockwork RNN
・Neural Turing Machine (NTM)
③畳み込みニューラルネットワーク (CNN)
・1D CNN
・Temporal Convolutional Network (TCN)
④Transformerベースのモデル
・Transformer
・BERT (Bidirectional Encoder Representations from Transformers)
⑤深層学習と強化学習の組み合わせ
・Deep Q-Network (DQN):強化学習の手法を時系列データに適用
・REINFORCE:ポリシー勾配法を用いた強化学習
⑥アンサンブルモデル
・複数の異なるモデルを組み合わせたアンサンブル学習
⑦変分オートエンコーダ (VAE) および敵対的生成ネットワーク (GAN)
上記のニューラルネットワークモデルは精度の違いこそあれど、基本的には1つの要素(1次元)のみに着目しており、多次元の時系列データを扱う場合には上記のモデルをそのまま適用することはできません。
以上を踏まえて、歴史と実績のあるモデルのカレントニューラルネットワーク (RNN)のLong Short-Term Memory (LSTM)をベースに多次元(多要素)の時系列推移するデータの解析と予測を行っていきます。