研究2:PGGANを用いたAIによる画像生成の体験
(DCGANの限界サイズ(64✕64ピクセル)を超えた風景画の学習結果を出力)
・背景と目的
・アプローチ手法
・原理
・可視化方法
・可視化結果
・考察
【考察】
目的として設定していた、既存技術による出力画像結果の「風景画らしさ」を体験する、という点については、DCGANよりも今回用いたPGGANのほうがより強く風景画の特徴を捉えており、この点については既存技術に実際に触れてみることで視覚的に理解することができました。
しかし、研究2の裏の目的の、【「人間にしか出来ないことってなんだろう?」と考えることが多くなり、多くの時間を割いて導き出した結論は、【『創造性』こそが人類のアイデンティティである】ということ】の実証、具体的には、学習を踏まえて出力された風景画には『創造性』はなく、【あくまで風景画の特徴を捉えた模造品】であることの実証までは、可視化結果からは判断できるほどの精度を持っていないことから実証には至らなかった。
ここで、改めて64×64ピクセルの画像、128×128ピクセルの画像、256×256ピクセルの画像を並べて比較します。
左から順に、64×64ピクセルの画像、128×128ピクセルの画像、256×256ピクセルの画像
並べてみると顕著だが、当然のことながら256×256ピクセルの画像が最も解像度が高い。しかし、風景画の特徴を捉えているか、という点では十分でない、と言える。
その理由の1つとして、256×256ピクセルの画像出力に必要なトレーニング回数が不足していたためだと考えられる。
(128×128:150000回のトレーニング 256×256:20000回のトレーニング)
なぜトレーニング回数を減らしたのか、という点について述べると、256×256ピクセルの画像を出力させるための計算量(処理能力)は膨大で、1枚の画像出力に1分程度の時間を要します。これまでに示した結果を得るために数カ月間処理を実行させ続けていたため、既存技術に触れるという個人での利用用途を考えるとこれ以上の学習時間は取れない、と判断したために不十分なトレーニング回数となっております。
なお、計算はCPUで行ったが、GPUでの処理についてもトライしております。結論から言えば、VRAM容量が12GBのRTX3060でもメモリ容量不足となってしまいエラーになります。よって、低速だが確実なCPUでの処理以外の選択肢はありませんでした。