GANについて
学習データを基にAIが画像を生成する技術の原理について触れます。
論文は こちら です
DCGANについて
GANをより高度化し、入力画像の特徴をCNN(畳み込みニューラルネットワーク)で学習し、
AI画画像を生成する技術の原理について触れます。
論文は こちら です
PGGANについて
DCGANでの出力画像の限界は64✕64ピクセルですが、このPGGANを用いることにより、
最大1024✕1024ピクセルの画像を出力することが出来ます。
この出力画像の高解像度に関する技術について触れます。
論文は こちら です
CLIPについて
CLIPは、Contrastive Language-Image Pre-Trainingと呼ばれる、OpenAIが開発した画像分類モデルです。
この技術について本記事で触れます。
論文は こちら です
Diffusion Modelについて
近年、自然言語処理と同様か、それ以上に発展が著しいDiffusion Modelについてここで触れます。
論文は こちら です