ChatGPTや画像生成AIなど、生成系のAIが世界的に注目を集める様になりました。
その話題やニュースを目にしない日はない、というほどです。
しかしながら生成AIに関しては、その根本的な部分が、実はあまりよく知られていない様に思えます。
そこでこのブログでは、生成AIの基本をわかりやすく解説したいと思います。
生成AIとは何かを、サクッと学んでみましょう。
この記事では、AI技術における「モデル」とは何かを、わかりやすく解説していきます。
えっ本人じゃん!Audibleでは人気声優が原作のナレーションを担当!
生成AIと機械学習モデル
生成AIに関する話の中では「〜モデル」という言葉が決まって登場します。
これは機械学習モデルのことを指します。
これは、ディープラーニングを用いた機械学習を済ませたプログラムのことだと言えます。
データからパターンを学習し、予測や分類を行うためのアルゴリズムを実装したプログラムです。
つまり機械学習モデルとは、予測や判断による決定を自ら行えるようになったプログラムのことです。
そして生成AIの場合、画像や音声、文章などを生成するための機械学習モデルが使用されている訳です。
生成AIに用いられている代表的な機械学習モデルには、以下のようなものがあります。
- Transformer
- GAN(Generative Adversarial Network)
- VAE(Variational Autoencoder)
- 拡散モデル
生成AIなど高度な処理を行う人工知能には、決まってこうした機械学習モデルが用いられることになります。
これらのディープラーニングを応用した機械学習モデルを用いることで、生成AIの高い性能が発揮されているのです。
それぞれわかりやすく紹介したいと思います。
Transformer
自然言語処理などのタスクで非常に高い性能を発揮する、機械学習モデルの一種です。自然言語処理において革新的な手法として注目を集めました。 エンコーダとデコーダという、2つの主要な装置から構成されています。GPTなどに使用されています。
GAN
2つのニューラルネットワークを競わせることで、よりリアルな画像を生成することを目的とする機械学習モデルです。「生成器」と呼ばれるネットワークと、「識別器」と呼ばれるネットワークを競わせて、高品質な画像を生成することができます。またGANとは、「Generative Adversarial Network」の略で、日本語では「敵対的生成ネットワーク」と言います。
VAE
データの特徴を学習し、似たような画像をつくるモデルです。 まず元の画像を変換して、潜在変数というものに落とし込みます。 そして、その潜在変数から元の画像に似たような画像を生成します。 この潜在変数が、元のデータの特徴を表すような分布になっています。またVAEとは、「Variational Auto-Encoder」の略で、日本語では「変分オートエンコーダー」と言います。
拡散モデル
Diffusion Modelと呼ばれ、画像生成AIに用いられるモデルです。まず画像に対して、ランダムにノイズを徐々に当てていきます。そこから今度は逆に、過程を反転させ、ノイズを徐々に除去していきます。そして元の画像との誤差がなるべく少なくなる様にして、精度の高い画像を生成します。
以上、生成AIと機械学習モデルの解説でした。
ご覧いただきありがとうございました。