ChatGPTをはじめ、生成系のAIが世界的に注目を集める様になりました。
その話題やニュースを目にしない日はない、というほどです。
そしてChatGPTに次いで話題を呼んでいるのが、画像生成AIです。
クオリティの高い画像を、誰でも簡単に生成することができます。
これまで画像生成などクリエイティブな作業は、AIの苦手分野だとされてきました。
ところが2022年に、高品質な画像を生成できるAIサービスが、立て続けにリリースされました。
そしてChatGPTの登場も重なり、生成AIに対して大きく注目が集まったのでした。
ここでは、そんな画像生成AIサービスを代表するものを、一覧でまとめました。
えっ本人じゃん!Audibleでは人気声優が原作のナレーションを担当!
それでは、代表的な画像生成AIサービスを紹介したいと思います。
生成AIの多くが、誰でも簡単に利用することができます。
そして、様々な生成AIサービスが続々と生み出されています。
生成AIは、大量のデータを学習しているため、人間が作成したような高品質なコンテンツを生成することができます。
コンテンツの作成を自動化できるため、時間とコストを大幅に節約することができますよ。
そして、新しいアイデアや創造的なコンテンツを生成することができます。
また画像生成AIサービスの多くが、日本語には非対応です。そのため、プロンプトは基本的に英語で入力します。
DALL-Eとは、OpenAIが開発した画像生成AIであり、そのシリーズです。2022年にリリースされました。
DALL-Eは、人物、動物、物体、風景など、様々な物体やシーンの画像を生成することができます。
また、写真の様に写実的なスタイルや、漫画のようなスタイル、抽象的なスタイルなど、様々な画像を生成することができます。
さらにDALL-Eは、Microsoftの検索エンジンBingとも連携しています。BingのImage Creatorという機能から、画像生成を行うことができます。
またDALL-Eという名称は、PIXARスタジオの映画作品のキャラクターであるウォーリーと、スペインの芸術家サルバドール・ダリを、混ぜ合わせてつくったものだそうです。
Midjourney は、先進的なAI技術を利用した画像生成サービスです。2022年にリリースされました。
プロンプトを入力するだけで、非常にクオリティの高い画像を生成することができます。
Midjourneyは、アート、デザイン、ゲームなど、さまざまな分野で使用されています。また、教育や研究にも活用されています。
Midjourneyは、アート作品の制作や商品デザインなど、さまざまな目的に使用できます。
人間の創造性とAIの能力を融合させることで、新しい表現を生み出していくことができる強力なツールです。
またMidjourneyは基本的に、「Discord」というチャットサービスを通して利用します。
Stable Diffusionは、AI技術を利用した画像生成サービスです。2022年にリリースされました。
プロンプトの入力だけで、誰でも簡単に様々な画像を生み出すことができます。
Stable Diffusionは、ミュンヘン大学の研究チームCompVis LMU、Stability AI、Runwayの三者が共同で開発しました。
「潜在拡散モデル」というアルゴリズムによって、生成されるのが特徴です。
DALL-EやMidjourneyと並び、画像生成を代表するサービスとなっています。
NovelAIは、テキスト生成と画像生成を行える生成AIサービスです。
画像生成の機能においては、日本の漫画やアニメ風の画像を生成することに特化しています。
テキスト生成においてはGPTが用いられ、画像生成においてはStable Diffusionが用いられています。
また日本のネットスラングにおいては、画像生成におけるプロンプトのことを「呪文」と呼びます。
さらにAIでの画像生成を専門的に行う人のことを「術師」と呼びます。
Fireflyは、Adobeが開発した画像生成AIサービスです。
入力されたプロンプトを元に、画像やグラフィックス、テキスト効果の生成を実現します。
同社のストックフォトサービス「Adobe Stock」を活用することで、クオリティの高い画像を大量に学習させています。
そしてFireflyの長所は、著作権侵害の恐れがないコンテンツを生成できることです。
これはAdobe Stockの画像や、著作権が失効しているパブリックドメインを対象にAIに学習させているためです。
これにより、権利者や知的財産を侵害しない、安全性に考慮したコンテンツが生成できる訳です。
商用目的で画像生成を行いたい場合にも、安心して利用できるサービスだと言えます。またアーティストたちにとっても、有り難いサービス形態です。
さらにFireflyは、Googleのテキスト生成AIであるBardと連携していく予定です。Bardからテキスト入力するだけで、Fireflyによる画像生成ができます。
またFireflyは、Adobeの画像編集ソフト「Photoshop」にも組み込まれました。
生成AIは、非常に便利で画期的なテクノロジーです。
しかしながら生成AIの利用に関しては、著作権の問題など、まだ法整備などのルールづくりが定まっていません。
AIの成長のスピードが急過ぎるため、人間社会が追いつけていないのです。
そのため生成AIの利用に関しては、現状グレーゾーンが多く、各自の判断という形になっています。
各サービスのポリシーや、生成AI利用のガイドラインや注意事項をよく確認しておくことが重要です。
代表的な画像生成AIサービスを紹介しました。
これらの生成系AIは、まさにパラダイムシフトをもたらす技術だと言えます。
クオリティの高い画像を、誰でも簡単に生み出せる様になりました。
様々なクリエイティブな活動が可能になった一方で、著作権の問題など様々な課題も生んでいます。
どういった形が望ましいのか、社会全体でよく考えていくことが必要でしょう。