【One Tech #05】画像生成AI元年である2022年を振り返ってみよう!
ー「画像生成AI」流行のきっかけから「AI絵師」が誕生するまでー

2022年12月5日掲載

キービジュアル

皆さまこんにちは!AI戦略室の内海です。

この記事は、ソフトバンク Advent Calendar 2022 の 5日目の記事になります

One Tech】とは、様々な部署・職種のエンジニアが世の中にある様々なIT関連のキーワードや流行の1つに着目し、独自あるいはその職種ならではの視点からIT関連の技術用語やトレンドについて執筆していく連載企画です。

気がつけば2022年も残り1ヶ月を切りましたね。流行語大賞のノミネート語も既に発表されており、それを見ながらこの1年を振り返るのがこの時期の楽しみとなっています。

その中で今年特に目を引いたのは「AI絵師」という造語です。SNS流行語大賞2022にノミネートされています。皆様は「AI絵師」に聞き覚えがありますか?これに馴染みがないという方でも「画像生成AI」なら見たことあるという方が多いのではないでしょうか?

実は2022年は「画像生成AI元年」とも言われており、「画像生成AI」技術とそのサービスに関心が集まっています。思い返すと今年は「画像生成AIはクリエイターを脅かすのか」「AIが生成した画像の著作権は誰にある?」といったニュースがネットを初めテレビでも報道されました。

しかしどうして今年になって「画像生成AI」がこれほどまでに世間の注目を集めたのでしょうか。今回は私、内海が「画像生成AI」流行のきっかけから「AI絵師」の誕生までを簡単に紹介していきます。

目次

  • この記事では、今年話題となった「画像生成AI」に関する出来事をまとめて2022年を振り返ります。
  • AIに詳しくない方でも「画像生成AI」のもたらした功績と課題についてキャッチアップできます。

 画像生成AIとは

画像生成AIとは読んで字の如く、自動で画像を生成してくれるAIを意味し、ユーザーが生成してほしい画像を文章で入力すると、AIがその文章に沿った画像を出力してくれます。

一文は百聞にしかずということで、気になった方はLINEで簡単に画像生成できる「お絵描きばりぐっどくん」をぜひお試しください。下図は私が実際に遊んでみた例です。不自然な箇所もありますが、概ね指示通りの画像を生成してくれています。

画像生成AIの流行に火がついたのは今年の7月から10月にかけてでした。下図は画像生成AIに関する出来事年表です。上の赤色の矢印がニュースに関して、下の青色の矢印が技術に関してそれぞれ重要なイベントをピックアップしてまとめています。

2020年から2022年6月までの研究動向

本記事で技術の詳細は説明しませんが、進化のスピード感をお伝えします。技術の歴史や詳細を知りたい方は「Stable Diffusion を基礎から理解したい人向け論文攻略ガイド」という記事をおすすめします。

現在話題となっている画像生成AIモデルの原型と呼べるものは2020年6月にDDPMとして公開されましたが、当時は文章を入力するというスタイルではなくランダムに画像が生成されるだけで、出力される画像のサイズも小さいものでした。それからたった2年で目まぐるしい進化を重ねて今年の4-5月には上で紹介したようなクオリティの高い画像を文章入力で作成できるような技術にまで発展しました。

しかしこの凄さはAIの研究者やAIエンジニア(以下AI界隈と呼ぶ)でしか話題になっていませんでした。なぜならこの時、研究成果のほとんどが非公開であったためです。例えば2022年6月にGoogleが発表したImagenというモデルは社会へ及ぼす影響が不明瞭という理由で一般向けには公開されていません。

2022年7月から一般利用可能に

その流れが変わったのが今年の7月でした。アメリカのAI企業が発表したMidjourneyやStability AIの公開したStable Diffusionが一般向けに提供されたのです。

このStable Diffusionを用いたLINEサービスが上で紹介した「お絵描きばりぐっどくん」です。これらのサービスによって、AI界隈だけでなく世間一般の方々にも「画像生成AI」が浸透し、楽しまれるようになりました。

2022年9月以降、相次ぐ論争

一般利用が可能になってから、瞬く間にユーザーの数や登場するサービスの幅が広がりましたが、その結果倫理的な課題が幾つも浮き彫りとなりました。

世界的に最も物議を醸したのはおそらくAI生成画像が美術コンテストで1位を受賞したことでしょう。人間の作品を凌駕するほどのクオリティの高さに衝撃が走ったと同時に、AIに文章を入力しただけで画家と呼んで良いのか、その作品の著作権は誰のものなのか、など様々な論点で現在も議論が繰り広げられています。

類似のニュースとして日本で注目を集めたのが画風を学ぶイラストAIサービス「mimic」です。イラストの盗用・悪用が懸念され、8月29日にβ版がリリース後わずか一日でサービスが一時停止となりました。

その他にも人種・性別の偏りフェイク画像の拡散など、次々と問題が取り上げられました。現在各国で法や規則の整備が進んでいますが、画像生成AIの在り方については当分議論が必要そうです。

2022年10月に「AI絵師」がトレンド入り

画像生成AIの一般利用が可能になってから2-3ヶ月後の10月6日に「AI絵師」という単語が日本のTwitterでトレンド入りしました。これは、イラストに特化した高精度モデルNovelAIのリリースがきっかけです。NovelAIが二次創作文化やファンアート文化とマッチして利用が急速に広がりました。

ここで、画像生成AIを用いてイラストを生成するユーザーのことを「AI絵師」と称するようになりました。少し前からAI界隈では、AIの思考に沿って入力文章を工夫する職人を「プロンプトエンジニア」と呼んでいますが、単にその日本語版が「AI絵師」という造語なのでしょうか。出来立ての言葉であるため未だ曖昧です(プロンプトエンジニアとAI絵師は別物だという意見もあり)。

AI絵師の誕生により著作権問題プロ絵師の存続問題など論争が激化していますが、画像生成AIに特化したイラスト投稿サービスも登場し、プロ絵師との共存の道も見えてきたように思えます。

直近の動向と今後の予想

最近では画像だけでなく動画生成AI3Dモデル生成AIなども盛んに研究されています。そのため、イラストだけでなくアニメーションやバーチャルモデルまで自動で生成できるような世界もそう遠くないでしょう。

まとめ

今回は今年世間を賑わせた画像生成AIについて説明しましたが、いかがだったでしょうか?

課題は山積みですがそれらを丁寧に解決していけば、便利で面白い技術です!この記事を通して少しでも多くの方々に「画像生成AI」に興味を持っていただければ幸いです。

それでは、次回の【One Tech】もお楽しみに〜!

明日は、ソフトバンク Advent Calendar 2022 の 6日目です。木村さんよろしくお願いします。

関連記事

  1. SNS流行語大賞に「AI絵師」「ひろゆきメーカー」ノミネート 11月下旬に発表
  2. 2022年は「画像生成AI元年」? 「GAN」の発表から「Stable Diffusion」登場までを振り返る
  3. 画像生成AIはクリエイターを脅かすのか、それとも。
  4. AIが生成した画像の著作権は誰にある?
  5. LINEでAIイラスト画像を生成「お絵描きばりぐっどくん」の使い方
  6. Stable Diffusion を基礎から理解したい人向け論文攻略ガイド【無料記事】
  7. Imagen
  8. Midjourney
  9. Stable Diffusion
  10. AIで描いた絵はインチキ?! 美術コンテストで1位受賞、芸術論争に
  11. 画像生成AIが巻き起こした「盗用」問題 追いつかぬ倫理規定と法整備
  12. AIアートが「偏見」? CEOは男性ばかり…人種や性別の偏りは「社会に流通する情報」を反映か
  13. 静岡災害デマ、画像生成AIの急速な進化がもたらす新しい時代
  14. 画像生成AIをめぐる倫理的問題の最新事情。各国で分かれる対応とは
  15. 話題の「AI絵師」って受け入れられる? 編集部メンバーで議論してみた
  16. NovelAI
  17. AIの思考を人間が助ける。AI領域で人気の職種「プロンプトエンジニア」とは何か
  18. AI絵師とプロンプトエンジニアという造語に思うこと
  19. 「ファンアートは自分で描いて」 画像生成AIのイラストにVTuberが苦言 
  20. AI vs 絵師の戦争勃発? たった10円以下で本格イラストをつくれる「NovelAI」は人類の仕事を本当に奪うのか
  21. AIで描かれたイラストに特化した画像投稿サービスが相次いで登場、利用者も増加中
  22. テキストから画像を生成する「画像生成AI」、なぜ話題で何が課題なのか

参考論文

  1. Ho, Jonathan, Ajay Jain, and Pieter Abbeel. "Denoising diffusion probabilistic models." Advances in Neural Information Processing Systems 33 (2020): 6840-6851.
  2. Song, Jiaming, Chenlin Meng, and Stefano Ermon. "Denoising diffusion implicit models." arXiv preprint arXiv:2010.02502 (2020).
  3. Dhariwal, Prafulla, and Alexander Nichol. "Diffusion models beat gans on image synthesis." Advances in Neural Information Processing Systems 34 (2021): 8780-8794.
  4. Friesner, Richard A., et al. "Glide: a new approach for rapid, accurate docking and scoring. 1. Method and assessment of docking accuracy." Journal of medicinal chemistry 47.7 (2004): 1739-1749.
  5. High-Resolution Image Synthesis with Latent Diffusion Models
  6. Saharia, Chitwan, et al. "Photorealistic Text-to-Image Diffusion Models with Deep Language Understanding." arXiv preprint arXiv:2205.11487 (2022).
  7. Ho, Jonathan, et al. "Imagen video: High definition video generation with diffusion models." arXiv preprint arXiv:2210.02303 (2022).
  8. Singer, Uriel, et al. "Make-a-video: Text-to-video generation without text-video data." arXiv preprint arXiv:2209.14792 (2022).
  9. Poole, Ben, et al. "Dreamfusion: Text-to-3d using 2d diffusion." arXiv preprint arXiv:2209.14988 (2022).

おすすめの記事

条件に該当するページがございません