今年に入って、SNS上でも頻繁に話題となっていた「AI画像生成」の分野。
イギリスのAIスタートアップ企業「Stability AI」が、
8月22日に画像生成AI「「Stable Diffusion」をオープンソース化すると発表。
わずか1週間で、九大情報工学部に在籍する西野颯真さん(@nishino_0719)により、
LINE上で文章を送ると、数秒でAIが画像生成してくれる『お絵描きばりぐっどくん』
がリリースされました。
今後も画像生成AIを用いた、同様のWebサービスが多数リリースされると思われますが、
様々な分野での活用が期待される分野だけに、とてもワクワクしますね。
まずは上記のURL・QRコードから友達登録。
あとは日本語または英語で、文章を送るだけ!(現在2か国語に対応)
ものの10秒程度で、生成した画像を返信してくれます。
LINEを用いたシンプルな操作性で、
誰でも話題のAI生成ツールを体験できる点が素晴らしいですね。
「Stable Diffusion」の活用自体は環境構築が必要となりますが、
一般人でも活用できるサービスのリリースがここまで早いとは驚きました。
画像生成自体は「馬」「宇宙飛行士」のような単一単語でも可能ですが、
「ピカソが書いた」「草原を走る」「人間が乗った」
・・・のような修飾語(note社のCXO・深津貴之さん曰く、呪文詠唱)で
アウトプットされる画像の方向性をうまくコントロールすることが必要です。
たとえば、「馬」だけの指定だと、AIがこれまで学習した様々な要素を
もとに「馬」が描画されるので、アウトプットが安定しません。
1回目では馬は馬でも「騎手が乗った、競馬場を彷彿とさせる場所で走る馬」が描画され、
2回目は「漢文を思わせる書体での解読不能の文字」が描画されました。
ですので、人間のデザイナーにクリエイティブ物を依頼するときのように、
アウトプットしてほしい内容を明確に、誰でもイメージしやすいように依頼することが大切となります。
曖昧な依頼が嫌われるのは、部下もAIも変わらないということですね。
これからのAI画像生成の分野においては、依頼する側の手腕が問われます。
たとえば「アップル」だけを指定したときは
上の「少し青みがかった、ヘタの位置が曖昧な複数のリンゴ」が描画された一方
「イーコマース用の、画質の良い、シンプルな背景にある、単独の赤いりんご」と
指示すると「一般的に第一想起されるような、よくあるりんご」が描画されました。
深津さんのnoteでは、「イーコマース用商品写真」は背景やレイアウトの再現性が高い」
と書かれていました。
AIの学習経路を考えた上で、再現性ある修飾語を探すのは面白いですね。
・・・といろいろ遊んでみようと思ったのですが、
1日に画像生成できるのは5枚までのよう。
もっといろいろ試してみたかったですが、また明日ですね。
冒頭で書いたように、
今後たくさんAIを用いた画像生成サービスがリリースされると思います。
AIの動きをうまくコントロールできるような呪文(スペル)を多く覚えることが、
もしかするとこれからの時代、1つのスキルとして成立するのかもしれません。
時代においていかれないよう、今のうちに勉強しておきましょう(笑)
[…] 最近、クリエイター界隈を賑わせている、AI画像生成の分野。8月29日、LINE Botを活用した『お絵描きばりぐっどくん』がリリースされ、当サイトでも紹介させていただきましたが、同日にまた新しいサービスが登場しました。 […]