「Stable Diffusion」「Midjourney」などに次いで公開された「NovelAI Diffusion」。生成される画像のクオリティの高さからSNSを中心に賛否両論を巻き起こしています。
特に最近では、「単に画像データをコラージュしているだけ」などの批判に対して、Novel AIサイドも、使用したデータセットなどの情報を公開。既存のビジュアルデータを単にコピー・コラージュしたものではないと明言していますね。
そのほかにも、pixivがAI絵に対するガイドラインを発表するなど、画像生成AIの過渡期ならではのユーザー側・サービス側の議論や動きがあります。これから更に盛り上がりの予感を見せるAI分野。
今から初めてNovel AIを触るという方も多いと思うので、「とにかく早く神絵師級の絵を生成したい」という方のために、最低限のパラメータ説明と、汎用性の高いプロンプトもとい呪文の詠唱方法を記載しておきたいと思います。
まずは簡単に各種UIやパラメータの使用方法を解説。初じめての方は「とりあえずそんなものがあるのか」くらいに捉えていただければOKです。
最低限の設定だけ行なったら、取り合えず適当なプロンプトを試して色々遊んでみてください。「Beautiful girl」とか「girl, kawaii, full body」などの単純な呪文でも数枚生成すればかなり高精度な画像が出力されます。下記では、まず最低限の設定が必要な部分だけ抽出しています。
・NovelAI Diffusion Anime (Curated)
ベースラインの品質が良い基本版
・NovelAI Diffusion Anime (Full)
Curatedにトレーニングセットを拡充させたモデル。画像における細部の描写やネガティブプロンプトの設定などにこだわりたい方向けのフルモデル。
・NovelAI Diffusion Furry (Beta)
毛皮や擬人化された動物をテーマにしたコンテンツを簡単に作成するためのベータモデル。今後拡張予定とのこと。
現状NovelAIでは3つのモデルが用意されています。基本的な二次元絵を生成したい場合はCuratedを選択。えっちな画像を生成したい場合はFullを選択すればOK。※ちなみに後者の場合は、「nsfw」(Not safe for workの頭字語。職場や学校などのフォーマルな環境下での閲覧に注意を促すため、裸、ポルノグラフィ、卑語、暴力などの要素を含むコンテンツを示す語句)のプロンプトを入力すれば精度が上がります。
画像サイズを選択できます。サイズが多くなると消費するAnalsも多くなるのでその点は注意。Opusプランでは「640×640pixels」以下の生成は無料となります。
あと描画領域が広がるほど、その分若干精度が不安定になるのと、2人以上の人物が生成されるようになるので、「1 girl」など、人数を指定するプロンプトの詠唱を忘れないようにしましょう。
Stepsは、AIに対して入力したプロンプトのもと反復学習させる回数。Scaleは生成する画像のディティールであり、低いとラフ画のようなソフトタッチに、高いとシャープで詳細さが増します(10-15前後でOK)。すごく簡易的に説明すると、どちらも「プロンプトをいかに忠実・詳細に反映するか」を学習・指示するパラメータと捉えればOK。
ちなみにStepsの公式からアナウンスされている基準は以下。・2-8→呪文をほぼ無視。AIに自由に解釈させる。
・9-13→AIに呪文に対する若干の誘導をかける。
・14-18→AIが呪文に忠実に描画する。
・19以上→呪文に強く影響を受ける。
パラメータによって消費Analsが変わるので注意。節約しながらお目当ての画像を描画するためには、「まずはStepsを下げて描画したい絵に近づくプロンプトを探す→そこからパラメータを上げながら試行回数を増やす」がおすすめです。
ここからは実際に詠唱するプロンプトを紹介していきます。基本的には自分が生成したい条件を、英訳して細かく指定してけばOK(向き・表情・色見・動き)なので、プロンプト自体は無限に存在します。
ですのでここでは、比較的汎用性・利便性の高いプロンプトを紹介します。元素法典でも多く記載される基本的な詠唱内容なので、わりと多くの画像生成に流用できると思います。
画像生成画面の左側上部にプロンプト入力画面があるので、そこに各単語を「,(コンマ)」区切りで入力します。単語でなくても「looking at viewer」のように文章でもOK。
なおプロンプトはタグは{}で強く,[]で弱くすることが可能。{{{masterpiece}}}のように複数入力もできます。また前述されたプロンプトのほうが優先される仕様なので、重要度の高いものはなるべく前半で詠唱するようにしましょう。
1 girl, solo,single_human_girl /人数指定
illustration/イラスト
full body/全体像
floating hair/髪をなびかせる。絵に躍動感・動きが出る。
beautiful detailed~~/単語の頭に形容詞的に付ける。–eyes –face –girlなど。
anime face/アニメ風の顔
head_tilt/首を傾ける
looking_at_viewer/まっすぐ前を向く
masterpiece,high quality,
best quality, extremely detailed /高画質化(強調しつつ前面で詠唱)
8k_wallpaper/高画質な背景画
画像生成画面の右側メニューにある「Undesired Content」からは、ネガティブプロンプトも指定が可能。要するに「これを描画してほしくない」という意味の指示であり、低画質・低品質なものや、違和感のある出力を防ぐことができます。
こちらも通常のプロンプトと同じく、どんな画像でも普遍的に設定しておいたほうが無難な内容はある程度決まっているので、おすすめできるものを厳選して紹介します。
nsfw/ポルノや暴力的な絵などの回避
text/文字生成の回避
username,artist name/アーティスト名の回避
worst quality, low quality, normal quality/低画質・低品質な生成の回避
cropped/欠損やイラストの欠け回避
bad anatomy/身体バランスの不具合回避
jpeg artifacts/圧縮アーティファクトの回避
bad hands, missing fingers/違和感のある手指、欠損の回避
too many fingers/指の本数の異常回避
bad hands/不具合のある手の回避
cropped/欠損やイラストの欠け回避
引き続き、汎用性の高いタグは加筆修正していきたいと思います。ぜひルールとマナーを守って、そして最低限のモラルを忘れずもって、AI画像生成を楽しんでいきましょう。