目次 (クリックで展開)
#創薬ちゃん生成チャレンジ
— 叢雲くすり (創薬ちゃん) (@souyakuchan) September 12, 2022
現存するAIモデルには未学習のマイナーキャラだからできるコンペを開催する。画像生成AIを使って、最も私(@souyakuchan)っぽいキャラ絵を生成した人が優勝。
優勝者にギフト券1万円分、佳作2件に5千円分ずつ進呈する。応募は9/19(月)24時(JST)まで。
細則: 添付画像参照 pic.twitter.com/4vw3DZiGhb
現存のAIモデルがマイナーなキャラクター(今回は創薬ちゃん)を学習していないことを利用して、その状態でどこまでそのキャラクターっぽくできるかを競うコンテストのこと。
AI モデルの出所は不問だが、私はファインチューニングに適した統一された絵柄の創薬ちゃんの画像を見つけられなかったのでやらなかった。
このお題の要求を満たすためにはまず 容姿 を似せる必要がある。ざっと以下の点があるだろう。
そう、容姿を似せるためにはこれらの複数の色の要求を満たす必要があるのだ。これがなんと難しいことか。
複雑な服装の上に、非常に繊細な色の指示の技術が求められるのだ。
しかし、これだけで終わりではなく、更なる場面設定によって創薬っぽさを演出する必要もある。見た目以上に難しいコンテスト課題である。
筆者がいつも生成しているときにも発生していた課題がある。
表情は普通に難しい。笑わせると口が気持ち悪くなる。
ポーズも腕や足が崩壊する原因になる。
手は綺麗に生成できた試しなんてほぼない。
背景もちゃんと指定しないと単色で面白くなくなったり、崩壊したりしてしまう。
これらをどうにかしてうまく回避する必要があった。
これは現状の Stable Diffusion v1.4 および Waifu Diffusion では無理だと判断した。なので、これを指定しないことで複雑さの軽減が期待できると思った。
とりあえずシンプルなものをば..#創薬ちゃん生成チャレンジ https://t.co/SuJck3FmFq pic.twitter.com/SMul831c50
— Plat 🖼️ (@p1atdev_art) September 18, 2022
a girl (souyakuchan), leaning_forward, in laboratory, doyagao, head_tilt, black_hair (((with red stripes))), streaked_hair, crossed_bangs, red_necktie, white_jacket, white_shirt, black_skirt, short_skirt, looking_at_viewer, sunlight, solo, 1girl, dynamic angle, portrait, cowboy_shot, absurdres, highres, tsundere, kuudere, (ahoge), (blush), wide shot, top lighting, dramatic lighting, perfect shadow, ((sharp contrast)), depth_of_field, bokeh highlights
これです。本当はこの後も何回か試行してもっといいのを提出する予定だったが、頭痛でヤバくなったのでこれしか提出できなかった...
ただ、このまま生成していても今の自分の手法だとあまり大きな変化のあるものは作れなかったと思うので、どちらにしろこれより良いものは作れなかったと思う。
私はいつも Google Colab で実行して、生成した画像を Google Drive に保存している。ちゃんと数えたわけではないが、おそらく今回の生成では合計 2000 枚前後を生成したのではないかと思う。
最初の生成は電車の中でスマホからやっていた。東京ゲームショウに行くときに創薬ちゃん生成チャレンジのツイートを見かけて、とりあえずいつものテンプレをいじって生成した。
最初の方は赤や黒の単色が多く、あんまり似ていない。帰ってから PC を使って本格的にプロンプトを変えて試したが、ようやくここで課題の難しさに気づいた。
そう、色が混ざるのだ。
前述したように、創薬ちゃんにはさまざまな部位にいろんな色が使われており、それらを正確に塗り分ける必要がある。これが本当に難しい。
最初の時点で白衣に青い線を入れるのは諦めた。
しばらく生成しているとなぜだか少しずつ実写寄りになってしまってきた。私は実写系ではなくイラスト系を生成したいので、仮に実写系で綺麗にできても提出はしない。
色を気にするレベルじゃなく、もはやイラストじゃなくなってきた。これはまずい。
構図はいい感じなのだが、やはりまだ一定の割合で実写みがある。
ここで少し生成する画像サイズを変えてみた。今までは 568x712 だったが、ここでは 712x568 にしていた。
若干良くなったように思えたが、二人以上生成されたり、まだまだ変な立体さがあるイラストが生成されている。
なぜか超実写になってしまった。許せない(誰を?)。
この生成からビーカー、試験管、ゴム手袋などを指定すると実写に寄ってしまうことがわかった。(自分の呪文の組み合わせのせいかもしれない?)
ちょっと良くなった。提出したものは右上の 95_140824799.png
である。
このあたりからまた画像のサイズを 568x712 に戻していた。
適度に赤メッシュ髪を生成できていて、構図もそこそこ良い感じなので同じような条件でいっぱい生成することにした。
500 枚生成した。
サムネイルだけ見るとそれっぽい感じのものはいくつかあったのだが、下半身が崩壊していたり拡大してみると全然可愛くなかったり、可愛いのに髪色が単色だったりと、提出に値するようなものは一つもなかった。
500 枚生成した中から、微調整したら良くなりそうなものをいくつか選んで生成し直した。
だが、あまりうまくいかなかった。
いつもやっていない処理を急に用意したこともあり、あまり慣れていなくて綺麗に調整ができなかった。
それと頭痛もヤバくなってきていてこのあたりで諦めてしまった。
以下は惜しかったもの。ちょっと崩壊がある。
![]() |
![]() |
このコンテストでは、プロンプトを公開することが条件になっているので他人がどんな呪文を使ったのか知ることができる。良い機会なので綺麗なイラストの呪文を見てみる。
できました🥳(無加筆・無加工です)#創薬ちゃん生成チャレンジ https://t.co/ok1XxgQrny pic.twitter.com/xgMGasHloY
— chili (@kawaiiprompter) September 16, 2022
めっちゃ可愛い!ちゃんと赤メッシュ!手になんか持っててすごい!
ALT には
{
"prompt": "full-body, standing, beautiful character portrait of a beautiful cute scientist girl (in a chemistry lab), 1girl, Artists, with black long_hair, bright red streaks, two-tone_hair, streaked_hair, alternate_hairstyle, backlight, atmospheric lighting, anime eyes and iris, blush cheeks, dot nose, vivid color, highly colorful, vivid color, highly colorful, looking_at_viewer, game cg, HQ highres, CANON EOS, 35mm Lens, trending pixiv, fanbox",
"negative_prompt": "bad anatomy disfigured mutated octane render",
"sampler ": "k_euler_a",
"guidance_scale": 8.0,
"num_inference_steps": 50,
"seed": 0,
"model": wd-v1-2-full-ema-pruned.ckpt
}
とある。筆者と同じ Waifu Diffusion を使っているようだが、見たことのない negative_prompt
というパラメーターが存在する。
negative_prompt
とは?
軽く調べてみると、どうやら Stable Diffusion Web UI についている機能のようだ。役割は名前の通りなるべく入っていて欲しくない要素を排除することができる。
私は diffusers で直接画像生成していたのでネガティブプロンプトなるものを使っていなかった。今度実装してみることにする。
しかもシード 0 でここまで生成できているので、おそらくこの条件でシードを変えて大量に生成しても高い確率でこれと同じような綺麗なイラストが生成されるのだろう。すごい。
個人的に気になった呪文は、vivid color, highly colorful, vivid color, highly colorful
なのだが、これによって暗い感じがなくなる感じだろうか?あとで試すことにする。
また、よく trending pixiv, fanbox
が使われるのを見かけるが、個人的にはこのワードには一切効果がないと思っている。(私の環境ではつけているものとつけていないもので比較してみても全く変化が見られなかった)。ちゃんとした効果についてわかる人は Twitter か何かで教えてほしい。
他のイラストも見てみる。
#創薬ちゃん生成チャレンジ
— Inwerwm Artificialis (@InwerwmA) September 17, 2022
細かめに決まったコンセプトに沿った画像を出すのはやはり結構難しいですね https://t.co/PSEfLGiFWR pic.twitter.com/C5hzaHWyl9
Model: wd-v1-2-full-ema
Prompt:
full body cowboy shot of (((black! long_two-tone_hair))) and ((bright red streak!!!)) cute girl in white_labcoat!! and collared_shirt, backlighting bokeh, ((long ((black_hair)) streak!!)) bangs, (holding clear water flask), breasts, blush cheeks, (((volumetric lighting))), (cinematic_lighting), standing in ((chemistry laboratory)), bishoujo!, aesthetic shiny iris, looking_at_viewer
Negative prompt:
bad anatomy disfigured mutated
Steps: 70
Sampler: Euler a
CFG scale: 8
Seed: 587041628
Size: 640x512
綺麗!可愛い!手になんか持っててすごい!
呪文に !
が使われているが、これによって強くなったりする感じなのだろうか。あとで試す。
かなり簡潔な呪文になっていてすごい。
Waifu Diffusion ではないがすごいと思ったのでこちらも見てみる。
無加筆です。#創薬ちゃん生成チャレンジ #TrinArt https://t.co/t2Gv6O54cd pic.twitter.com/3x0s1bwu7J
— 852話 (@8co28) September 17, 2022
TrinArt:キャラクターズモデル
『1girl, pose, alone, 青い線, ロング白衣 黒髪、前髪に赤い線、 赤メッシュ髪, figure, 黒いタイトスカート, 赤いネクタイ, 白いシャツ, つり目赤い瞳, アイドルアニメ, pixiv, Pinterest, 黒いニーハイソックス, 試験管, 実験室, 科学室』
step:50 Strength:8.5 size:512x768
まず驚くのは白衣に青い線が入っていることだ。創薬ちゃんを生成してみるとわかると思うが、あの青い線を出すのはめちゃくちゃに難しい。ヤバい。
しかも、日本語でここまで短い呪文であんなに綺麗に整えられる TrinArt はすごい。使ってみたい。
#創薬ちゃん生成チャレンジ
— だだっこぱんだ🍞 (@ddPn08) September 18, 2022
2枚目です! https://t.co/4MaLvp2jxA pic.twitter.com/AHYvt9Auw1
model: wd-v1-2.ckpt
prompt: 1girl bishoujo (upper_body), bangs long_hair ((black_hair)) (with red lines) ((two-tone_hair)) multicolored_hair, blush looking_at_viewer, [[red necktie]] labcoat open_coat long_coat blue_collar ((white_shirt)) skirt_suit pencil_skirt (black_skirt) short_skirt, syringe, ((in laboratory))
こちらは Waifu Diffusion。全然崩壊してなくて綺麗。可愛い。かなりアニメっぽい雰囲気になっている。
[]
で囲むのはどんな効果があるんだろう。あと、個人的に white_coat
や syringe
などの入れると実写化してしまう語を入れてもアニメっぽい感じになっているのがすごいと思った。いつも使っているテンプレに原因があるのかもしれない...
#創薬ちゃん生成チャレンジ
— Izumi Satoshi (@izumisatoshi05) September 19, 2022
最終サブミット。これが今の自分の限界です。
77トークンに思いを込めて(?)生成しました。 https://t.co/DcIb7SZwIt pic.twitter.com/JPeNfWWBOK
waifu diffusion v1.2 on AUTOMATIC1111
(long straight black hairstyle with brilliant-red streaks), full body, beautiful character illustration of a beautiful cute scientist girl (doing an experiment in a chemistry lab), 1girl, red necktie, white coat, white shirt, backlight, atmospheric lighting, red tsurime anime eyes and iris, dot nose, hair between eyes, sharp focus, HQ highres, pixiv fanbox
Negative prompt: bad anatomy, disfigured, mutated, octane render, extra fingers
Steps: 50, Sampler: Euler a, CFG scale: 7.5 Size: 704x512
こちらもアニメっぽい雰囲気になっているイラスト。綺麗。
私の呪文と比べると結構文章調になっているが、もしかしたらその方が伝わりやすいのかもしれない?
わからん...
見た目以上に難しいコンテストだった。だけど、めちゃくちゃ面白かったのでこんな感じのコンテストがあったらまた参加してみたい。