Rのつく財団入り口

ITエンジニア関連の様々な話題を書いているはずのブログです。

【雑記】じぶん Release Notes: 誕生日が来たりAI術師に入門したり

ver 0.2023.06: ハーイウェーイ・トゥ~・ザ・デンジャゾォン(ズンズン♪

 もうこの曲が出た時点で旧作『トップガン』を知る人はテンション爆上げなんだぜ...
 ということで id:iwasiman (ver 0.2023.06)が今月もリリースのテストをしているようです。

じぶん Release Notes 6月:AI製ケーキをどうぞ

2023年6月のまでのアウトプットと参加イベントを振り返ると

アウトプットしたものや参加したイベントなどをまとめてみました。

Github

アウトプットしたものや参加したイベントなどをまとめてみました。

SpeakerDeck
Blog等

LAPRASポートフォリオはこちらから

学び編

 最近画像生成AI周りのインプットが多いので、機械学習とか深層学習の入門書をどこかで読んどくかなあなどと思案中です。やはり約束の『ゼロから作るDeep Learning』なんじゃろか...もうちょっと簡単でまずは薄く広く全体の概要が掴める本がいいかなあと思ったり。オススメがあったらどなたか教えて頂けるとありがたいです。

雑誌

WEB+DB PRESS Vol.134』は特集3「画像生成AIのしくみ Stable Diffusionの内部を探る」から見始めたのですが特集のAPI話など諸々読了。
 巻末にエンジニアとして視野を広げる話があって情報収集とか本や雑誌を読む話があって、「Software Designも読んだら?」と漫画のキャラが言っていて今後の休刊の前振りかと思うと泣ける...(ブワッ

gihyo.jp

『Sotware Design 2023年6月号』は定期連載でStable Diffusionの話が出てきたのでそこから読み始めました。(そこからか) まずは前段というところで簡単な話でしたね。

 そして特集ががっつりとクリーンアーキテクチャ話でぐっときます。『ちょうぜつソフトウェア設計入門』の田中ひさてるさんに『ドメイン駆動設計入門』の成瀬さんと執筆陣が豪華。
 途中に実際のアプリケーションへのクリーンアーキテクチャ適用例が出てくるんですが、これがBobおじさんが主張している真理は満たしているけど、例のタマネギの図そのものには全然なっていないんですよね。やはり人間は表面的なこういうイメージに惑わされやすいものなのだなあと。

 その後は技術同人誌発の技術の泉シリーズ『AIとコラボして神絵師になる 論文から読み解くStable Diffusion』を読み始めました。2022年夏~秋のブームが始まった頃の本なので若干内容が古いですが、これまでの経緯などが分かるし読みやすいです。

 前に新宿の紀伊国屋書店に行ったら2023/4刊行の『Stable Diffusion AI画像生成ガイドブック』という本がばばーんと強調されていました。たぶん最初のまともな本ですがこれから始める初心者向けのようですね。既にネットでいろいろ調査して試している人が対象ではないようなので、今の自分の持つスキルよりも前段階の本かな~という感じ。

Udemyとか

 そのうちやります。

GitHub

github.com

ポートフォリオサービス系

LAPRASのスコアですよ(2023/4/1時点)

LAPRASさんのスコアは技術力:3.46、ビジネス力:3.48、影響力:3.46を維持しています。技術力詳細が170万人中2万人以内だと、単純計算で上位11%ぐらいでしょうか。

技術力詳細だそうです(2023年4月)

発信力レベル

スキル偏差値v2は60.0でした
Findyさんの解析で発信力は全体の約36%に位置するレベル6で1284位。スキル偏差値v2によると60.0を維持しています。

 たまにチャットリクエストを頂いたりもしているのですが、相変わらず有難く拝見だけしております。

おしごと編

★とあるシステムの古いバージョンのSQL Serverのアップグレードにチャレンジしたら正しい道筋を発見するまでにけっこう手間取りました。

★遂に社内の仕事環境でもChatGPTが使えるようになりました! 裏ではAzure OpenAI Serviceに繋がっているはずですが途中のサーバー経由の為か割と遅いです。「仕事のやる気の出し方」とか「午後の眠気を抑える方法」を聞いたりしています。(おい
 最近GPT-4も来たのですが人によってうまく切り替わらなかったりしています。

★社内の有識者Microsoftの人によるAzure OpenAI Service周りのセミナーを聞いたり。いやほんとに新世界で面白そうです。
 この時思ったんですが、最近の登壇者の資料の最初の自己紹介ネタは自分のことをChatGPTに聞いてハルシネーション混じりの紹介で笑いを取るというトレンドを感じた...!

★雑談をするミーティングに参加したら例のティアキン『ゼルダの伝説 ティアーズ オブ ザ キングダム』にハマってる人が楽しそうでした。ゲーム機のゲーム、久しくやってないな...

★定期的にやっているミニ勉強会は若手からフロントエンド話のリクエストがあったので、まずはJavaScriptのこれまでを一通りおさらいしようということで一発やりました。テーマが広すぎるので2回に分けることにしてやっています。以前に読んだ『実践Node.js入門』や雑誌記事などもとても参考になりました。

★その後の話で、オンライン勉強会だとベテラン層は気軽に質問したり会話しちゃうけど若手は遠慮しちゃいがちになるのではという話があって、確かにそうかもなあと思いました。その後少人数だけでやった時は気軽に質問が出たので、若手だと1人とか少人数相手の方がいいのかな...?

ライフ編

健康と生活

BMIはいつもの20.0~20.1ぐらいでふつう。
Apple Watchによる平均睡眠時間の測定、3月:5h25m→4月:4h50m→5月:5h1mと相変わらず芳しくない...(死) 寒い日はやはり睡眠がとれていました。

★仕事のオンライン会議では先月購入したShokzの高級モデル、マイク付きの骨伝導ヘッドセットのShokz OpenCommを活用しています。今まではなんとなくスマホに口を近づけて喋ってしまう癖があったので、雑談ミーティングとか勉強会で喋る時はこちらの方が良いですね。
 プライベートで使う時は会社のスマホBluetoothを切る→プライベートのスマホBluetoothで探して接続しなおす→平日になったら会社スマホに接続を戻す という操作がめんどくさくて、仕事専用デバイスになっちゃいました。

★僕は歯並びが悪いので定期的に歯医者でクリーニングやメンテを受けているのですが、前々から顎に親知らずが横向きに埋まっていてその手前の奥歯との間に歯周ポケットという溝ができちゃってます。長期的にみると抜いた方がいいですよとは言われていました。
 最近その話を受けて考えて、仕事が比較的落ち着いている今こそチャンスかも...と思い直して抜歯のイベントにチャレンジすることにしました。(歯の話が苦手な方は失礼します...)

  • 紹介状を書いてもらってもっと大きな病院で事前に検査。ここで同意書を書くのですが、たまに痛みや腫れが長く続いたり、複雑な抜歯だと神経が傷ついて後が長くかかったり感染して後が長く掛かったりとのケースもあるそーです。怖いなあとは思うのですが、ここは同意。
  • 当日までは10日間検温して体調が普通なのを確認してもらって当日。仕事は休みを取って早く抜けて病院に行っていよいよ実施です。
  • まあ普通は何も起こらないよねとは思うのですが、やはりソワソワします。ここで素数を数える...のではなくて可愛いイラストを見て心を落ち着かせようと思って、TwitterのTLに流れてきたAIイラストにイイネをしまくってAI術師さんを順次フォローしていくという謎のムーブをしていました。(あほ
  • そして抜歯は、歯茎に2回麻酔の注射をしてこれはふつうに痛いです。その後は麻酔が効いてくるし目をつぶっていたのでよくわからないのですが、歯医者特有のあの「ウィーン」が聞こえてきたり、かなり大きい「グキッ」が聞こえてきて今ヤッたか~と思ったり。5~10分ぐらいであっけなく終わりました。
  • 抜いた歯の残骸を見せてくれるんですが、僕の場合は埋まってたので残骸が3つぐらいに分離しています。黒ずんでたところもあって、やはりこれは他の歯に影響を与える前に抜いて良かったものだったそーです。けっこうな大きさで、こんなものが自分の口の中に埋まっていたと思うと奇妙な感じです。人間の体というのは不思議なものです。
  • その日の夕食はたまたまプレーンなうどんを食べてみたのですが、口の片側だけを使って食べてみるのがかなり辛い(笑)。事前の予定通り、しばらくはウィダーインゼリー的な流動食やヨーグルト、カロリーメイトとかで過ごしていました。
  • ちなみにその数日で体重が減って体脂肪率も減って体が締まりました。ダイエットなんて簡単や!(うそです)
  • 抜いた後は血が固まってだんだん組織になって回復していくそうですが、しばらくは痛いです。細菌感染を防ぐ薬はしばらく服用。毎食後服用の痛み止めも5日分処方してもらって、食後でなくとも痛くなったら適宜飲んでいいというルールでした。
  • この痛み止めの効き具合を毎日メモしていたのですが、だいたい8Hぐらい効いていました。これは食後にこだわらず、朝~午後~夜の8H間隔で服用したら24H回せるのでは?という仮説を思いついて仮説検証して、これで痛くならずに過ごせるのが分かりました。
  • オレ天才! と思っていたら痛み止めを飲み切ったあともまだ痛い(苦笑)。ネットの歯医者さんの情報にも各種載っているのですが、個人差がだいぶあるようで、だいたい1週間~10日ぐらいで収まるともあるのですが2週間を過ぎてもまだ痛いんですね。(死)
     腫れはすぐ引いたし診察では異常がないと言われたし、痛みの種類が違ってズキズキではなくムズムズするようなやつなので、これは体組織が治りかけの痛みなのかもしれぬ...
  • ということで市販の痛み止めとしてはメジャーな『ロキソニンS』を試しています。これも計測では8Hぐらいは効いていました。これは服用は4H間隔、1日2回の上限があるので24H時間は回らないんですよね...次はもっと高いプレミアムか1日3回飲める『EVE A錠』を試すか...

  • あとはよく考えると常備している頭痛薬の『EVEクイック頭痛薬DX』がこれも頭痛以外にも効くのでした。こちらは服用6H間隔で1日2回上限。これは頭痛の時にいつもよく効いてくれるので試しがいがありそうです。フヒヒ...

  • という感じでヤバいドラッグの効き具合を試すヤバい人みたいになりながら、意外なハードイベント後を耐え忍んで生きています。僕もヒットポイントの回復速度が昔よりは減ってるので、もっと年齢の若い人だともっと早く収まるのでしょうね。

★そんなこんなでバタバタしてきましたが自分の誕生日イベントもありました。日曜だからみんなTwitter見ないよね(シュン...)と思っていたら、意外に沢山の方からリアクションをいただきまして、ありがとうございました~。

★とゆことで準備していたお礼イラストをスッと放流しました。こういうシーンでAIイラストはお役立ちです。

子育て

ゴールデンウィークは奥さんのリクエストにより2泊3日でディズニーランドとディズニーシー両方に行くという大イベントになりました。
 前はベビーカーに子供氏を乗せて荷物も吊るし、この重量を片手でハンドリングしてもう片方の手は傘をさして雨のディズニーを歩き回るというシチュエーションがすごく大変でほとんど苦行だったのですが、今回は子供氏が自分で歩くようになったので少しは楽になった...かな?
  とはいってもアトラクションを怖がってリタイアしたり、並んでる途中でトイレに行き出して断念したり、結局ぬいぐるみの方に関心を示したり、まあバタバタしとります。

★春から小学校でこちらもドタバタしまくってきたのですが、さすがに5月も過ぎて慣れて落ち着いてきたかな...?という感じに。友達も増えてきて学童クラブも楽しいようです。
 奥様氏が物理出社する日は朝も僕が一緒に校門まで送っているのですが、このタスクと上の親知らず抜歯のハードイベントがあったりで、朝活の読書の時間が侵食され気味です。先月も書いたのですが生活リズムを整えていきたいところです。

娯楽編

映像作品とか

各所で話題のトップガン マーヴェリック』Netflixに配信が来ていたので見ました。前作は1986年、実に36年ぶり!

  • 開始後しばらくで米国海軍の空母から次々戦闘機が離着陸するシーケンスが流れるのですが、ここでもうBGMがHighway to the danzer zone... とズンズンくる。サントラが豪華なことでも有名だった前作の名曲ケニー・ロギンスの『Danger Zone』キターーーーー!! 世界観が完全に同じ続編キターーーーーー!! となります。もう若き日に前作に心躍らされた人全員ここでテンションMAXですよ。ほかにも前作の曲が何回か出てきます。
  • トム様演じるマーヴェリックさんは最初は最新鋭の機体のテストパイロットやってイジイジしているのですが、文句をつけてくる偉い人が何気にエド・ハリス様で豪華...
  • 作中の世界観でも、もう予算のメインはドローンや無人機に移り変わろうとしていて、ドッグファイトする有人のパイロットはもう時代遅れだ的なことを言われています。マーヴェリックはそれに抗って昇進もしないで留まってる人なんですね。このへんのポジションがもう。世の中の変化についていきにくいオジさんたちの心を鷲掴みするわけですよ。うーん脚本が上手い。
  • そして若くて優秀だけど高慢な現在のトップガンのエリート面々。最初は教官の実力を疑っているのですがマーヴェリック様は年をとっても伝説の天才パイロット。全員軽くあしらってしまうわけですね。このへんがもう。最近のワカモノについていけないオジさんたちの心を(以下略)な訳です。
  • 年を取ると身体能力は衰えるので理屈としては高Gに耐える力も減少するはずですが、ここはトップガン世界なのでこまけえことはいいんだよ!(AA略 となります。
  • 前作のヒロイン役だった女性もちゃんと出てきます。この方は年とっても美人ですね。そういえば前作の展開だとマーヴェリックと結局どうなったんだっけ?とかもう覚えてないのですが、音楽と映像がいいのでこまけえことはいいんだよ!(AA略 となります。
  • 前作のライバルポジだったコールサイン"アイスマン"の人がちゃんと出てくる...ヴァル・キルマーさん年取ったな...演じてる役柄も年を取っていて二人の再会シーンはグッときます。
  • そして前作は最後に具合よく出てくる敵機がミグ戦闘機であからさまに敵がソ連なのが当時のアメリカ的だったのですが、今回時代だなーと思ったのが敵国が完全に無味無臭なんですね。
     ヘルメットも真っ黒であまり喋らないし敵のミサイル基地もよく分からない。イスラム臭もロシア臭も中国臭もほとんどしない。アメリカ友好国の共通の敵で空母の南の方角にあったはずですが、砂漠の国っぽくもないし谷には雪も降ってたしよく分からない。映画特有の豪華な映像なんだけどこのへんはよく分からないようにうまく作ってあります。
  • 今回は教官ポジにとどまって教え子たちを危険な死地に追いやることになりイジイジするマーヴェリック様。「そんなこと言って最後は一緒に出撃しちゃうんじゃろ?」「死んだグースの息子とキャッキャしちゃうんじゃろ?」「ピンチに陥って味方機が助けに来るシーンがまたあるんじゃろ?」と観る側は色々予想してしまうのですが、王道展開な映画なので観る側が期待している約束のシーンをだいたい全部やってくれるんですよね。
  • なお最新鋭戦闘機と旧型F-18のスペック違いとか、そういう技術的なことはわからなくてもふんいきで進められる仕様になっているので、委細ダイジョウブです。

ということで、世界中の前作ファンもニッコリのサービス仕様の一作でした。僕は別にトム様はあまりファンじゃないんですが、トム様の出る映画は良作が多いんですよね...なんでじゃろ...笑

topgunmovie.jp

ほか、その方面で熱狂的に支持されている『アイの歌声を聴かせて』が6月から配信開始されるそうなので、これはAIネタだし見るべきな気がする...

ainouta.jp

本とかコミックとか

 今月はお休みです。

今月のプロンプトエンジニアリング:AI術師の入門継続中

 相変わらずオープンソースのStable Diffusionをあれこれ弄ってAIイラスト界隈に入門しています。先月のリリースノートにアツい反響を頂いたのでアンサー記事も献上しました。こういうのも楽しいですね。

iwasiman.hatenablog.com

 よく連日Twitterにイラストを投下している方もいますし、日本でのアウトプット先も揃ってきました。

pixiv: 2007開始のイラスト系SNSでは老舗ド定番。累計登録ユーザー8400万。投稿時に情報としてAI生成作品かを明確に選択するようになりタイムラインでも制御可能、住み分けの方式に。
 pixiv FANBOXという、pixivのそれぞれの垢の活動とはまた別口でクリエーターが支援者からお金を貰いながら支援者限定の絵を配布したりできるサービスが回っています。AI生成絵でこれをやっている人はだいたいえっちな絵でしたが、FANBOXはAI生成作品については5月から全面禁止に。多くの人が他サービスに移住していきました。まーpixivはユーザー数も多いし色々騒動も起こったし、AI排斥寄りとも取れる方向でも仕方ないでしょう。(実際には完全排斥ではなくて住み分けなのですが)

ちちぷい: 2022年秋スタートのAIイラスト/フォト専門のSNS。なんと会員10万人を突破して最大手に。僕がフォローしてるのがもうすぐ500人、フォローしてくださった方も160人を超えました。

AIピクターズ: 2023年5月で会員2万人。こちらはイイネを表すスタンプをユーザー側でも作れたり、ちちぷいとはまたちょっと違う形で進化中。両方に投稿している人もよく見ます。

アワートAI: UIが個人作成ベースっぽい? 同種のサービス。

note: おなじみnoteで情報発信したり、pixiv FANBOXから移住してこちらで支援者を募り、支援者限定のお役立ち有料記事を書いているような人もAIイラスト界隈で時々見かけます。

★ほか、海外起源の画像投稿ができるサービスも幾つか...

www.chichi-pui.com

 ちちぷいでは「ちちぷれいトレカ」というトレカ風イラストを投稿して上位者は実際にカード化されるというイベントがあったので、記念に縦長イラストを作りました。

#AIイラスト トレーディングカード風 - iwasimanのイラスト - pixiv

prompts: (Botanical art background:1.5), (Gorgeous frame on all four sides:1.5), absolutely resolution, highres, texture, SSR card, (masterpiece: 1.5), (best quality ), 1girl, rabbit ears, cheerful smile:1.2, wavy hair, (platinum hair:1.1), side braids, long hair, (dark red eyes:1.1), short sleeves, puffy sleeves, puffy short sleeves, white dress, mini skirt, red ribbon, looking at viewer, front view:1.5, standing, in kitchen,
negative prompts: EasyNegative, tails, heterochromia, look back, extra ears, (low quality, worst quality:1.4), (bad_prompt_v2:0.8), extra fingers, fewer fingers, bad anatomy, missing fingers, human ears,
Steps: 50, Scale: 7, Seed: 939711611, Sampler: DPM++ 2M Karras, Denoise Strength: 0.7

この作品を作る過程では...

  • まず四隅の枠を絵画風にして花を添える作品がちちぷいにいくつかあったので呪文を参考にして検証。(でも枠が四隅に正確には出てくれませんでしたね...使用モデルによる動作の違いや、LoRAという拡張機能の力でやってる作品もあります)
  • 定まったら以前のキャラクターのSeed値を使って呪文を調整して生成の繰り返し。いわゆるt2i「ガチャ」
  • やりすぎるとポーズが変になったり手が破綻したりすることもあるので適宜。
  • キャラクターのイメージにも合った定まったものが出たら、そこで高解像度化オプションで再生成。この時細かなパラメーターをちょっと変えて何回か動作の違いを見たり

と、女の子2人のイラストを出すのに合計101回画像生成しています。その後、

  • 手指など細かいところを微修正。手段が複数ありますがこの時は画像ソフトのAffinity Photo2でピクセル直接編集。
  • その後、以前作ったchibiの呪文で出るデフォルメされたちびキャラを添えたら面白いなと思いついて、画像ソフトのAffinity Designer2で透過PNGにして配置
  • キャラクターを象徴するファンタジー系エンブレムも別口で生成できていたので、記念に配置
  • 合いそうなフォントを選んで、トレカっぽく文字入れして、全体を何度も見直して、フィニッシュ。ちなみにフォントはGoogle Fontsからゲットしたものでという謎縛りでやってます。

という工程を経ています。それなりに手間は掛かっていますね。 このへんは

わかってない人「ChatGPTがあればプログラマーは滅びるってインフルエンサーが言ってた!(情弱ムーブ)」
→わかってる人「いやいやそんな単純な話じゃないんだよ」

という流れとだいたい同じで、AI"生成"イラストとは言っていても実際には人の手の工程はかなり入ります。 短い呪文で構図も特徴もバラバラなランダム美少女を出すだけなら割と簡単ですが、なんかシュッと呪文を与えるとAIがいい感じに出してくれて人間は何もしないし何も考えない...というニュアンスの「生成」とは全然違うわけです。

 ソフトウェアエンジニアリングの世界で「生成」(Generate)というと、完成品ではないクラスや関数のコードのひな型をコメント付きで出力するとかランダムなテストデータや鍵を生成するとか、最終形より前段階のものを作り出すイメージがなんとなくあるかと思いますが、若干近いかなと思います。
 ChatGPTもStable Diffusionも分類は「生成AI」(Generative AI)だし、Stable Diffusion Web UI で画像を生成するボタン文言は Generate で、拡張機能で日本語化すると「生成」になりますが、「生成」の意味が深いわけですね。

 アナログで絵を描いている絵師さんとか単にネットで騒ぎ立てる人との衝突で「AI絵師」という言葉はすたれて「AI術師」もしくは「AIイラスト術師」という住み分けた呼び名が定着しつつありますが、実際にクリエイトしている人たちの言葉を見ても様々な表現があって、「生成」「召喚」「錬成」「排出」「呼び出す」「創造」とかいろんな言葉を使っています。

 プロンプトを「呪文」と称するのはすっかり定着しました。入力パラメータ同士の微妙な組み合わせでかなり結果が違い、予測がつけられないところもあり試行錯誤が必要な面は、プログラミングはまたちょっと違うところもあります。「呪文」という呼び方は言いえて妙かなと思います。
 SFの世界ではかのアーサー・C・クラーク大先生の第三法則

「十分に発達した科学技術は、魔法と見分けがつかない」
Any sufficiently advanced technology is indistinguishable from magic.

がありますが、AIに呪文を与えて結果を得る画像生成AIについてはまさに魔法っぽいところもあります。

#AIイラスト トレカ見返りバージョン - iwasimanのイラスト - pixiv

 このちちぷいトレカは良い出来で楽しかったのでもう1セット作りました。
 誕生日お礼イラストでもケーキを持っているこの赤い髪の女の子はカエデ、もう一人のうさ耳の銀髪の女の子はエリアーヌ・ブランシェといいます。
 両者ともキャラクターとして名前や基本設定、想定口調などがもう定まっています。イラスト界隈でいう「うちの子」「オリキャラ」なわけです。2人で対比になるような設定にして、けも耳含め分かりやすい外見特徴を持たせているので、見る側にも複数の絵をまたいだ同一キャラクターだと認識できるかと思います。

 Stable Diffusionでは画像を生成すると毎回Seed値という9桁の乱数が発行されてPNGの中に埋めこまれます。入力の呪文や設定などパラメータをすべて同一にする+さらにSeed値を与えて生成すると、何度やっても前回と完全に同じ画像が生成できるという特徴を持っています。ここはエンジニアリングにおける関数型プログラミングの「参照透過性」や、サーバーレスなどでよく出てくる「冪等性」と通じていて面白いです。

 このSeed値を使うと、呪文が違った別の生成でもある程度は構図や似たキャラクターを出しやすく、テキスト→画像のt2iの「ガチャ」を何度か繰り返すと大体似た感じの人物でイラストが生成できるのでこの基本的な手法を使っています。

 つまりStable Diffusionは理屈としては「キャラクターのアイデンティティを認識してそのキャラクターの画像を生成している」のではなくて、「与えられた呪文などのパラメーター+内部の仕組みで持っているランダム性を加味した人物の画像を何パターンも生成して、その中にたまたよく似た別人がいる」のを抜き出して、「あたかも同一アイデンティティを持ったキャラクターであるかのように作品の中で見せかけている」わけですね。
このへんが3DモデルとかVTuberアバターを作る技術なんかとは仕組みが違って面白いです。

 この画像の連続性を保てない、同じキャラを召喚できないという問題は画像生成AIの課題だったのですが、世の中いろんなことを思いつく人がいます。

LoRA: Low Rank Adaptation。Stable Diffusionの拡張機能のような要素技術。既存モデルを追加学習させて画像を微調整できる。この要素技術の中でキャラクターの絵を機械学習モデルに追加学習させて、呪文のキーワードで召喚できるようになる。
 RPGの『原神』とかウマ娘の各キャラとか『チェンソーマン』のマキマさんとか、アニメの有名キャラとか、世の中のAIイラストで見つかる有名版権キャラはだいたいこれ。このLoRA用のモデルファイルを配布しているサイトがある。自作もできる。
 しかしインターネッツから入手した画像をもとになんでも追加学習してモデルを配布できるわけでもあり、作り手のモラルに依存していて著作権的にはグレーな面も。大手のpixivさんで問題になったのは、このLoRAを使って有名な絵師さんの画風を追加学習させてしまったというもの。

★ちちぷいの魔道図書館で公開されている、i2iの画像→画像を生成する技術を応用して、オリキャラの目のハイライトを他の絵にも適用する技術。

★キャラクターのイメージが定まっているなら画像ソフトで直接編集してイメージに近づける荒技ももちろんできる。

reference_only: 拡張機能ControlNetの中の1機能としてリリースされたもの。呪文で画像を生成する際のサブのインプットとして、指定された画像を参照だけしてキャラのスタイルだけを一部維持できる。2023/5月に登場し話題になった。

...などなど、猛烈な勢いでいろんな技術が次々登場しています。このへんはエンジニアリングの世界でのオープンソースの発展と似たところがあって面白いです。動画の中でAIイラストのキャラに瞬きをさせる、短時間だったら実験的に踊らせるみたいなのもツールが出ていましたね。
 特に同キャラ召喚はもっと手軽にできるようになるといいですね。そうすると本当にAIイラストで漫画が作れるようになるし、ラノベの挿絵とか動画の案内役とか使い道がどんどん広がる...!

#AIイラスト お祝いのお祭りへ - iwasimanのイラスト - pixiv

AIイラスト専門SNSでは最大手になったちちぷいさんも会員10万人を達成したので、記念イベントがありました。この祝10万人に寄せられたイラストは、ほんとにいろんな題材やアイデアがあって眺めるのも楽しかったです。
 上の絵はよく見ると手前の子のカエデの狐耳が描画されてなかったり、後ろの子のエリアーヌの耳のあたりの直接修正が雑だったり、そもそも呪文でfireworksと書いて空に花火を打ち上げたかったんだけど不発だったりするのですが、お祭りだから細かいことは(以下略)ということで投稿しちゃってます。案の定いいねをつけてくださる方はけっこういて、お祭り効果で総合デイリーランキングにも1日だけ入りました!

#AIイラスト 美麗風にお祝い - iwasimanのイラスト - pixiv

 もう一バージョンのこちらはLoRA:flat2という技術を使って書き込みを増やしたもの。ちょっと美麗調耽美調ファンタジー調になっています。
 AIさんが出してくれた元絵は手が変なところに出てきたり心霊写真になっているのですが、画像ソフトでまずいところを直接周囲の色をスポイトして塗りつぶして消す→Stable Diffusionが機能として持っている、画像を元に画像を出すi2iの工程を繰り返して馴染ませる というテクを使っています。

#女騎士 月桂樹の騎士 - iwasimanのイラスト - pixiv

僕の場合は欲求の根底に、むかーし活動していたTRPGの領域で創造してきたオリジナルキャラクターたちをイラストの中でもういちど具現化したいというものがあるのですが、ファンタジー世界のキャラも再現に成功しました。自分の中ではかなり嬉しい...!
 ちなみに鎧などのコスチュームは毎回それっぽいのは出せますが不安定で毎回細部が変わります。このへんは画像生成AIの原理上仕方ないですね。

 ファンタジー風の絵はけっこう人気のあるジャンルで、たとえば異種族のエルフ風の耳は elf ears という呪文にしなくて単に elf でも認識してくれます。
 面白いのはStable Diffusionはじめ画像生成AIが認識してくれる呪文は全部英語なんですが、二次元絵で英語圏にも認識されている日本語は認識してくれるんですね。jitome (ジト目)、ahoge (アホ毛)、tsundere(ツンデレ)、zettai ryouiki (絶対領域) なんかはローマ字そのままです。着物を出すのに kimono 以外に sushi も効くなんて情報もありました。
 世の中にはジト目の女の子に睨まれるのがご褒美だという趣向の方も一定の割合でいて二次元イラストにも人気の題材なので、朗報ですね...自分も作ってみました。










#AIイラスト 不機嫌な半エルフの魔術師 - iwasimanのイラスト - pixiv

ジト目のツンデレエルフ美少女とか姫エルフで検証すると思うじゃろ?
フフフだが男だ。 ワイのTRPGオリキャラの絵で落胆するがよい ( ^ω^)

モデル等で差異もあり、男性のイラストを追求している術師の方ももちろんいて、Twitterには #AI男子部 #AIイケメン部 というハッシュタグもあったりします。
でも一般的にはすぐ召喚できる可愛い女の子に比べると成年男性はなかなか難しいですね...世の中の二次元イラストの題材の分布が、AIイラストにもそのまま反映されています。かわいいは正義なんじゃ...!

#AIイラスト 誕生日リアクションお礼 - iwasimanのイラスト - pixiv

 誕生日リアクション感謝に投下したこの絵は、オリキャラのカエデが和風メイドに扮して若干照れながらケーキを持っているという按配のシチュエーションです。これもAIさん生成そのままではなくて、AI生成だと時々弱いことのある目をいじって光彩をはっきりさせ、光の反射のハイライトを強化しています。(拡大すると分かっちゃうかもですね)
 これは後から学んだテクなのですが、やるとやらないではキャラクターの目ぢからが全然違うんですよね....! 人物の目ってすごく大事なのが分かりました。こういう、アナログイラストとAIイラストとで共通のテクニックもあったりするのが奥深い。

 生成後の画像ソフトでの編集はやらず、AI生成したものにこだわるというスタイルの術師さんもいます。それにしたって関連ツールや拡張機能の利用、画像から画像を再生成するi2iを通すなどテクニックは各種あります。
 そもそもイラスト本体にしたって各種入力パラメーターと呪文の無限の組み合わせ、キャラクターの創造の技術や設定、服装や髪形や造形、配色、構図、テーマ、センス、世界観、イマジネーションと妄想のちから、構成要素はたくさんあるわけです。

 AI"生成"とは言うけれど実際には人間が担当する部分はかなり広く、これはもう新しい表現形態だしアートの新世界だなあと思っています。

それでは~

 6月はもう片方の親知らずも抜歯するというハードイベントがあるのですが、なんとかサバイブできるようがんばるます....そういえば『SPYxFAMILY』の最新刊まだ買ってなかった...

じぶん Release Notes 6月でした