●2023年、SNSはAIおっぱいで満ち満ちていた
2023年、SNSはAIおっぱいで満ち満ちていた。
実写とアニメの中間的な薄着の美少女が、タイムラインをジャックする。生成AIのStable Diffusionがブレイクし、実写寄りのAI美少女がネットを席巻した。それを忸怩たる思いで眺めていた。
描きたい、オレもAIおっぱい絵師になりたい!
そういうことではない。2022年に日本でmidjourneyが流行って以降、DreamやStable Diffusionなど、めぼしい生成AIは触ってきた。
ライターとして「言葉で絵が描ける」という触れ込みに強く惹かれた。しかし実際は「言葉で描く」とはあまりにほど遠い。
プロンプトエンジニアリングとはよくいったもので、英単語をカンマ区切りで羅列し、ときには数値をパラメーターとして付記し、それはもうまるでプログラミングだ。想像していた「言葉で描く」との違いに心が萎えた。

「突撃恋愛少女」を作りはじめるキッカケになった1枚。すべてを石膏像として描くことで、コンテンツポリシーの厳しいChatGPTでも幅のある表現が可能になった。(クリックで拡大) |
 |

ハートに取り込まれ、ともにひび割れる少女像。個人主義と全体主義の相克を、このひび割れた像で表現した。(クリックで拡大) |

「文学部の部長は魔法少女」という設定で描いた。中心から周辺まで、均一なディテールを保つところがいかにもAIっぽい。(クリックで拡大) |
 |

画集に「High-Speed Hearts」というタイトルで載せた作品。恋の高まりとスケートボードのスピード感をかけているのだが、そのわりにのんびりした仕上がりが気に入っている。(クリックで拡大) |
●転機は2023年秋に訪れる
2023年秋、ChatGPTが日本語の自然言語による画像生成に対応した。普段の書き言葉や話し言葉で指示を出すと、画像を生成してくれる。呪文と呼ばれる英単語の羅列ではない。自然言語だ。
「アジアンビューティーな美少女。まんま実写ではなく、少しアニメテイストも入れつつ。水着の上から着たTシャツが濡れて肌に貼りつき、でもそんなことは気にもせずに大きな水鉄砲でこちらに向けてブシャーって撃ってくる、そんな美少女を描いてください」と、プロのライターとしてありえない言語センスで綴った日本語でも、いい感じにAI薄着美女を描いてくれるのだ。
実際にはこの手のリクエストだとChatGPTのコンテンツポリシーに抵触してうまく生成できない。しかし、自然言語である。コンテンツポリシーのギリギリのラインをChatGPTから聞き出し、なだめ、おだて、拝み倒して描いてもらうのだ。
自然言語、最強である。
AIおっぱいトレーニングを経て、分かったことがある。ChatGPTの言語リテラシーはきわめて高い。描いてほしいものを端的に指示するのではなく、世界観や登場人物の内面を理解させたうえで、それらを画像に反映できる。
たとえば「少女は悲しげな表情を浮かべている」という指示よりも、「お弁当を忘れてしまったが、一食抜けばダイエットになる、と悲しみのなかで自分に言い聞かせている」と背景を追加したほうが表情豊かに描ける。かすかな眉の下がり方、指先のちょっとした仕草。細部に積み上げた表現が宿る。言葉で、描くのだ。

2024年10月に出版したAIアートブック「突撃恋愛少女」。書籍というフォーマットでアート作品を作るというコンセプトで、細部にわたってこだわりをもって制作した。(クリックで拡大) |
 |

先のスケボー少女を、最新のChatGPT-4oでリライトしたもの。言葉の“通り”がよくなり、従来よりも細かい指示が可能になった。2025年版「突撃恋愛少女」を作ってみたい。(クリックで拡大) |
●言葉でAI表現を仕上げていく
こうした試行錯誤を経てたどり着いたのが、「突撃恋愛少女」というAIアート作品だ。2024年4月に個展で公開し、同年10月に画集にまとめた。
「人も物もすべて石膏でできている」という世界観を筆頭に、各シーンの設定、大元となる「個と群像」という作品コンセプトなど、さまざまな情報をChatGPTに理解させ、そのうえで画像生成していく。その結果、巷にあふれるAIおっぱいとは一線を画した作風に仕上がったと考えている。
本作は2024年の初頭、約2カ月かけて制作した。当時のChatGPT-4(およびChatGPT-4o)は、ユーザーの自然言語を内部的にプロンプトに書き換え、それをDALL-E3という生成AIに受け渡していた。
自然言語をそのまま画像に変換するのではなく、midjourneyやStable Diffusionと同様、内部的にはプロンプトベースの画像生成だ。ただ、プロンプトの変換や画像生成工程はユーザーには見えないので、自然言語がそのまま画像に変換されるように見える。
そうした言葉と画像生成の関係は現在も変わりないが、2025年3月にChatGPT-4oが大幅にアップデートされ、言葉の“通り”がよくなった。言葉がこれまで以上に画像に反映され、要は「言うことを聞いてくれる」ようになったのだ。
このアップデートは画像生成の内製化が大きなトピックだった。従来はDALL-E3に画像生成を外注していたが、アップデートによってChatGPT-4o内で生成できるようになった。ただ、内製したからといって言葉の通りがよくなるわけではない。このアップデートに合わせ、ChatGPT-4oの言語リテラシーも大幅に向上しているという。言葉のニュアンスが伝わりやすくなり、抽象的および概念的な話も画像に反映可能だ。言葉をこれまで以上にうまく橋渡ししてくれるようになった。
このアップデートを機に、「突撃恋愛少女」のリライトを試している。
元画となる「突撃恋愛少女」は石膏でできた女子高生のモノクロ画像だ。これをカラー化する。もちろんただ着色するのではなく、作品テーマを踏まえて再構築するのだ。言葉の通りがいいぶん、細部にわたって指示が出せる。
といっても、具体的な細かい指示を出すわけではない。「背景を日本画っぽく仕上げたいんだけど、何かいい案ないかな」とか、「グラビアアイドルみたいにキメた感じのポーズにして」とか、ChatGPTの言語リテラシーに頼りながら作業する。ここにAIで表現する奥深さがあると思う。
最近は画像のみならず、音楽や動画も言葉で生成できる。AIによって生まれた、言葉を異なる表現へ置き換える動き。創造のために個々のスキルを習得するのではなく、誰もが使い慣れた言葉を使う。感じたことの言語化は容易ではないが、それでも言葉という今あえて新鮮な表現ツールを、僕らは無視できないだろう。

sunoという音楽生成AIを使い、アナログレコードを作ってみた。原作小説を自筆し、それを元にAIで歌詞と楽曲を生成。これもアート作品という位置づけで、付属の冊子にステートメントが記してある。(クリックで再生) |
 |

動画生成AIのSora、音楽生成AIのsunoを使い、AIミュージックビデオを制作した。先のレコードと同様、原作小説を元にAIで歌詞、楽曲、映像を生成した。(クリックで拡大)
Dystopia Old Lens Orchestra |
次回のコラムは三宅章介さんの予定です。
(2025年5月13日更新) |