Midjourneyから/describeコマンドがリリースされ話題になっている。
Midjourneyは画像生成AIとして知られ、今までは『富士山の絵を書いて』と指示をすれば『富士山の絵を生成してくれる』という使い方が主であった。
ところが/describeコマンドの登場により、逆方向の情報取得が可能になってしまった。
実際の画面を見せながら、具体的な例を挙げていく。
富士山の写真で実験してみる
こちらはenvatoというサイトからダウンロードした富士山の写真。
discordの画面から、/describe を入力するとファイル添付可能になる。
ドラッグ&ドロップで富士山の写真を挿入し、少し待っていると以下のように①〜④のテキストプロンプトが生成される。
1️⃣ the snowy mountain of fuji is above the trees, in the style of tokina opera 50mm f/1.4 ff, hdr, 32k uhd, polished craftsmanship, suburban ennui capturer, multilayered texture, intense shadows –ar 362:211
2️⃣ a snow covered mount fuji from a city, in the style of nikon d850, topographical views, topographical views, wide angle lens, hdr, tokina opera 50mm f/1.4 ff, smooth and curved lines –ar 362:211
3️⃣ the snow-covered mount fuji from the mountaintop, in the style of nikon d850, kabuki theater, smooth and curved lines, hdr, canon eos 5d mark iv, 32k uhd, suburban ennui capturer –ar 362:211
4️⃣ an image of mount fuji, in the style of nikon d850, multilayered texture, carl zeiss distagon t* 15mm f/2.8 ze, suburban ennui capturer, realistic blue skies, light white and gray, rollei prego 90 –ar 362:211
雪に覆われた山、木など大まかな部分は完全にクリアしている事がわかる。
そして①〜④のどれかを選ぶと、そのプロンプト通りの画像を生成してくれるという流れになっている。
試しに①を選択してみよう。
構図などはかなり元の写真に近しい画像が抽出された。
少し彩度が落ち着きすぎている上に、加工感が否めないので少しだけ指示を加えてみる。
それなりに元画像には近づいたのではないだろうか。
「彩度をもっと上げて」「もう少し富士山の占める割合を高めて、木々は枝にして」など、さらに指示を細かくすれば、元画像により近づける事は可能だが、今回はおおまかな流れの説明になる。
テキストプロンプトのハードルが下がった
富士山というわかりやすい題材を元にしたが、この精度が高まってくれば「テキストプロンプトが思い浮かばない」という人でも、模倣したい画像さえあれば誰でも画像生成の技術が上がるという事だ。
過去の記事ではテキストプロンプトを売買するサービス『PromptBase』を紹介したが、これらをうまく組み合わせればプロンプトの売買を副業にする人も増えてきそうだ。
それにしてもあまりにもスピードが速い。
つい先日Midjourney5のクオリティで盛り上がっていたのに、ここにきて新たなコマンドリリースときている。6の登場もすぐとの噂も既にあるくらいだ。
いまだにMidjourneyを触った事がないという人も、そろそろ一度は試さないとこの流れに追いつけなくなってしまうかもしれない。