Midjourney

Midjourneyが画像からテキストプロンプトを生成する『/describe』コマンドをリリース

Published

1年 ago

2023年4月5日

AITODAY編集部

Midjourneyから/describeコマンドがリリースされ話題になっている。

Midjourneyは画像生成AIとして知られ、今までは『富士山の絵を書いて』と指示をすれば『富士山の絵を生成してくれる』という使い方が主であった。

ところが/describeコマンドの登場により、逆方向の情報取得が可能になってしまった。

実際の画面を見せながら、具体的な例を挙げていく。

富士山の写真で実験してみる

midjourney

こちらはenvatoというサイトからダウンロードした富士山の写真。

discordの画面から、/describe を入力するとファイル添付可能になる。

画像からテキストプロンプト

ドラッグ&ドロップで富士山の写真を挿入し、少し待っていると以下のように①〜④のテキストプロンプトが生成される。

画像からテキストプロンプト

1️⃣ the snowy mountain of fuji is above the trees, in the style of tokina opera 50mm f/1.4 ff, hdr, 32k uhd, polished craftsmanship, suburban ennui capturer, multilayered texture, intense shadows –ar 362:211
2️⃣ a snow covered mount fuji from a city, in the style of nikon d850, topographical views, topographical views, wide angle lens, hdr, tokina opera 50mm f/1.4 ff, smooth and curved lines –ar 362:211
3️⃣ the snow-covered mount fuji from the mountaintop, in the style of nikon d850, kabuki theater, smooth and curved lines, hdr, canon eos 5d mark iv, 32k uhd, suburban ennui capturer –ar 362:211
4️⃣ an image of mount fuji, in the style of nikon d850, multilayered texture, carl zeiss distagon t* 15mm f/2.8 ze, suburban ennui capturer, realistic blue skies, light white and gray, rollei prego 90 –ar 362:211

雪に覆われた山、木など大まかな部分は完全にクリアしている事がわかる。

そして①〜④のどれかを選ぶと、そのプロンプト通りの画像を生成してくれるという流れになっている。

試しに①を選択してみよう。

画像からテキストプロンプト

構図などはかなり元の写真に近しい画像が抽出された。

少し彩度が落ち着きすぎている上に、加工感が否めないので少しだけ指示を加えてみる。

midjourney5

それなりに元画像には近づいたのではないだろうか。

「彩度をもっと上げて」「もう少し富士山の占める割合を高めて、木々は枝にして」など、さらに指示を細かくすれば、元画像により近づける事は可能だが、今回はおおまかな流れの説明になる。

テキストプロンプトのハードルが下がった

富士山というわかりやすい題材を元にしたが、この精度が高まってくれば「テキストプロンプトが思い浮かばない」という人でも、模倣したい画像さえあれば誰でも画像生成の技術が上がるという事だ。

過去の記事ではテキストプロンプトを売買するサービス『PromptBase』を紹介したが、これらをうまく組み合わせればプロンプトの売買を副業にする人も増えてきそうだ。

それにしてもあまりにもスピードが速い。

つい先日Midjourney5のクオリティで盛り上がっていたのに、ここにきて新たなコマンドリリースときている。6の登場もすぐとの噂も既にあるくらいだ。

いまだにMidjourneyを触った事がないという人も、そろそろ一度は試さないとこの流れに追いつけなくなってしまうかもしれない。

AI TODAY

Midjourneyが画像からテキストプロンプトを生成する『/describe』コマンドをリリース

Midjourney

Midjourneyが画像からテキストプロンプトを生成する『/describe』コマンドをリリース

富士山の写真で実験してみる

テキストプロンプトのハードルが下がった

静止画像を簡単にアニメーションさせる『Animated Drawings』がすごい

『人間がAIに恋をする』そんな時代がついに現実味を帯びてきた

写真をアニメーション化できるAIツール『My Heritage AI』

静止画像をビデオアニメーションに変換するAIツール『Leiapix Converter』

写真修復ツール「restorePhotos.io」でぼんやり写真を鮮明に

長尺YouTube動画の要約が一瞬で可能に。AIツール『Summarize.tech』

GPT-5の登場でAIは人間を超えるのか

動画生成AIツール『Fliki』顔出し無しYouTube動画が”一瞬”で作れる

ChatGPTに英語を音読させれば、英会話の練習が可能に