
Midjourneyとは?
https://www.midjourney.com/
『Midjourney』は、AIを活用してテキストから画像を生成する、サービス名・生成AIモデル名です。Discordのチャットボットとし て提供されており、サーバー上でプロンプト(画像生成のための指示文)を送信するだけで、誰でも簡単に利用可能です。膨大な学習データをもとに、ユーザーの指示に沿ってリアルタイムで画像を生成できる点が大きな特徴となっています。
Midjourneyは米国フロリダ出身のデイヴィッド・ホルツ氏が創設し、小さな民間研究所として開発したサービスですが、画像生成AIとして世界でもトップクラスの知名度を誇っています。
Google トレンド
上の画像は、世界市場における2022年3月からの、有名画像生成AIサービスの検索人気度合いを示したGoogleトレンドのグラフです。Midjourneyと比較している対象は、「Stable Diffusion」「DALL-E」「Bing Image Creator」「Adobe Firefly」です。2023年10月にMicrosoftがBing Image Creator(グラフ緑色線)のリリースを発表してから検索動向は大きく変わっていますが、それまでは、常にMidjourney(グラフの青色線)がトップクラスの注目度を集めていたことがわかります。
Google トレンド
なお、日本国内では状況が異なり、Stable Diffusion(グラフ赤色線)の注目度のほうが高いようです。Stable Diffusionは日本語化の拡張機能があることや、日本特化モデル「Japanese Stable Diffusion XL」がリリースされているなど、日本人にとって使いやすいサービスが多いことが要因であるとも考えられます。
しかし、自身のPC上に環境構築が必要なStable Diffusionとは異なり、MidjourneyはDiscord上で画像を生成できる手軽さがメリットの1つです。そのため、国内でもアートやインテリアデザインなどのクリエイティブな領域において幅広く利用されているのです。
Midjourneyの特徴と利点
Midjourneyの大きな特徴は、商用利用可能な高品質画像生成が可能な点です。現状無料プランはなく、利用には有料プランへの加入が必要ですが、そのぶんディテールまでリアルに再現された写真のようなクオリティの画像から、絵画調のアート作品まで、幅広いスタイルのビジュアルを作り出せます。また、プロンプトに指定した内容を理解し、意図に沿った画像を生成してくれるため、ユーザーの発想を形にしやすいというメリットがあります。
利用開始のハードルが低いこともMidjourneyの魅力の1つです。専用のアプリをインストールする必要がなく、Discordサーバー上ですぐに利用を開始できます。Discord自体は無料のアプリで、デスクトップ版やモバイル版、Web版とクラスプラットフォーム対応のため気軽に導入できます。また、2024年2月にMidjourneyの公式Webサイトから利用できる「Midjourney alpha」がリリースされました。現状1,000枚以上の画像を生成しなければ利用できないようですが、普段からMidjourneyを使っているユーザーにとってはより利便性が高まるかもしれません。
Midjourneyは1つのプロンプトで4枚の画像の生成が可能なため、イラスト制作のアイデア出しや資料作成におけるビジュアル面の充実など、クリエイティブな作業の効率化が期待できるサービスです。だたし日本語では高品質な画像を生成しにくいため、基本的にプロンプトは英語で入力する必要がある点は覚えておきましょう。
Midjourney「v5.2」と「v6」の違いについて
Midjourneyのバージョンは定期的に更新されています。これまでv5系統がデフォルトのバージョンとして、2023年6月にリリースされたv5.2が最新でしたが、2023年12月にアルファ版として「v6」がリリースされました。その後2024年2月14日から、v6が デフォルトモデルとなっています。
v6はv5.2と比較し以下のようなポイントが変わりました。
画像の解像度と細部の表現力が向上
テキストを含む画像の生成精度が向上
2種類のアップスケール機能追加で細かな改善にも対応
同じキャラクターを一貫性のある見た目で生成可能
基本的には、v6のバージョンアップで、より写実的で鮮明な画像が得られるようになります。また、上述している通り、画像生成時には難しかったテキスト入れの精度が上がっています。さらに、画像を微調整する「Upscale(Subtle)」「Upscale(Creative)」の2種類のアップスケール機能が追加されたことで、望んだ方向へ画像を改善しやすくなっています。加えて、v6で新たに導入されたcref機能(キャラクターリファレンス)により、同じキャラクターを一貫性のある見た目で生成できるようになりました。
総じて、Midjourney v6はv5.2と比べてかなり進化しており、より高品質で意図通りの画像生成が可能になったと言えます。
現在はv6がデフォルトモデルとなったため、特別なプロンプトも不要でv6が使えるようになっています。確認したい場合は、Discord上で「/settings」と入力し、Use the default model(V6)となっていることが確認できるはずです。もしそのようになっていない場合や、違うバージョンを使用したい場合は、表示されるプルダウンメニューからバージョンを選択することで利用可能になります。
Midjourneyの始め方
Midjourneyを始めるには、いくつかの手順を踏む必要があります。ここでは以下のステップにわけて解説します。
Discordの登録
Discordサーバーへ登録
有料プランに登録
Discordの登録
Midjourneyを利用するには、まずDiscordのアカウント登録が必要です。Discordの公式サイトにアクセスし、メールアドレスとパスワードを入力して新規登録しましょう。登録が完了したら、Discordアプリをダウンロードしてイン ストールします。Discordアプリを起動し、先ほど登録したアカウント情報でログインしてください。これでDiscordの準備は完了です。なお、登録方法はDiscordの公式サイトでも解説されています。
Discordサーバーへ登録
Discordにログインしたら、次はMidjourneyの公式Discordサーバーに参加します。Midjourneyの公式Webサイトにアクセスし、下部「Contact」にある「join our Discord」というリンクをクリックしてください。自動的にDiscordアプリが起動し、Midjourneyのサーバーへの参加リクエストが送信されます。参加リクエストが承認されると、MidjourneyのDiscordサーバーにアクセスできるようになります。
有料プランに登録
画像を生成するには、有料プランに加入する必要があります。MidjourneyのAccountページに入り、認証済みのDiscord アカウントを使用してサインインしたらプランを選択しましょう。支払い情 報を入力し、登録を完了させます。有料プランに登録することで、Midjourneyの高品質な画像生成機能が使えるようになります。
なお、有料プランに加入せずとも、サーバー内でプロンプト入力・送信は可能です。しかし、有料プラン未加入の場合、生成プロンプトを送信しても以下画像のように「プラン加入が必要」とメッセージが返ってきます。
Subscribeボタンをクリックすると、Midjourneyからダイレクトメッセージが送られ、その中で利用規約の同意ボタンや有料プラン加入ページへのリンクが示されます。
上画像のように、メッセージ内にあるリンク先からも登録できます。
Midjourneyの使い方
ここでは、Midjourneyを使うための流れを解説します。初めての方でも理解できるよう、基本的なポイントに絞ってご紹介します。
チャットルームに参加/作成
プロンプトを生成して画像生成
選択肢から画像を選択
Upscaleで解像度を選択
チャットルームに参加
Midjourneyでは、画像生成のためのチャットルームが用意されています。「NEWCOMER ROOMS #」の中にある「newbies-##」などの名前がついたチャンネルを開いてください。なお、newbiesは新規参加者や初心者を意味するため、使い始めの段階ではこちらのチャンネルに参加するとよいでしょう。
画像の生成作業は、このチャンネル内でMidJourney Botとチャット形式で進めることになります。自分の送信したメッセージが表示されることはなく、MidJourney Botからの返信のみ表示されます。ほかのユーザーと共同で使うことになるため、始めは慣れるまで時間がかかるかもしれませんが、他人が生成する画像やプロンプトを参考にすることもできるため、上手なプロンプトを見つけて勉強するのもよいでしょう。
プロンプトを生成して画像生成
チャットルームに参加したら、画像生成のためのプロンプトを入力します。プロンプトは、生成したい画像の内容を説明する文章のことです。
画像を生成するには、メッセージフィールドに「/imagine」と入力します。そうすると、/imagineの後に「prompt」と表示され、以降の指示が入力できるようになります。「/」だけ入力すると、使用可能なコマンドリストがポップアップ表示されるため、そちらからコマンドを選択することも可能です。
/imagine prompt: A cat sitting on a couch
プロンプトは英語のほうが良い結果が得られるため、たとえば「ソファに座っている猫」の画像を生成したければ「/imagine prompt: A cat sitting on a couch」などと入力します。
また、プロンプトには画像URLや複数のテキストフレーズ、パラメータなど複数の要素を含められます。
https://docs.midjourney.com/docs/prompts-2
なるべくシンプルに、対象物やスタイル、雰囲気などを組み合わせることで、さまざまなイメージの生成が可能です。重要なポイントは、イメージしたいものを明確に指定することです。プロンプトを送信すると、Midjourneyが自動的に画像の生成を開始します。処理が完了すると、複数の画像選択肢が表示されます。
Vボタン(Variation)で画像を再生成
プロンプトに沿った画像は、グリッド上に4パターン生成されます。また、画像生成とあわせて画像下に2行にわかれたボタンが表示されます。
V1ボタンによるバリエーションの作成
それぞれの画像は、左上が1・右上が2・左下が3・右下が4と番号が振られており、画像下のV1・V2・V3・V4のボタンから対応した番号の画像を選択することで、選択画像をベースに、似ている新しい画像を再生成することが可能です。なお、横にあるRefreshボタンをクリックすると、同じプロンプトで画像を再生成できます。
Uボタン(Upscale)で画像を選択
U1ボタンによる画像の選択
Uボタンは、前バージョンでは画像をアップスケールするために使用されていました。しかし最新モデルでは、デフォルトで1,024 x 1,024ピクセルの画像が出力されるようになっています。そのため、U1〜U4のボタンは、該当画像を個別にピックアップするためのボタンとして使います。
選択した画像のカスタマイズ
画像を1枚に絞り込むと、カスタマイズメニューが表示されます。
Upscale (Creative)
Upscale (Subtle)
Upscale (Subtle)による画像の高解像度化
Upscaleでは画像サイズを拡大できます。Upscale (Subtle)オプションを使用すると、画像のサイズが 2 倍になります。Upscale (Creative)も画像サイズが 2 倍になるのに加え、画像に新しい詳細が追加されます。
Vary (Strong)
Vary (Subtle)
Vary (Region)
Vary (Strong)による画像の調整
Varyは、選択した画像内の構成や要素数、色など変更した新しい画像が作成されます。Vary (Strong)は強めに変化し、Vary (Subtle)は軽微な変更が加わります。Vary (Region)は、画像内の特定部分を選択できるようになり、選択した箇所のみ再生成を加えることが可能です。
Zoom Out 2x
Zoom Out 1.5x
Custom Zoom
Zoom out 2xで被写体から離れる
Zoomは元の画像の内容を変更せずに、キャンバスの元の境界を拡張します。新しく拡張されたキャンバスは、プロンプトと元の画像のガイダンスを使用して入力されます。
←
→
↑
↓
パンボタンで左に視点を移動
パンボタンを使用すると、元の画像の内容を変更せずに、画像のキャンバスを選択した方向に拡張できます。
Favorite
Web
ハートマークのFavoriteを選択すると、画像にタグをつけてMidjourney Webサイトで簡単に見つけられるようになります。Webを選択するとMidjourney.comのギャラリーで画像を開けます。
画像を保存する
納得のいく画像が作成できたら、画像をクリックしてフルサイズで開いてください。左下に「ブラウザで開く」が表示されるためクリックし、ブラウザで開いたら右クリックで名前をつけて保存しましょう。なお、自分で生成した画像はMidjourneyのMy Imageからも確認できるようになります。
Midjourneyのコマンド一覧
「コマンド」はMidjourneyにおける大枠の指示出しの役割で、すべてのプロンプトはコマンドから入力することになります。コマンドによっては、デフォルト設定の変更やユーザー情報の確認、その他の便利なタスクが実行できます。上述した画像生成に必要な「/imagine」もコマンドの1つです。
Midjourneyのパラメータ一覧
プロンプトのパラメータは、画像の生成方法に影響を与えます。パラメータによって、画像のアスペクト比やUpscalerなど細かい要素まで調整できるため、より精度の高い画像を生成するには必要となるテクニックと言え ます。パラメータは「「/imagine prompt: A cat sitting on a couch --chaos 100」といったように、テキストプロンプトの後ろに指定します。
2024年3月に追加された新機能crefとsrefとは?
2024年3月に、新たなパラメータとして「cref」と「sref」が追加されました。それぞれ便利な機能ですので、詳しく解説します。
同じ顔の同一人物を複数回生成できるcref
crefは「キャラクターリファレンス」の略で、同じ顔の人物を複数回生成するためのパラメータです。
--cref url
crefの基本プロンプトは、「--cref」の後ろに参照画像のURLを記述するだけです。
--cref url --cw 50
また、「--cw」で数値を指定することで、参照強度を「0〜100」の間で指定できます。デフォルトは「100」で、値が大きいほど参照強度が高まります。
作風を参考画像と統一できるsref
selfは画風を統一する際に使えるパラメータです。
--sref url
具体的には上記例のように、パラメータの後ろに指定画像のURLを入力します。「--sw 1000」と後ろに指定することで、1〜1,000までの数値で参照強度を指定できます。
--sref urlA::1 urlB::2 urlC::3
また、上記のようにURLはスペースを空けて3つまで参照可能です。与える情報は「urlA::2 urlB::3」といったように、URL後ろに「::数値」とつけて参照割合度合いの調整もできます。
Midjourneyの料金プランについて
Midjourneyには4つの料金プランが用意されています。その中で、月額プランか年間プラン(20%割引)を選択することになります。
Midjourneyのデフォルト設定は、Fast GPU Time(高速GPU時間)と呼ばれる高速生成の技術を使用して画像生成します。例えばFast GPU Timeが15時間あるStandard Planで、生成時間30秒の画像を作り続けた場合、月間で1,800枚の画像生成ができるということです。この時間が不足するとリラックスモードと呼ばれる状態になり、待ち時間が発生します。また、リラックスモードで生成する場合は、サーバーの混雑具合に応じて生成に0〜10分かかるようになります。
Basic Planは個人的な利用や小規模なプロジェクトに適しており、Midjourneyを試してみたい初心者に最適です。ただ、リラックスモードはありませんので、Fast GPU Timeを使い切ったら、当月の画像生成はできなくなります。
Standard Planは月額$30で、無制限のRelax GPU Timeが含まれるため、低速モードで問題なければ画像生成枚数の上限はなくなります。より本格的にMidjourneyを使用したい個人や小規模ビジネスに適していると言えるでしょう。
Pro Planは30時間のFast GPU Timeに加え、ステルスモード機能の利用が可能です。このプランは、高頻度 でMidjourneyを使用し、効率的に作業したい中規模のビジネスユーザーなどに最適と言えます。また、Pro以上だとステルスモードが使用できるようになります。ステルスモードは「/stealth」と入力することで有効化でき、有効化すると自身の作品やプロンプトが外部公開されないようになります。
Mega Planはもっとも高額なプランで、月額$120、年払いでは月$96です。60時間のFast GPU Timeを提供し、最大の同時実行ジョブ数と最高のパフォーマンスを誇ります。大規模なプロジェクトや、商用での大量の画像生成を必要とする大企業に適しています。なお、年間100万ドル以上の収入がある企業の場合は、有料プランの中でも「Pro Plan」または「Mega Plan」への加入が必要です。
なお、料金詳細はMidjourney Subscription Plansのペー ジからも確認できます。
無料版は使えなくなった
Midjourneyは以前まで無料プランがありました。無料プランでも25回まで画像生成が可能でしたが、2023年の3月28日に利用停止が公式から発表されて以降、有料プランのみの提供となっています。
現時点で無料プラン再開のアナウンスもありませんので、基本的に有料サービスとして認識しておきましょう。
Midjourneyと著作権の関係性
基本的にMidjourneyで生成された画像に著作権はありません。そのため、作成された画像は、他の人が再利用・改変・保存することを認めています。しかし、AIは元データがあって初めて学習できることから、Midjourneyが学習データとして使用した画像データの中には、「著作権があるものを利用しているのでは?」といった疑問を持たれることも少なくありません。実際にアメリカでは、複数のアーティストがStable DiffusionやMidjourneyに対して集団訴訟をした事例があります。
なお、Midjourneyの利用規約には、以下のように示されています。
You are responsible for Your use of the service. If You harm someone else or get into a dispute with someone else, we will not be involved.(お客様は、本サービスの利用に責任を負うものとします。お客様が他者に危害を加えたり、他者と紛争を起こしたりした場合、当社は関与しません。)
https://docs.midjourney.com/docs/terms-of-service
We respect the intellectual property rights of others. If you believe that material located on or linked to by the Services violates your copyright or trademark, please send a notice of claimed infringement to takedown@midjourney.com with the subject “Takedown Request,” and include the following(私たちは他者の知的財産権を尊重します。本サービス上にある、または本サービスによってリンクされている素材が、お客様の著作権または商標を侵害していると思われる場合は、「削除リクエスト」という件名で、以下の内容を含めた侵害申し立ての通知を takedown@midjourney.com に送信してください。)
https://docs.midjourney.com/docs/terms-of-service
Midjourneyとしては、著作権に関連するトラブルは利用者の責任とし、削除申請があれば応じる、というスタンスのようです。実際に生成される画像に著作権がない以上、学習元データをどこまで遡るのかなど、著作権の範囲を定義することも難しいでしょう。そのため、生成された画像が「第三者から見ても明らかに著作権のある元データを連想できるような仕上がり」になっている場合、使用を控えることが賢明と言えます。
AIによる画像生成技術の発展と展望
AIによる画像生成技術は、近年目覚ましい発展を遂げています。MidjourneyやDALL-E、Stable Diffusionなど、テ キストから高品質な画像を生成できるツールが次々と登場しています。これらのツールは、大量の画像データを学習することで、ユーザーの指示に沿った画像を生成できるようになりました。
現在、AIによる画像生成は、イラストレーションやデザインの分野で活用され始めています。アイデア出しのためのラフスケッチの作成や、プレゼンテーション資料のビジュアル制作など、さまざまな場面で時間と手間を大幅に削減できる可能性があります。さらに、AIが生成した画像をベースに、人間がブラッシュアップを加えるといった、人とAIの協業も進んでいくでしょう。
今後、AIによる画像生成技術はさらに洗練され、より高度な表現力を持つようになると予想されます。一方で、著作権や肖像権など、法的な課題についても議論が必要です。AIが生成した画像の権利関係を明確にし、適切に運用していくための規則作りが求められています。
まとめ
この記事では、Midjourneyの特徴や利点などの概要や、始め方や使い方、料金プランや著作権に関する注意点など網羅的に解説しました。
Midjourneyは、「Text to image」の先駆け的なツールでありながら、高品質な画像生成能力で業界をリード し続けています。クリエイターの創造性を刺激し、作業効率を大幅に向上させる可能性を秘めています。これからの時代は、AIとの共存・共生は大きなテーマになってきますので、上手に付き合いながらクリエイティビティを存分に発揮していただければと思います。