知る
採用の画像生成AIモデルについて
現在、各社の生成AIモデルの進展は目まぐるしい状況です。
最新生成AIモデルについて、BringRitera(リテラ)には取り込んでいても、本ページへの反映ができていない場合があることをご了承ください。
どの生成AIモデルが良いかは、プロンプトの内容によっても変わります。思うような内容とならなかったときに、他のモデルを試すと良い結果が得られることもあります。
提供元 | AIモデル名 | 概要 | その他特徴の当社見解 |
---|---|---|---|
Black Forest Labs | FLUX1.1 [pro] Ultra/Raw | Black Forest Labは元Stable Diffusion開発者らが設立し、FLUXを2024年8月にリリース。 [pro] Ultraは同年11月にリリースされた最高性能モデル。 | FLUX.1.1 [pro]と比べて高解像度で、実写風のスタイルの場合によりリアルに描く。 しかし現状それほど差が感じられず、コストパフォーマンス的にFLUX1.1 [pro]が推奨。 |
FLUX1.1 [pro] | 最近までFLUXの最高性能モデルであった。 | 現時点で、最も推奨できるモデル。 実写風を描かせたときのリアリティが強く感じられる。 | |
FLUX.1 [dev] | [pro]よりも高速で、FLUXの3つのモデルの中の中間に位置するモデル。 | 生成スピードにおいて当初は[pro]との差が大きかったが、FLUX1.1 [pro]のリリースにより差が感じられなくなった。 品質は若干[pro]より落ちるものの、[pro]と[dev]では表現にも違いがあるため、多様性を求めて両方を使い分けるという選択もある。 | |
FLUX.1 [schnell] | FLUXのモデルの中で最も高速で、廉価版。 | FLUXの中では品質が落ちるとされているが、それほど差を感じないことも多く、十分使い道はあると感じるモデル。 | |
Stablity AI | Stable Image Ultra | OpenAIテキスト生成AIの中で、ほとんどのタスクに最適とされているモデル。 | Stability AI社のモデルはアーティスティックな画像の生成に長けていると感じられる。 FLUXのモデルはアーティスティックな画像の生成が苦手のため、アーティスティックな画像を生成する際はStability AIのモデル利用を推奨。 2024年10月22日、Stable Diffusionシリーズの3.5が登場したが、実装テストの結果、3のほうが品質が高いと判断し、当ツールへの反映を見送っている状況。 |
Stable Image Core | GPT-4oよりも時間がかかるが、高度な推論を可能としているモデル。 言語能力はGPT-4oより劣る。 | ||
Stable Diffusion 3 Large | Stable Image Ultraよりも高速で、かつ高品質なモデル。 | ||
Stable Diffusion 3 Large Turbo | Stable Diffusion 3 Largeをより高速にしたモデル。 | ||
Stable Diffusion 3 Medium | Stable Diffusionシリーズの廉価版。 | ||
OpenAI | DALL-E 3 | ChatGPTを開発するOpenAI社による画像生成AI。 | DALL-E 3の生成する画像は、それと分かる特徴がある。例えば「ITをイメージさせるような画像を生成して」のような抽象度の高いプロンプトによる画像の生成に向いている。 リアリティさにおいてFLUXなどと比べると見劣りするが、プロンプトの理解度が高い。 ただ他社モデルがバージョンアップを繰り返しており、その差も感じづらくなっている。 DALL-E 3のリリース日が2023年9月21日のため、新しいバージョンの登場が待たれる状況。 |
* 記載された商品・サービス名は各社の商標または登録商標です。