
Stable Diffusion
Stable Diffusionは、 Stability AIが開発した、高品質の画像を生成するための高度な AI 画像モデルです。2022 年にリリースされたこのモデルは、 潜在拡散と呼ばれる手法を利用しており、生成モデリングと拡散プロセスを組み合わせて、現実世界のビジュアルに近い画像を作成します。Pollo Pollo AIでStable Diffusion をお試しください。
Stable DiffusionAIの主な特徴
- テキストから画像への生成:テキストプロンプトを一貫性があり視覚的に魅力的な画像に変換する
- 画像から画像への生成:テキストプロンプトと初期画像の両方を使用して新しい画像を作成します
- インペインティング:画像内のオブジェクトを削除または置換する
- アウトペインティング:既存の画像を、文脈的に一貫性のある新しいコンテンツで拡張する
テキストから画像への生成
このモデルは、テキスト プロンプトを一貫性があり視覚的に魅力的な画像に変換することに優れています。ユーザーが説明的なフレーズを入力すると、 Stable Diffusion がテキストの本質を捉えた対応するビジュアルを生成します。
テキストプロンプト | 出力画像 |
巨大な古代の亀の背中に架空の都市が建てられているシーン。亀の甲羅は、そびえ立つ木々が生い茂る緑豊かな密林に覆われ、葉の間には霧に包まれた隠れた村があります。都市は、自然環境とシームレスに溶け込む精巧に設計された建物で構成されており、都市のさまざまなセクションを結ぶロープの橋が特徴です。 | ![]() |
4 つの要素が美しいガラスの箱の中に入っており、その中もゴージャスなガラスの箱、その中もガラスの箱。優美な要素! 非常に精巧で複雑な傑作がガラスの箱の中に入っています。 | ![]() |
3 つのポーションの写真: 最初のポーションは青色で「MANA」というラベル、2 番目のポーションは赤色で「HEALTH」というラベル、3 番目のポーションは緑色で「POISON」というラベル。古い薬剤師。 | ![]() |
コラージュ アート「We're Leaving For the Future」1980 年代の #vaporwave 美的インターネット アート、接着されたレイヤーの雑誌の切り抜き画像の形状のスクラップ、引き裂かれたぼろぼろの紙アート、BASIC コード、ハーフトーン、#pixelart。 | ![]() |
画像から画像への生成
Stable Diffusion AI の画像間生成では、テキスト プロンプトと初期画像の両方を使用して、元の画像と同じ特性を持つ新しい画像を作成します。モデルはランダム ノイズから開始するのではなく、初期画像にノイズを追加し、テキスト プロンプトに基づいてノイズを除去します。これにより、モデルは初期画像から一般的な特徴をキャプチャできます。
入力画像 | プロンプト | 出力画像 |
![]() | 虹色の虎 | ![]() |
修復
Stable Diffusion AI のインペインティング機能は、画像を編集するための強力なツールです。画像からオブジェクトを削除したり、オブジェクトを別のオブジェクトに置き換えたりできます。これにより、塗りつぶされたコンテンツがシームレスで自然になります。
入力 | プロンプト | 出力画像 |
画像:![]() マスク: ![]() | ベンチに座っているオレンジ色の猫 | ![]() |
アウトペインティング
Stable Diffusion の Outpainting 機能を使用すると、既存の画像を元の境界を超えて拡張し、コンテキストに一貫性のある新しいコンテンツを作成できます。AI を使用して、画像の境界をシームレスに拡張する新しいピクセルを生成します。
入力 | 出力画像 |
![]() | ![]() |
![]() | ![]() |
Stable Diffusionに関するYouTube動画
RedditでStable Diffusionについて人々が語っていること
安定拡散は時代遅れになっているように感じますが、同意する人はいますか?
u/ryan7251によるaiArtの投稿
Stable Diffusion入門: リソースとチュートリアル
u/SandCheezyによるsdforallでの投稿
X のStable Diffusionについて人々が語っていること
Stable Diffusion 3媒体に関する考察#SD3
— エマド (@EMostaque) 2024 年 6 月 14 日
1. スピードとパフォーマンスを兼ね備えた優れたモデルです
2. ロビンのチームと安定性AIチームの他のメンバーによって、幅広い用途に対応しつつ、すぐに使えるように繰り返しトレーニングされました。
3. 安全性の調整の一部は明らかです…
Comfy UI でStable Diffusion 3.5 Large をローカルでテストしたところ、 FLUXを使っていた人にとっては大きな後退です。画質は平均的、手や解剖学も悪いです。スタイルを変えるのに優れているだけです。Fluxを使い続けてください。正直な意見です。 #AI pic.twitter.com/XkYiw3h8wi
— トラビス・デイビッド(@MrDavids1) 2024年10月23日
2022年7月時点ではStable Diffusionはまだリリースされておらず、私は早期アクセス版で遊んでいました。
— TomLikesRobots🤖 (@TomLikesRobots) 2025年1月22日
わずか 2 年半後に、同じプロンプトを使用して、ほぼ実物そっくりのビデオ クリップを生成できるようになったことに驚いています。
「アイスランドのブラックサンドビーチにいる白い馬」 https://t.co/Tn3Yricbwq pic.twitter.com/lkqB9KfsVr
私はStable Diffusionオープンソースリリースについて非常に矛盾を感じています。
— ジョシュア・アキアム(@jachiam0) 2022年9月10日
Stable Diffusion 3モデルは、拡散の概念とフロー マッチングおよびタイムスタンプ サンプリングを組み合わせた新しいアプローチです。
— サティア・マリック (@LearnOpenCV) 2024年11月19日
今週の LearnOpenCV のブログ投稿では、Stable Diffusion 3と 3.5 の直感的なアプローチを紹介します。これは、次のような方々にとっての足がかりとなるでしょう… pic.twitter.com/1H3J8MU9cg
🚀 お客様はAmazon SageMaker JumpStart でStable Diffusion 3.5 Large にアクセスできるようになりました: https://t.co/XGDAyapWZW
— スワミ・シヴァスブラマニアン (@SwamiSivasubram) 2024 年 11 月 14 日
81 億のパラメータを備えたStable Diffusion 3.5 Large は、優れた品質と迅速な順守性を備えたStable Diffusionファミリーの中で最も強力なテキストから画像への変換モデルです。…
Stable Diffusion (Midjourney 経由) は、3 年前、AI における私の「なるほど!」と思った瞬間でした。
— エモジラ (@theemozilla) 2025年2月12日
私は自動車業界で AI 関連の仕事をしていましたが、それがきっかけで (ほぼ文字通り) すべてを放り出して AI の学習に集中するようになりました ( https://t.co/R2KxmFyRHi を参照)。
今日、妻に頼まれて… pic.twitter.com/MmeifeDuE9
Stable Diffusion 3.5 のバリエーションを見てみましょう: Stable Diffusion 3.5 Large、 Stable Diffusion 3.5 Large Turbo、およびStable Diffusion 3.5 Medium。 https://t.co/mPwrEQHbNT
— ヴァスト.ai (@vast_ai) 2024 年 12 月 16 日
Stable Diffusion 3が発表されました
— ホリー・ハーンドン(@hollyherndon) 2024年2月23日
安定性は、15億件以上のオプトアウトリクエストを持つ@spawning_ Do Not Trainレジストリを使用して、トレーニング前にデータセットをフィルタリングしました。
今年はオプトアウトに対応したモデルがさらに多くリリースされる予定です。これが標準に近づいていることを願っています! https://t.co/NRrnHJPgE0
Stable Diffusion 3 をテストしている人達を見てみると、正直言ってこれは大変です。pic.twitter.com /Ii7bHqmX9Y
— マックス・ウルフ(@minimaxir) 2024年6月12日
@daytonaioインフラでのStable Diffusion🔥 https://t.co/EgD8htZDJp
— イヴァン・ブラジン (@ivanburazin) 2024 年 12 月 13 日
よくある質問
Stable Diffusionは何をしますか?
Stable Diffusion は、テキストの説明から詳細でリアルな画像を生成するディープラーニングのテキストから画像へのモデルです。拡散技術に基づく生成 AI モデルであり、主にテキスト プロンプトからオリジナルの画像を作成するために使用されます。Stable Stable Diffusion は、テキスト プロンプトによってガイドされるインペインティング、アウトペインティング、画像から画像への変換などのタスクも実行できます。
Stable Diffusionに適したプロンプトを作成するにはどうすればよいでしょうか?
主題、スタイル、構成、照明、その他の関連する属性に関する詳細を含めます。また、不要なアーティファクトやスタイルを防ぐために、画像に含めたくない内容も指定します。
Stable Diffusionを無料で使用できますか?
はい、モデル自体は無料で提供されており、クラウドベースのサービスを通じて、またはローカルマシン上で実行できます。
Stable Diffusionは初心者でも使いやすいですか?
Stable Diffusionは初心者には学習曲線があるかもしれませんが、 Pollo AIで試すことができます。私たちは、プロとアマチュアの両方がStable Diffusion画像生成にアクセスできるようにする直感的なインターフェースを提供します。
