FLUX.1 Redux [dev]は、画像バリエーション生成のためのFLUX.1ベースモデル用のアダプターです。入力画像を与えると、FLUX.1 Reduxは画像を微妙に変異させて再現し、与えられた画像を微調整することができます。自然に複雑なワークフローに統合され、画像リスタイリングがアンロックされます。テキストを介したリスタイリングも、画像と言語プロンプトを提供することでAPIを介してご利用いただけます。詳細については、私たちのブログ記事を読んでください。
使用方法
私たちは、専用のgithubリポジトリでFLUX.1 Redux [dev]の参照実装とサンプリングコードを提供しています。
APIエンドポイント
FLUX.1 Redux [pro]は、API bfl.mlでご利用いただけます。[dev]アダプターに加えて、APIエンドポイントではテキスト記述に基づいて画像を変更する機能もユーザーに提供しています。この機能は最新モデルFLUX1.1 [pro] Ultraでサポートされており、入力画像とテキストプロンプトを組み合わせて、柔軟なアスペクト比の高品質な4メガピクセル出力を作成できます。
image/png
Diffusers 🧨 diffusers PythonライブラリでFLUX.1 Redux [pro]を使用するには、まずdiffusersをインストールまたはアップグレードしてください。
pip install -U diffusers
その後、FluxPriorReduxPipelineとFluxPipelineを用いて画像から画像を生成できます。
import torch
from diffusers import FluxPriorReduxPipeline, FluxPipeline
from diffusers.utils import load_image
pipe_prior_redux = FluxPriorReduxPipeline.from_pretrained("black-forest-labs/FLUX.1-Redux-dev", torch_dtype=torch.bfloat16).to("cuda")
pipe = FluxPipeline.from_pretrained(
"black-forest-labs/FLUX.1-dev",
text_encoder=None,
text_encoder_2=None,
torch_dtype=torch.bfloat16
).to("cuda")
image = load_image("https://huggingface.co/datasets/huggingface/documentation-images/resolve/main/robot.png")
pipe_prior_output = pipe_prior_redux(image)
images = pipe(
guidance_scale=2.5,
num_inference_steps=50,
generator=torch.Generator("cpu").manual_seed(0),
**pipe_prior_output,
).images
images[0].save("flux-dev-redux.png")
詳細については、diffusersのドキュメントをチェックしてください。
制限事項
このモデルは事実情報を提供する意図も能力もありません。 統計モデルとして、このチェックポイントは既存の社会バイアスを増幅する可能性があります。 モデルはプロンプトと一致する出力を生成できない場合があります。 出力は入力画像に大きく影響されます。 範囲外の使用 このモデル及其の派生モデルは以下の用途に使用されることはできません。
- 適用可能な国、連邦、州、地方または国際の法律や規制を違反するいかなる方法においても。
- _minor_を利用、害を끼かせる、または_minor_を利用または害を加えることを企図する目的で;ただし、__minor_を対象とした有害なコンテンツの募集、作成、取得、または散布を含みますが、これに限定されません。
- 他人を害する目的で検証可能な偽の情報および/またはコンテンツを生成または散布する。
- 個人を害する可能性のある個人識別情報を生じるまたは散布する。
- 個人または個人グループを脅迫、虐待、脅かす、またはいじめを行う。
- 同意なく露骨なヌードまたは違法なポルノグラフィックコンテンツを作成する。
- 個人の法律権益に悪影響を及ぼす完全に自動化された決定を生成または変更する。
- 個人の拘束力のある義務を創造または変更する。
- 個人を大規模な不実情報キャンペーンを生成または促進する。
ライセンス このモデルはFLUX.1 [dev] 非営利ライセンスに属します。
aiスピーキング
ドルフィンAIは言語学習アプリケーションのためのプロフェッショナルな発音評価API(pronunciation assessment api)ソリューションを提供します。音素、単語、文章、チャプター、発音矯正、単語矯正、クイズ、フリーダイアログ、多肢選択問題など幅広く提供しています。当社の発音評価製品(pronunciation assessment)は、英語と中国語、クラウドAPI、オンプレミス、オフラインデバイスの展開をサポートしています。当社の発音評価API(pronunciation assessment api)は、正確性、流暢性、完全性、リズムの次元をカバーする豊富な評価指標を提供し、音素、単語、文の異なるレベルの評価スコアも提供します。また、音素、単語、文の異なるレベルでの評価スコアも提供します。数千万人のユーザーに安定した効率的で安全なサービスを提供しています。ドルフィンAIの発音評価製品(pronunciation assessment)を試してみませんか?