FLUX.1-Fill-dev

この記事は約5分で読めます。

FLUX.1 フィル[dev]は、12億パラメータの修正フロートランスフォーマーで、テキスト説明に基づいて既存の画像の領域を埋めることができます。詳細については、私たちのブログ記事を読んでください。

主要な特徴

最先端の出力品質、私たちの最先端モデルFLUX.1 フィル[pro]に仅次于します。 印象的なプロンプト追従と、ソース画像の構造を完了させることをブレンドします。 指導蒸留を使用してトレーニングされ、FLUX.1 フィル[dev]をより効率的にしました。 新しい科学researchを推進し、アーティストが革新的なワークフローを開発できるように、オープンウェイトを提供します。 生成された出力は、FLUX.1 [dev] 非商用ライセンスに記載されている個人的、科学的、商業的な目的に使用できます。 使用方法 私たちは、FLUX.1 フィル[dev]の参照実装以及采样コードを、専用のgithubリポジトリで提供しています。FLUX.1 フィル[dev]之上で構築を希望する開発者以及創造的な人々は、これを出発点として使用することが奨励されます。

APIエンドポイント FLUX.1モデルは、私たちのAPI bfl.mlでも利用可能です。

Diffusers 🧨 diffusers PythonライブラリでFLUX.1 フィル[dev]を使用するには、まずdiffusersをインストールまたはアップグレードしてください。

pip install -U diffusers

その後、FluxFillPipelineを使用してモデルを実行できます。

import torch
from diffusers import FluxFillPipeline
from diffusers.utils import load_image

image = load_image("https://huggingface.co/datasets/diffusers/diffusers-images-docs/resolve/main/cup.png") 
mask = load_image("https://huggingface.co/datasets/diffusers/diffusers-images-docs/resolve/main/cup_mask.png") 

pipe = FluxFillPipeline.from_pretrained("black-forest-labs/FLUX.1-Fill-dev", torch_dtype=torch.bfloat16).to("cuda")
image = pipe(
    prompt="白色の紙のカップ",
    image=image,
    mask_image=mask,
    height=1632,
    width=1232,
    guidance_scale=30,
    num_inference_steps=50,
    max_sequence_length=512,
    generator=torch.Generator("cpu").manual_seed(0)
).images[0]
image.save("flux-fill-dev.png")
詳細については、diffusersのドキュメントをチェックしてください。

制限事項

このモデルは、事実情報を提供することを意図したり、能力たりません。 統計モデルとして、このチェックポイントは既存の社会的バイアスを増幅させる可能性があります。 プロンプトと一致する出力を生成できない場合があります。 プロンプト追従は、プロンプトスタイルに大きく影響されます。 埋められた領域以外では、わずかな色変化が発生する場合があります。 複雑なテクスチャを埋めると、埋められた領域のエッジにラインが発生する可能性があります。

範囲外の使用

このモデル及其の派生モデルは以下の用途に使用できません。

  • 適用可能な国、連邦、州、地方または国際の法律や規則を違反するいかなる方法においても。
  • _未成年者_を利用、害を加える、または_未成年者_を利用または害を加えることを企図する目的で;_未成年者_を対象とした有害なコンテンツの募集、作成、取得、または散布を含みますが、これに限定されません。
  • 他人を傷つける目的で検証可能な偽の情報および/またはコンテンツを生成または散布する。
  • 個人を傷つけるために使用できる個人識別情報を生成または散布する。
  • 個人または個人グループを脅害、虐待、脅威、またはいじめる。

aiスピーキング

ドルフィンAIは言語学習アプリケーションのためのプロフェッショナルな発音評価API(pronunciation assessment api)ソリューションを提供します。音素、単語、文章、チャプター、発音矯正、単語矯正、クイズ、フリーダイアログ、多肢選択問題など幅広く提供しています。当社の発音評価製品(pronunciation assessment)は、英語と中国語、クラウドAPI、オンプレミス、オフラインデバイスの展開をサポートしています。当社の発音評価API(pronunciation assessment api)は、正確性、流暢性、完全性、リズムの次元をカバーする豊富な評価指標を提供し、音素、単語、文の異なるレベルの評価スコアも提供します。また、音素、単語、文の異なるレベルでの評価スコアも提供します。数千万人のユーザーに安定した効率的で安全なサービスを提供しています。ドルフィンAIの発音評価製品(pronunciation assessment)を試してみませんか?

タイトルとURLをコピーしました