Such mal „Prompts für KI-Influencer“ bei Google — und du landest entweder bei Reddit-Threads, bei deutschen Marketing-Tools, die dir Prompts für Werbetexte zeigen statt für Bilder, oder bei Etsy-PDFs für 18 Euro mit „300+ AI Influencer Prompts“, die in der Hälfte der Fälle ein Stable-Diffusion-1.5-Output produzieren, das aussieht wie aus 2023.
Das Problem: Ein guter KI-Influencer-Prompt unterscheidet sich fundamental von einem Marketing-Prompt. Du beschreibst keinen Text, du beschreibst ein Gesicht, eine Pose, ein Licht, ein Objektiv. Und je nachdem, ob du das in Flux, Midjourney, Nano Banana 2, Seedream 4, Qwen Image, Ideogram oder SDXL über ComfyUI eintippst, brauchst du eine andere Syntax, andere Reihenfolge, andere Trigger-Wörter.
Dieser Guide ist die Antwort auf all das. Du bekommst:
- die 8-Punkte-Anatomie eines KI-Influencer-Prompts, an der du jeden eigenen Prompt aufbauen kannst,
- eine Copy-Paste-Matrix mit über 40 fertigen Prompts für die 6 wichtigsten Modelle,
- die Charakter-Konsistenz-Workflows für Midjourney
--cref, Flux-LoRA, Nano Banana Referenzbilder, Seedream Identity Preservation und Ideogram Reference, - 30+ Outfit-, Pose- und Szenen-Module zum direkten Einsetzen,
- die Negativ-Prompts, die in SDXL und Flux wirklich Artefakte unterdrücken,
- und eine 10-Punkte-Checkliste, mit der du eigene Prompts schreibst, die beim ersten Versuch sitzen.
Wenn du noch ganz am Anfang stehst und dich erst grundsätzlich fragst, wie du einen KI-Influencer baust, lies zuerst unseren Hauptguide: KI-Influencer erstellen. Wenn du dich entscheiden willst, welches Modell zu dir passt, hilft dir der Vergleich der 7 besten KI-Bildmodelle für AI Influencer oder die Übersicht der besten KI-Bildgeneratoren für AI Influencer. Hier geht es ausschließlich um eines: die Prompts.
Anatomie eines KI-Influencer-Prompts: Die 8-Punkte-Formel
Wer einen Prompt schreibt, der über mehrere Modelle hinweg funktioniert, hält sich an eine feste Reihenfolge. Modelle wie SDXL, Flux und Nano Banana gewichten die ersten Tokens stärker als die letzten — was du an Position 1 schreibst, prägt das Bild. Midjourney ist toleranter mit der Reihenfolge, aber auch dort hilft eine konsistente Struktur, weil du Prompts dann zwischen Modellen übertragen kannst, ohne sie neu zu schreiben.
Die acht Komponenten:
- Subject — wer ist auf dem Bild? Alter, Ethnizität, Geschlecht, prägende Merkmale.
- Scene — wo befindet sich die Person? Ort, Zeit, Wetter, Umgebung.
- Lighting — welches Licht? Soft natural, golden hour, harsh studio, neon, rim light.
- Camera — welche virtuelle Kamera-Position? Close-up, medium shot, full body, over-the-shoulder.
- Lens — welches Objektiv? 35mm, 50mm, 85mm, 135mm — das bestimmt Bokeh, Distanz, Verzerrung.
- Mood — welche Stimmung? Confident, melancholic, playful, editorial, raw.
- Style — welcher visuelle Stil? Editorial fashion, candid, cinematic, polaroid, magazine cover.
- Negative — was darf nicht aufs Bild? Extra Finger, Verzerrungen, Logos, Plastik-Haut.
Ein konkretes Beispiel — auseinandergenommen
Nimm diesen Prompt für Flux:
A 24-year-old woman with shoulder-length auburn hair and freckles, sitting at a window seat
in a Berlin Altbau café, soft afternoon light from the left, medium close-up, 85mm portrait lens,
shallow depth of field, candid editorial mood, reading a paperback, holding an oat-milk cappuccino,
shot on Kodak Portra 400, magazine-grade skin texture, natural pores visible,
no makeup-heavy look. Negative: plastic skin, extra fingers, deformed eyes, watermark,
oversaturated, HDR look.
Was hier passiert, Schritt für Schritt:
- Subject = „A 24-year-old woman with shoulder-length auburn hair and freckles“ — Alter, Haare, Detail, das die Person identifizierbar macht.
- Scene = „sitting at a window seat in a Berlin Altbau café“ — Ort, Zeit (impliziert durch „afternoon“ weiter unten), spezifischer Kontext.
- Lighting = „soft afternoon light from the left“ — Richtung und Qualität.
- Camera = „medium close-up“ — Bildausschnitt.
- Lens = „85mm portrait lens, shallow depth of field“ — Objektiv und Schärfentiefe.
- Mood = „candid editorial“ — Stimmung.
- Style = „shot on Kodak Portra 400, magazine-grade skin texture, natural pores visible“ — der Stil-Stack, der das Bild aus dem typischen KI-Look heraushebt.
- Negative = „plastic skin, extra fingers, deformed eyes, watermark, oversaturated, HDR look“ — was unterdrückt werden soll.
Die zwei Mini-Bonus-Elemente „reading a paperback, holding an oat-milk cappuccino“ sind Aktivitäts-Anker. Sie geben dem Gesicht etwas zu tun — und reduzieren das typische „Schaufensterpuppen-Gefühl“ früher KI-Bilder.
Warum die Reihenfolge zählt
Wenn du dich fragst, warum wir so insistierend von einer festen Reihenfolge sprechen: Diffusion-Modelle wie SDXL, Flux und Nano Banana arbeiten mit einem CLIP-ähnlichen Text-Encoder, der Tokens positional gewichtet. Was am Anfang steht, prägt den Latent Space stärker. Wenn du „85mm portrait lens“ an den Anfang setzt, bekommst du ein Bild, das erstmal wie ein 85mm-Porträt aussieht — und der Subject wird sekundär. Wenn du „24-year-old woman“ an den Anfang setzt, prägt die Person die Komposition.
Midjourney bricht diese Regel teilweise — sein eigener Tokenizer und das vorgeschaltete Prompt-Routing sind weniger positions-empfindlich. Aber wer in mehreren Modellen unterwegs ist, sollte sich die positions-basierte Reihenfolge angewöhnen. Sie funktioniert überall und macht Prompts portabel.
Die häufigsten Anfänger-Fehler
Drei Fehler sehen wir immer wieder, wenn neue Creator zu uns kommen:
- Zu viele Adjektive aufeinander. „beautiful stunning gorgeous flawless model“ produziert ein Modell, das nicht aussieht wie ein Mensch, sondern wie ein generischer KI-Schönheitsdurchschnitt. Ein präzises Adjektiv schlägt zehn vage.
- Keine Negativ-Prompts. Besonders SDXL-Nutzer überspringen das oft — und wundern sich dann über sechs Finger pro Hand. Negativ-Prompts sind nicht optional, sondern Pflichtteil.
- Falsche oder fehlende Brennweite. Ein Prompt ohne Lens-Angabe produziert ein Bild mit irgendeiner Default-Brennweite des Modells, meist um die 50mm. Wer das ändern will, muss es explizit sagen.
Mit dieser Struktur im Kopf können wir jetzt zur Hauptattraktion kommen: einer Matrix aus konkreten Prompts, die du nehmen, anpassen und in deinem bevorzugten Modell laufen lassen kannst.
Copy-Paste Prompt-Matrix: Use-Case × Modell
Die folgenden Prompts sind nach Anwendungsfall gruppiert. Pro Use-Case zeigen wir dir, wie der Prompt für jedes der sechs wichtigsten Modelle aussieht — weil die Syntax und die Stil-Trigger sich unterscheiden. Kopiere den Prompt, ersetze die Variablen in [eckigen Klammern] und du hast ein Bild.
Use-Case 1: Studio-Portrait
Das Foundation-Shot jedes KI-Influencers. Hierauf baust du --cref (Midjourney) oder Referenzbilder (Nano Banana / Seedream) auf.
Flux:
Editorial studio portrait of [name], 24-year-old woman with [hair color] hair,
soft three-point lighting, medium close-up, 85mm lens, neutral grey backdrop,
confident gaze into camera, magazine-cover quality, natural skin texture with visible pores,
shot on Hasselblad H6D, color grading by Annie Leibovitz reference.
Midjourney:
editorial studio portrait, 24yo woman, [hair color] hair, soft three-point lighting,
medium close-up, 85mm lens, neutral grey backdrop, confident gaze, magazine cover quality,
natural skin texture, shot on Hasselblad --ar 4:5 --style raw --v 7
Nano Banana 2:
Editorial studio portrait of a 24-year-old woman with [hair color] hair, soft three-point
studio lighting from front-left, neutral grey backdrop, medium close-up framing, 85mm portrait
focal length, confident expression, realistic skin with natural pores, no plastic look,
fashion magazine style.
Seedream 4:
24-year-old woman, [hair color] hair, editorial studio portrait, three-point lighting,
soft key from left, fill light from right, hair light from above, neutral grey seamless backdrop,
medium close-up, 85mm portrait lens, confident gaze, fashion magazine cover,
ultra-realistic skin texture, 8K, photorealistic
SDXL:
(masterpiece, best quality, photorealistic:1.3), editorial studio portrait, 24yo woman,
[hair color] hair, three-point lighting, soft key light from left, neutral grey backdrop,
medium close-up, 85mm portrait lens, shallow depth of field, confident expression,
magazine cover quality, natural skin with visible pores, shot on Hasselblad,
(Kodak Portra 400 film grain:0.6)
Ideogram:
Editorial studio portrait of a 24-year-old woman with [hair color] hair, soft three-point
studio lighting, neutral grey seamless backdrop, medium close-up at 85mm, confident gaze,
magazine cover styling, natural skin texture, photorealistic, high detail
Modell-Hinweise: Flux gibt dir den hauttreuesten Look, Midjourney die ästhetischste Stimmung, Seedream das schärfste Endergebnis, Ideogram (wegen seiner Stärke bei Text-im-Bild) für spätere Cover-Mockups mit Magazin-Titel. Wenn du dich für ein einziges Modell entscheiden musst, ist Flux 2026 der unauffällige Allrounder — er rendert Haut, Pose und Stoff alle auf demselben hohen Niveau, ohne den klassischen „Midjourney-Look“, an dem Insta-Nutzer KI-Bilder sofort erkennen.
Use-Case 2: Outfit-Wechsel
Wenn du eine etablierte Charakter-Referenz hast und nur das Outfit tauschen willst.
Flux (mit LoRA):
[trigger_word], wearing an oversized cream cashmere knit sweater over high-waisted vintage
501 Levi's, white New Balance 990 sneakers, walking through a Berlin Mitte side street
on an overcast autumn morning, candid street-style shot, 35mm lens, eye-level,
magazine editorial styling.
Midjourney (mit –cref):
woman wearing oversized cream cashmere knit sweater, high-waisted vintage Levi's 501,
white New Balance 990 sneakers, walking through Berlin Mitte side street, overcast autumn
morning, candid street-style shot, 35mm lens, eye-level, magazine editorial
--cref [URL] --cw 80 --ar 4:5 --style raw --v 7
Nano Banana 2 (mit reference image):
Same woman as in the reference image, now wearing an oversized cream cashmere knit sweater
over high-waisted vintage 501 Levi's jeans, white New Balance 990 sneakers, walking through
a Berlin Mitte side street on an overcast autumn morning, candid street-style framing,
35mm lens equivalent, eye-level angle, magazine editorial styling — keep face, hair,
and body proportions identical to reference.
Seedream 4:
[identity_token] woman wearing oversized cream cashmere knit sweater, high-waisted vintage
Levi's 501 jeans, white New Balance 990 sneakers, Berlin Mitte side street, overcast autumn
morning, candid street-style, 35mm full-frame equivalent, eye-level, editorial magazine
styling, photorealistic, preserve identity from reference
SDXL (mit LoRA):
(masterpiece, photorealistic:1.3), [trigger_word], oversized cream cashmere knit sweater,
high-waisted vintage Levi's 501, white New Balance 990 sneakers, walking through Berlin
Mitte side street, overcast autumn morning, candid street-style, 35mm lens, eye-level,
editorial magazine, (Kodak Portra 400 grain:0.5)
Ideogram:
A young woman in an oversized cream cashmere knit sweater, high-waisted vintage Levi's 501,
white New Balance 990 sneakers, walking through a Berlin Mitte side street on an overcast
autumn morning, candid street-style photography, 35mm lens, eye-level, magazine editorial
styling, photorealistic
Modell-Hinweise: Flux mit eigenem LoRA bleibt unschlagbar konsistent — wenn du dir die Mühe machst, einen LoRA zu trainieren (Anleitung im Flux-Guide). Midjourney --cref ist die schnellste No-Setup-Option. Nano Banana 2 ist im Frühjahr 2026 die beste Wahl für Bild-zu-Bild-Konsistenz ohne Training.
Use-Case 3: Pose
Wenn du nur die Pose änderst, Person und Outfit aber gleich bleiben sollen.
Flux:
[trigger_word], seated on a low concrete bench, knees together, leaning forward with
elbows on knees, hands clasped, looking off-camera to the right, three-quarter body shot,
35mm lens, soft late-afternoon sun, urban park setting, candid editorial mood.
Midjourney:
woman seated on low concrete bench, knees together, leaning forward, elbows on knees,
hands clasped, looking off-camera to the right, three-quarter body, 35mm lens, soft
late-afternoon sun, urban park, candid editorial
--cref [URL] --cw 80 --ar 4:5 --style raw --v 7
Nano Banana 2:
The woman from the reference image, now seated on a low concrete bench, knees together,
leaning forward with elbows on knees, hands clasped in front of her, looking off-camera
to the right, three-quarter body framing, 35mm lens, soft late-afternoon sunlight from
the left, urban park background, candid editorial mood.
Seedream 4:
[identity_token] seated on low concrete bench, knees together, leaning forward, elbows on
knees, hands clasped, looking off-camera right, three-quarter body, 35mm lens, soft
late-afternoon golden sun, urban park, candid editorial, photorealistic
SDXL:
(masterpiece, photorealistic:1.3), [trigger_word], seated on low concrete bench, knees
together, leaning forward, elbows on knees, hands clasped, looking off-camera to the
right, three-quarter body shot, 35mm lens, soft late-afternoon sun, urban park,
candid editorial mood, (Portra 400 grain:0.5)
Ideogram:
A young woman seated on a low concrete bench, knees together, leaning forward with elbows
on her knees, hands clasped, looking off-camera to the right, three-quarter body framing,
35mm lens, soft late-afternoon sunlight, urban park setting, candid editorial photography,
photorealistic
Modell-Hinweise: Die schwierigste Disziplin. SDXL und Flux brauchen oft eine ControlNet-Pose-Vorlage für komplexe Posen (siehe ComfyUI + Flux Guide). Midjourney V7 ist überraschend gut darin geworden, beschriebene Posen umzusetzen, ohne Pose-Referenz.
Use-Case 4: Location / Szene
Du willst die gleiche Person in einer komplett anderen Umgebung zeigen.
Flux:
[trigger_word], walking along the rocky coastline of Étretat, Normandy, late October,
overcast sky with diffused light, wearing a beige trench coat over a chunky cream knit
and dark jeans, hands in pockets, three-quarter body, 50mm lens, slight ocean spray in
the air, magazine travel editorial.
Midjourney:
woman walking along rocky coastline of Étretat, Normandy, late October, overcast sky,
beige trench coat, cream chunky knit, dark jeans, hands in pockets, three-quarter body,
50mm lens, ocean spray in air, magazine travel editorial
--cref [URL] --cw 70 --ar 16:9 --style raw --v 7
Nano Banana 2:
Same woman as in the reference, now walking along the rocky coastline of Étretat in
Normandy, late October, overcast sky with diffused light, wearing a beige trench coat
over a chunky cream knit sweater and dark jeans, hands in pockets, three-quarter body
framing, 50mm lens, slight ocean spray in the air, magazine-grade travel editorial mood.
Seedream 4:
[identity_token] walking along rocky coastline, Étretat Normandy, late October, overcast
diffused light, beige trench coat over cream chunky knit, dark jeans, hands in pockets,
three-quarter body, 50mm lens, ocean spray, travel editorial, photorealistic, cinematic
SDXL:
(masterpiece, photorealistic:1.3), [trigger_word], walking along rocky coastline of
Étretat Normandy, late October, overcast diffused light, beige trench coat, cream chunky
knit, dark jeans, hands in pockets, three-quarter body, 50mm lens, slight ocean spray,
magazine travel editorial, (Portra 400 grain:0.4)
Ideogram:
A young woman walking along the rocky coastline of Étretat in Normandy, late October,
overcast sky with diffused natural light, wearing a beige trench coat over a chunky cream
knit sweater and dark jeans, hands in pockets, three-quarter body, 50mm lens, ocean spray
in the air, magazine travel editorial, photorealistic
Modell-Hinweise: Bei Locations gilt: je spezifischer, desto besser. „Étretat, Normandy“ produziert in allen Modellen die markanten Kreidefelsen — „an einer Küste“ produziert generischen Strand-Look. Modelle haben in ihren Trainingsdaten Tausende Bilder von berühmten Orten gesehen und assoziieren mit dem Eigennamen ein gefestigtes visuelles Vokabular. Nutze das aus: „in einem Hinterhof in Berlin Mitte“ schlägt „in einer Stadt“, „in einem Café in Paris Marais“ schlägt „in einem Café in Europa“.
Use-Case 5: Lifestyle-Shot
Aktiv, im Moment, mit Anker. Das ist Instagram-Gold.
Flux:
[trigger_word] in a sun-drenched Lisbon apartment kitchen, laughing while flipping a
pancake mid-air, soft morning light through gauzy white curtains, wearing an oversized
white linen shirt unbuttoned over a grey ribbed tank, hair pulled into a messy bun,
candid Polaroid SX-70 aesthetic, slight motion blur on the pancake, warm golden tones.
Midjourney:
sun-drenched Lisbon apartment kitchen, woman laughing while flipping pancake mid-air,
soft morning light through gauzy white curtains, oversized white linen shirt over grey
ribbed tank, messy bun, candid Polaroid SX-70 aesthetic, slight motion blur on pancake,
warm golden tones --cref [URL] --cw 75 --ar 4:5 --style raw --v 7
Nano Banana 2:
The reference woman in a sun-drenched Lisbon apartment kitchen, laughing while flipping
a pancake mid-air, soft morning light filtering through gauzy white curtains, wearing
an oversized white linen shirt unbuttoned over a grey ribbed tank, hair in a messy bun,
candid Polaroid SX-70 aesthetic with slight motion blur on the pancake, warm golden tones.
Seedream 4:
[identity_token], sun-drenched Lisbon apartment kitchen, laughing, flipping pancake
mid-air, soft morning light through gauzy white curtains, oversized white linen shirt
over grey ribbed tank, messy bun, candid Polaroid SX-70 aesthetic, slight motion blur
on pancake, warm golden tones, photorealistic
SDXL:
(masterpiece, photorealistic:1.3), [trigger_word], sun-drenched Lisbon apartment kitchen,
laughing, flipping pancake mid-air, soft morning light through gauzy white curtains,
oversized white linen shirt over grey ribbed tank, messy bun, candid Polaroid SX-70 look,
slight motion blur on pancake, warm golden tones, (analog film grain:0.5)
Ideogram:
A young woman in a sun-drenched Lisbon apartment kitchen, laughing while flipping a
pancake mid-air, soft morning light through gauzy white curtains, oversized white linen
shirt over a grey ribbed tank, hair in a messy bun, candid Polaroid SX-70 aesthetic,
slight motion blur on the pancake, warm golden tones, photorealistic
Modell-Hinweise: Lifestyle-Shots leben von Aktivität + Imperfektion. Das „Lachen“, die „messy bun“, die „motion blur“ — alles Anti-Schaufensterpuppen-Trigger.
Use-Case 6: Mirror Selfie
Der Identitäts-Lackmustest. Wenn ein Modell den Spiegel-Selfie überzeugend hinbekommt (Hand mit Handy plus Spiegelung plus Gesicht), beherrscht es Geometrie und Konsistenz.
Flux:
[trigger_word] taking a mirror selfie in a minimalist white-tiled bathroom, holding a
black iPhone 17 Pro vertically with right hand, left hand on hip, wearing a fitted black
turtleneck and high-waist cream trousers, soft overhead daylight, eye-level reflection
in a full-length floor mirror, slight grain, candid Instagram aesthetic, no logos on
the phone.
Midjourney:
mirror selfie in minimalist white-tiled bathroom, woman holding black iPhone vertically,
left hand on hip, fitted black turtleneck, high-waist cream trousers, soft overhead
daylight, full-length floor mirror, slight grain, candid Instagram aesthetic
--cref [URL] --cw 80 --ar 4:5 --style raw --v 7
Nano Banana 2:
The woman from the reference image taking a mirror selfie in a minimalist white-tiled
bathroom, holding a black smartphone vertically with her right hand at chest height,
left hand on hip, wearing a fitted black turtleneck and high-waist cream trousers,
soft overhead daylight, eye-level reflection in a full-length floor mirror, slight
film grain, candid Instagram aesthetic, no visible brand logos.
Seedream 4:
[identity_token] mirror selfie, minimalist white-tiled bathroom, holding black smartphone
vertically in right hand at chest height, left hand on hip, fitted black turtleneck,
high-waist cream trousers, soft overhead daylight, full-length floor mirror reflection,
slight grain, candid Instagram aesthetic, photorealistic
SDXL:
(masterpiece, photorealistic:1.3), [trigger_word], mirror selfie in minimalist white-tiled
bathroom, holding black smartphone vertically with right hand, left hand on hip, fitted
black turtleneck, high-waist cream trousers, soft overhead daylight, full-length floor
mirror, slight grain, candid Instagram aesthetic, (Portra 400 grain:0.5)
Ideogram:
A young woman taking a mirror selfie in a minimalist white-tiled bathroom, holding a
black smartphone vertically with her right hand, left hand on hip, wearing a fitted black
turtleneck and high-waist cream trousers, soft overhead daylight, full-length floor mirror
reflection, slight film grain, candid Instagram aesthetic, photorealistic
Modell-Hinweise: Spiegel-Selfies sind der Stresstest für Hand-Anatomie. Hier glänzt aktuell Nano Banana 2 und Midjourney V7. SDXL braucht oft 5-10 Versuche, Flux 2-3. Wer Spiegel-Selfies in großer Stückzahl braucht (typisches Volumen für einen aktiven Instagram-Feed: 2-3 pro Woche), sollte Nano Banana 2 oder eine fein abgestimmte Flux-LoRA verwenden — bei SDXL frisst die Iterations-Rate sonst dein Tages-Budget.
Charakter-Konsistenz: Prompts für identische Gesichter
Der schwerste Teil. Ein einzelnes schönes Bild ist trivial — ein Feed aus 30 Bildern derselben Person ist die eigentliche Disziplin. Jedes Modell hat einen eigenen Konsistenz-Mechanismus, und du musst pro Modell wissen, was zu tun ist.
In diesem Abschnitt fassen wir die Prompt-Seite zusammen. Wer den vollständigen Techniken-Vergleich braucht — Seed-Locking, Reference-Image-Methoden, LoRA-Training, Face-Swap und ControlNet im direkten Vergleich über alle sechs Modelle — findet ihn im dedizierten Charakter-Konsistenz-Guide.
Midjourney: --cref und --cw
Midjourney war 2024 das erste Mainstream-Modell mit nativer Charakter-Referenz. Die Syntax:
[dein Prompt] --cref [URL des Referenzbilds] --cw [0-100]
--cw 100(Standard): Gesicht, Haare, Kleidung und Körperbau möglichst genau übernehmen.--cw 50: Nur das Gesicht übernehmen, Kleidung darf variieren.--cw 0: Nur „Charakter-Stimmung“ übernehmen.
Praxis-Tipp: Verwende ein von Midjourney selbst generiertes Referenzbild als Anker — keine hochgeladene Fotografie. Midjourney erkennt seinen eigenen Stil leichter wieder, und du bekommst stabilere Ergebnisse. Eine vollständige Anleitung findest du im Midjourney AI Influencer Guide.
Flux: LoRA-Trigger-Wörter
Flux ist im Frühjahr 2026 das Modell mit dem besten Konsistenz-Mechanismus — sofern du bereit bist, einen eigenen LoRA zu trainieren. Du sammelst 15-25 Bilder einer (KI-generierten oder realen) Person mit einem konsistenten Look, trainierst einen LoRA auf einem eindeutigen Trigger-Wort wie LARASMITH oder subject_001, und ab dann reicht es, dieses Wort in jeden Prompt einzubauen.
Beispiel:
LARASMITH walking through a Tokyo street at night, neon reflections, wet asphalt,
candid editorial, 35mm lens
Die LoRA-Datei lädst du in deinen Inference-Workflow (Forge, A1111, ComfyUI, Replicate, Fal). Wie du ein eigenes LoRA in vier Stunden für unter zehn Euro trainierst — inklusive Dataset-Vorbereitung, FluxGym-Walkthrough und Civitai-Online-Pfad — steht im LoRA-Training-Guide für KI-Influencer. Die Flux-spezifischen Hyperparameter und der NSFW-Workflow stehen ergänzend im Flux Guide.
Nano Banana 2: Referenzbild + „Same person as…“
Nano Banana 2 (Googles ehemals interner Codename für Gemini-Image-2) ist im Frühjahr 2026 das beste trainingsfreie Konsistenz-Modell. Du lädst 1-3 Referenzbilder hoch, und der Prompt referenziert sie verbal.
Beispiel:
Same woman as in the reference image, now wearing a navy linen suit, standing on the
terrace of a Lisbon rooftop restaurant at sunset, magazine editorial styling, 50mm lens.
Der Vorteil: kein Training, sofortiger Start. Der Nachteil: pro Generation müssen die Referenzbilder mitgeschickt werden, was bei API-Nutzung Tokens kostet. Details, Workflow und API-Beispiele im Nano Banana 2 Guide.
Seedream 4: Identity Preservation
Seedream 4 (ByteDance) hat einen ähnlichen Mechanismus wie Nano Banana, aber mit einem eigenen „Identity Token“. Du benennst deine Person beim ersten Upload (z. B. subject_lara), und ab dann referenzierst du sie im Prompt:
subject_lara wearing a cream knit sweater, walking through a Berlin street in autumn,
35mm lens, candid editorial
Seedream 4 ist besonders stark bei Volumen-Workflows — wenn du 100 Bilder einer Person für einen Kalender oder ein PDF brauchst, ist die Konsistenz über große Batches hinweg unschlagbar. Mehr im Seedream 4 Guide.
Ideogram: Reference Mode
Ideogram hat 2025 eine Reference-Funktion nachgezogen. Stärke des Modells ist eigentlich Text-im-Bild — also Prompts, bei denen ein Schild, ein Buchcover, ein T-Shirt-Print lesbaren Text enthalten soll. Für reine Konsistenz ist Ideogram zweite Wahl, aber für Magazin-Cover-Mockups, in denen das Gesicht der Person und der Titel „VOGUE PARIS“ sichtbar sein sollen, ist es die erste Wahl. Details im Ideogram Guide.
Qwen Image: Self-Hosting + LoRA
Qwen Image (Alibaba) ist die Open-Source-Alternative zu Flux mit ähnlichen LoRA-Möglichkeiten und einem Lizenzmodell, das kommerzielle Nutzung erlaubt. Wenn du auf der eigenen GPU laufen lassen willst und dir Flux-Lizenzkosten sparen möchtest, ist Qwen der Plan B. Mehr im Qwen Image Guide.
Outfit-, Pose- & Szenen-Module zum Reinkopieren
Diese Module sind Bausteine. Du nimmst dein Basis-Prompt-Gerüst (Subject + Negative bleiben gleich) und tauschst nur das Modul. Das sind über 30 Fragmente, sortiert nach Kategorie.
Warum modulares Prompting funktioniert
Der wichtigste Mindset-Wechsel beim Prompten in großer Stückzahl: Du baust keine Sätze, du baust einen Code mit Funktionen. Ein Profi schreibt nicht jedes Mal einen neuen Prompt — er hat 10 Outfits, 10 Posen, 10 Szenen, 8 Licht-Setups gespeichert und kombiniert sie. Was wie kreative Arbeit aussieht, ist eigentlich ein Snippet-System mit hoher Wiederverwendbarkeit.
Das hat zwei Vorteile. Erstens: Du wirst schneller. Statt 30 Minuten an einem perfekten Prompt zu feilen, schiebst du in 30 Sekunden Module zusammen und generierst. Zweitens: Du wirst konsistenter. Wenn dein „Berlin Altbau Café“-Modul jedes Mal den gleichen Wortlaut hat, sieht jedes Café-Foto in deinem Feed nach dem gleichen Café aus. Genau das ist es, was virale KI-Influencer-Accounts von hobbymäßigen Promptern unterscheidet — sie haben eine erkennbare Welt, nicht 100 zufällige schöne Bilder.
Outfit-Module
oversized cream cashmere knit sweater, high-waisted vintage Levi's 501, white New Balance 990 sneakersfitted black turtleneck, high-waist cream wool trousers, pointed black ankle bootslinen beige co-ord set (loose blazer + wide-leg pants), white camisole underneath, leather mulesblack silk slip dress under an oversized denim trucker jacket, white sneakersoversized white poplin shirt unbuttoned over a grey ribbed tank, black bike shorts, white socks, retro Nike Cortezvintage Adidas tracksuit (forest green with white stripes), white t-shirt, gold hoop earringscropped grey hoodie, low-rise grey sweatpants, white Air Force 1s, baseball cap backwardstailored navy double-breasted blazer, white t-shirt, raw-edge straight-cut jeans, loafersflowy floral midi dress (small print, soft cream background), cognac leather belt, woven straw sandalsoversized black wool peacoat, grey cashmere scarf, dark indigo straight jeans, black Chelsea bootstailored cream linen suit (slightly oversized), no shirt underneath, gold pendant necklace, white sneakerssilk camisole top in champagne, high-waist tailored black trousers, strappy heels
Pose-Module
leaning against a wall, one foot up against the wall, hands in pockets, looking off-cameraseated on the floor, knees up, arms wrapped loosely around shins, looking up at the camerawalking toward the camera, mid-stride, looking slightly to the side, hair caught in motionhead tilted to the left, hand running through hair, eyes closed, soft smileseated cross-legged on a low couch, leaning forward with elbows on knees, hands claspedstanding in profile, hands on hips, looking out a large window, backlit silhouettecrouched down to adjust a shoe, head turned up toward camera, candid half-smilelying on a daybed on the side, one arm propping up the head, the other resting on the hipmid-laugh with head thrown back slightly, eyes nearly closed, hand on chestholding a mug with both hands at chest level, looking down into it, soft pensive mood
Szenen-Module
sun-drenched Lisbon apartment, white walls, terracotta floor tiles, large open windows with sheer linen curtains, late morning lightBerlin Altbau café, dark wood interior, marble café tables, soft window light from the left, mid-afternoonrocky Étretat coastline at low tide, overcast sky, chalk cliffs in background, ocean spray in the airMarrakech rooftop terrace at golden hour, terracotta tiles, low whitewashed walls, distant Atlas mountains, warm orange lightTokyo Shinjuku side street at night, neon reflections on wet asphalt, lone vending machine glowminimalist Scandinavian-style kitchen, oak floors, white tile splashback, cast iron pan on induction stove, soft morning light through large windowboutique hotel hallway, dark green wallpaper, brass sconces, vintage Persian runner, single overhead pendant lightProvence lavender field at golden hour, rolling rows of purple, warm low sun, hazy distant farmhouseNew York Brooklyn rooftop at blue hour, skyline lights behind, low concrete parapet, single string of festoon lightsParisian Haussmannian apartment with herringbone parquet floor, tall ceilings with crown molding, large open window with iron Juliet balcony
Licht-Module
soft natural light from a north-facing window, slightly overcast outside, gentle shadow falloffgolden hour direct sun from the side, warm tones, long shadows, slight lens flareblue hour ambient light, slight warmth from interior lamps, cinematic moodthree-point studio lighting: soft key from front-left, fill from front-right, hair light from aboveharsh midday sun from above, deep shadows under eyes and nose, high-contrast editorial looksingle practical light source (single lamp visible in frame), warm tungsten color temperature, deep shadowsovercast diffused daylight, completely soft, no harsh shadows, magazine-grade skin renderinglow-key dramatic lighting, single rim light from behind-left, most of face in shadow, moody
So baust du Module zusammen: Subject + Pose-Modul + Outfit-Modul + Szenen-Modul + Licht-Modul + Negative. Mit 12 Outfits × 10 Posen × 10 Szenen × 8 Lichter hast du theoretisch 9.600 Kombinationen aus einer Tabelle. Praktisch wirst du dir Lieblings-Kombos rauspicken und damit deinen Feed-Look definieren.
Ein erfahrenes Pattern: Reserviere zwei bis drei deiner Outfit-Module und zwei deiner Szenen-Module als „Signature-Slots“. Das sind die Looks und Orte, die in deinem Feed überdurchschnittlich oft auftauchen — sie werden zum visuellen Markenzeichen deines Charakters. Der Rest ist Rotation, um den Feed nicht repetitiv wirken zu lassen.
Negativ-Prompts, die wirklich funktionieren
Negativ-Prompts sind in SDXL und Flux essenziell, in Midjourney und Nano Banana 2 fast irrelevant geworden, weil deren neuere Modelle die typischen Artefakte intern unterdrücken.
SDXL: Der vollständige Negativ-Prompt-Stack
(deformed iris, deformed pupils, semi-realistic, cgi, 3d, render, sketch, cartoon, drawing,
anime:1.4), text, close up, cropped, out of frame, worst quality, low quality, jpeg
artifacts, ugly, duplicate, morbid, mutilated, extra fingers, mutated hands, poorly drawn
hands, poorly drawn face, mutation, deformed, blurry, dehydrated, bad anatomy, bad
proportions, extra limbs, cloned face, disfigured, gross proportions, malformed limbs,
missing arms, missing legs, extra arms, extra legs, fused fingers, too many fingers,
long neck, plastic skin, oversaturated, HDR look, watermark, signature, logo
Flux: Schlanker Negativ-Prompt
Flux braucht weniger. Die folgenden Tokens reichen meistens:
plastic skin, oversaturated, HDR look, deformed hands, extra fingers, watermark, signature,
text artifacts, cgi look, doll-like, waxy skin, over-smoothed
Midjourney: --no Parameter
Midjourney verwendet keinen klassischen Negativ-Prompt, sondern den --no Parameter:
[dein Prompt] --no plastic, watermark, signature, text, deformed hands, extra fingers,
oversaturated
Nano Banana 2 und Seedream 4: Natürliche Sprache
Diese Modelle reagieren am besten auf natürlichsprachliche Anweisungen im Hauptprompt:
[dein Prompt] — avoid plastic skin, doll-like look, extra fingers, oversaturated colors,
HDR appearance, watermarks, or visible text artifacts.
Warum Negativ-Prompts in neueren Modellen weniger wichtig werden
Wer 2023 mit Stable Diffusion 1.5 angefangen hat, hat Negativ-Prompts als die halbe Miete kennengelernt. Ohne sie war jedes zweite Bild deformiert. 2026 hat sich das geändert — und es lohnt, kurz zu verstehen, warum.
Neuere Modelle wie Flux, Nano Banana 2 und Seedream 4 wurden mit deutlich besser kuratierten Datensätzen trainiert. Klassische Artefakte (extra Finger, plastik-glatte Haut, schwimmende Pupillen) wurden in den Trainingsdaten gar nicht erst belohnt. Dazu kommt, dass diese Modelle auf Transformer-Diffusion-Architekturen aufbauen (DiT statt klassisches U-Net), die natürliche Sprache präziser interpretieren — ein „natural skin texture“ im Hauptprompt wirkt heute stärker als ein „no plastic skin“ im Negativ-Prompt.
SDXL bleibt die Ausnahme. Der Datensatz ist älter, das U-Net empfindlicher für entgleisende Generationen. Hier ist der Negativ-Prompt-Stack weiterhin Pflicht. Pony-Diffusion, RealisticVision und vergleichbare Forks verlangen sogar erweiterte Stacks mit eigenen Score-Tokens.
Die häufigsten Artefakte und ihre Gegenmittel
- Extra Finger / verformte Hände →
extra fingers, fused fingers, mutated hands, poorly drawn handsin Negativ. Oder Hände aus dem Frame nehmen (Crop bis zu den Handgelenken). - Plastik-Haut →
plastic skin, doll-like, over-smoothed, waxyin Negativ. Im Hauptprompt:natural skin texture, visible pores, subsurface scattering. - Tote Augen → Im Hauptprompt:
detailed iris with depth, catchlight in eyes, soft eye reflection. - Zu glatte/perfekte Gesichter → Im Hauptprompt:
slight asymmetry, natural beauty marks, soft skin imperfections. - Oversaturated Farben →
oversaturated, HDR lookin Negativ. Im Hauptprompt:Kodak Portra 400 film gradingodermuted natural tones. - Logos/Watermarks → Immer in Negativ:
watermark, signature, logo, text artifacts.
NSFW-Prompts: Was geht, was nicht
Eine ehrliche Übersicht. Wir geben hier keine NSFW-Prompts wieder — dafür ist der Flux Guide mit dem vollständigen NSFW-Workflow zuständig. Aber du solltest wissen, welche Modelle was zulassen.
| Modell | NSFW-Fähigkeit | Hinweise |
|---|---|---|
| Flux (self-hosted) | Ja, mit speziellen LoRAs | Komplett unzensiert auf der eigenen GPU. Der Standard für Pro-Workflows. |
| Flux (über fal/Replicate) | Eingeschränkt | Anbieter-Policies greifen. Manche Replicate-Endpoints sind permissiver. |
| SDXL (self-hosted) | Ja, mit speziellen Checkpoints/LoRAs | RealisticVision, Juggernaut, Pony — etablierte NSFW-Forks. |
| Qwen Image (self-hosted) | Ja, technisch möglich | Lizenzmodell erlaubt es. Community-LoRAs noch dünner als bei Flux. |
| Midjourney | Nein | Strenge Content-Policy, kein Workaround. |
| Nano Banana 2 | Nein | Google-Safety-Filter, harte Limits. |
| Seedream 4 | Nein | ByteDance-Filter, harte Limits. |
| Ideogram | Nein | Striktes Filter-System. |
| ChatGPT Image / DALL-E 3 | Nein | Bekannteste harte Limits. |
Wenn du auch nur leicht suggestive Inhalte (wie sie auf Instagram Standard sind) erstellen willst, solltest du auf Flux oder SDXL setzen — die anderen Modelle blocken oft schon bei „in lingerie“ oder „in a bikini on the beach“, wenn der restliche Prompt mehrdeutig wirkt. Für komplette OnlyFans-Workflows ist Flux + LoRA auf der eigenen GPU der etablierte Weg (Details im Flux Guide).
Schreib deinen eigenen Prompt: 10-Punkte-Checkliste
Du hast jetzt eine fertige Matrix. Aber irgendwann willst du eigene Prompts schreiben, die nicht in dieser Bibliothek stehen. Diese Checkliste ist das Framework dafür.
-
Beginn mit dem Subject. Alter, Geschlecht, prägende Merkmale. Beispiel: „24-year-old woman with shoulder-length auburn hair and freckles“.
-
Setze einen Aktivitäts-Anker. Was tut die Person gerade? „reading a paperback“, „flipping a pancake“, „tying her shoelace“. Anker reduzieren das Schaufensterpuppen-Gefühl.
-
Spezifiziere den Ort konkret. Nicht „in a café“ — sondern „in a Berlin Altbau café with dark wood interior and marble tables“. Spezifik produziert glaubwürdige Welt.
-
Definiere das Licht. Richtung + Qualität. „Soft afternoon light from the left“ ist tausendmal besser als „good lighting“.
-
Wähle eine virtuelle Kamera-Position. Close-up, medium shot, three-quarter body, full body, over-the-shoulder.
-
Wähle eine Brennweite. 35mm für Street-Style und Lifestyle, 50mm für natürliche Porträts, 85mm für Editorial-Porträts mit Bokeh, 135mm für extreme Bokeh-Looks.
-
Setze einen Style-Anker. „Shot on Kodak Portra 400“, „Polaroid SX-70 aesthetic“, „Hasselblad H6D“, „magazine editorial“ — diese Verweise auf reale Fotografie-Werkzeuge sind Stil-Kondensatoren.
-
Füge eine Stimmung hinzu. „Candid“, „confident“, „melancholic“, „playful“. Ein Wort, das die emotionale Temperatur setzt.
-
Schreibe den Negativ-Prompt. Mindestens:
plastic skin, oversaturated, watermark, extra fingers, deformed hands. Bei SDXL den vollständigen Stack. -
Iteriere mit Mini-Änderungen. Ändere zuerst nur eine Variable und beobachte, was passiert. So lernst du, wie dein Modell tickt. Wer 100 Prompts mit Mini-Änderungen schreibt, wird schneller besser als jemand, der 100 komplett unterschiedliche Prompts schreibt.
Ein letzter Tipp: Speichere alles
Lege dir eine eigene Prompt-Library an. Eine simple Tabelle (Spalten: Prompt, Modell, Seed, Outcome-Rating, Notizen) bringt nach zwei Monaten mehr Lerneffekt als jede AI-Influencer-Kurs-PDF für 99 Euro.
Und wenn du den Schritt von „ich teste Prompts“ zu „ich baue einen echten KI-Influencer mit konsistentem Feed“ gehen willst, starte hier: KI-Influencer erstellen — der vollständige Guide. Wer das richtige Modell auswählen will, bevor er Stunden in Prompt-Iteration investiert, sollte mit der Übersicht der 7 besten KI-Bildmodelle für AI Influencer starten — sie ordnet die Modelle nach Anwendungsfall und nimmt dir die Entscheidung ab.
Viel Erfolg. Und wenn dein erster Feed live geht: schick uns einen Screenshot. Wir lieben es zu sehen, was unsere Leser bauen.