Das große AI Bildermalbuch

Hierbei ist es schwierig der AI durch Text eine entsprechende Choreografie zu beschreiben, die sie dann Fehlerfrei umsetzen soll...

Ich hab mich bis jetzt nur mit Stable Diffusion befasst, dort ist das recht simpel und man hat eh die Möglichkeit, sehr viel mehr Parameter zu beeinflussen als in den gängigen Website/Discord-Modellen.

Aber sicherlich gibts auch für andere Modelle Möglichkeiten, bestimmten Textbausteinen gewünschte Gewichtungen zu geben und/oder diese vom Rest zu isolieren, um sie unabhängig vom restlichen Prompt zu behandeln?

Ich "rede" aber auch nicht mit der KI - ich würde nie anfangen mit "create an image" oder irgendwas in der Art. Wenn ich eine Bildgerenerierungs-KI nutze, kann die eh nix anderes. Stichworte, kurz, knapp, aufs wesentliche reduziert. Sortiert, beginnend mit Handlung oder Motiv, dann Umgebung etc, Stil/Medium, Kameraperspektive, Bildstimmung. Und was noch so einfällt. Dann der negative Prompt und fertig.
 
Ich hab mich bis jetzt nur mit Stable Diffusion befasst, dort ist das recht simpel und man hat eh die Möglichkeit, sehr viel mehr Parameter zu beeinflussen als in den gängigen Website/Discord-Modellen.

Aber sicherlich gibts auch für andere Modelle Möglichkeiten, bestimmten Textbausteinen gewünschte Gewichtungen zu geben und/oder diese vom Rest zu isolieren, um sie unabhängig vom restlichen Prompt zu behandeln?

Ich "rede" aber auch nicht mit der KI - ich würde nie anfangen mit "create an image" oder irgendwas in der Art. Wenn ich eine Bildgerenerierungs-KI nutze, kann die eh nix anderes. Stichworte, kurz, knapp, aufs wesentliche reduziert. Sortiert, beginnend mit Handlung oder Motiv, dann Umgebung etc, Stil/Medium, Kameraperspektive, Bildstimmung. Und was noch so einfällt. Dann der negative Prompt und fertig.
Stable Diffusion hatte ich bislang unmittelbar bei mir noch nicht installiert und kennen ich nur mittelbar über imaginer. Da gibt es aber nicht so viele Möglichkeiten der Nachbearbeitung. Die Unterschiede in der "Programmiersprache" weichen von Midjourney und DALLE 3 z.b. auch ein wenig ab. Wenn ich ein Motiv mit Kamera Parametern, Handlung, Stimmung, Licht und Stiel generieren möchte gelingt dass mir der Trennung. Bei mehreren Interaktionen verschiedener Objekte untereinander habe ich bei DALL E3 die Erfahrung gemacht, dass es stimmiger dargestellt wird, in einem umständlich lange verschachtelten Satz, als in Einzelsätzen, die dann nicht mehr richtig in den Zusammenhang gebracht werden, was sich in der Ausgabe zeigt. Es benötigt da Geduld und experimentieren. Werde mir bei Gelegenheit auch noch Fachliteratur diesbezüglich durchlesen.
 
@noir. Wie würdest Du die Interaktionen von Post #182 und #183 beispielsweise mit Stable Diffusion darstellen in mehreren Sätzen ohne Nachbearbeitung und Quatsch/Unstimmigkeiten?
 
Armer Igor....
Wenn Ihr so weiter macht, muss Igor sein Sicherungskonzept überdenken und ausbauen... ;)
Einige Bilder sind aber sehr schön anzuschauen... :)
 
Armer Igor....
Wenn Ihr so weiter macht, muss Igor sein Sicherungskonzept überdenken und ausbauen... ;)
Einige Bilder sind aber sehr schön anzuschauen... :)
PASTOR kompatible Bilder hatte ich ja erwähnt, einige Ergebnisse hatte ich auch zensiert und nur privat gepostet. Die meisten gar nicht...'

Etwas Satire und Selbstironie, so dachte ich mir, kann helfen das Unbehagen besser zu verstoffwechseln, dazu haben mich Igors 5000PS Bilder inspiriert.
 
@noir. Wie würdest Du die Interaktionen von Post #182 und #183 beispielsweise mit Stable Diffusion darstellen in mehreren Sätzen ohne Nachbearbeitung und Quatsch/Unstimmigkeiten?

Ganz ehrlich: Keine Ahnung, solche Romane in den Prompt wie Du da in #182 hab ich in das Ding noch nie reingeschmissen bzw auf solche Ideen wäre ich nicht gekommen. Und Mangels eines Checkpoints, der Mortal Kombat, AMD und Nvidia kennt, kanns ich nicht mal ausprobieren / nachstellen.
 
_d052479d-19fe-4c7c-814b-33a8599500bd.jpeg
_2d1257af-3025-4132-930c-404cc64ed7ac.jpeg
_b5af38f8-b630-4b20-8a22-1ed88c2237cf.jpeg
 
Ganz ehrlich: Keine Ahnung, solche Romane in den Prompt wie Du da in #182 hab ich in das Ding noch nie reingeschmissen bzw auf solche Ideen wäre ich nicht gekommen. Und Mangels eines Checkpoints, der Mortal Kombat, AMD und Nvidia kennt, kanns ich nicht mal ausprobieren / nachstellen.
Mit DALLE 3 geht das, mit Stable Diffusion wird es komplizierter, ich werde es aber mal vai Imaginer mit Stable Diffusion Engine versuchen.

PS. Ich muss mich auch merkwürdig artikulieren damit DALLE 3 die gewünschten Resultate liefert. Das kann 20 und mehr Eingaben zuvor erfordern um Fehler in der Umsetzung zu erkennen und dann umzuformulieren. Mit einfachen Objekten, Interaktionen, cameraparametern, Belichtun, Atmosphäre, Stiel... Ist es simpler ein gewünschtes Ergebnis zu erzielen. Aber gerade ein Sirtaki bei dem die Knie drei unterschiedlicher Personen mit verschiedenen Brands in selbige Richtung zeigen, dann Zufall oder komplizierter.
 
_d669a89d-c0aa-4ab5-92e2-20ed8296ba58.jpeg
 
_0202adb5-04d6-486f-823e-a3eb489bd8b4.jpeg
Davon hätte ich gerne ein, zwei Stück.
 
_b874392f-f2a8-485d-a1c0-d6c305cd31db.jpeg
 
Oben Unten