Workflow Vorbereitungen:
Zunächst wurde eine Definition des Charakters erstellt und im Chat von ChatGPT-4 hinterlegt:
An ChatGPT > "Erzeuge eine detaillierte Charakterbeschreibung für die Figur Gia, wie im hinterlegten Dokument beschrieben."
Das Ergebnis:
Charakterbeschreibung: Gia
Name: Gia
Wohnort: Hamburg, Deutschland
Beruf: Wissensarbeiterin
im technischen Umfeld (genauer Beruf offen für Interpretation, z.B.
IT-Consultant, Entwicklerin, oder Tech-Journalistin)
Äußeres Erscheinungsbild
Gia ist Ende 20 bis Mitte 30, mit einem modernen, urbanen Stil, der
Funktionalität und Individualität verbindet. Ihre Kleidung spiegelt oft
ihre Affinität zur Technik und zur Natur wider – ein Mix aus sportlich
und praktisch, häufig mit Rucksack oder Messenger-Bag, in dem sich
stets ihr Laptop, ein Notizbuch und diverse Gadgets befinden. Ihre
Ausstrahlung ist aufmerksam, lebendig und stets einen Hauch ironisch.
Persönlichkeit
Gia ist hochintelligent, neugierig und selbstbewusst. Sie besitzt einen
trockenen Humor und eine charmante Art, mit alltäglichen technischen
Hürden umzugehen. Sie nimmt Herausforderungen als kreative Spielwiese
wahr – ob es um das knifflige Lösen eines IT-Problems oder das
Durchsteigen bürokratischer Prozesse geht. Dabei bleibt sie stets
ruhig, lösungsorientiert und erfrischend pragmatisch. Gia ist
reflektiert, aber nicht verkopft – sie handelt intuitiv und mit einem
klaren inneren Kompass.
Fähigkeiten und Interessen
Rolle in Geschichten
Gia ist die ideale Protagonistin für moderne, lebensnahe Geschichten
mit einem Augenzwinkern – ob in Cartoons, Kurzgeschichten oder
animierten Clips. Sie steht sinnbildlich für die junge, selbstbestimmte
Generation, die mit Technologie groß geworden ist, sie aber nicht blind
verehrt. Ihre Stärke liegt nicht nur in ihrem Wissen, sondern auch in
ihrer Fähigkeit, Menschlichkeit und Technik miteinander zu verbinden –
stets mit einer guten Portion Humor.
Weitere Schritte
Um künftig die Konsistenz des Charakters in mehreren generierten
Bildern zu gewährleisten wurden danach diverse Stylesheets nach der
Beschreibung erzeugt.
An ChatGPT > "Erzeuge bitte ein Stylesheet von Gia als Cartoon Entwurf mit verschiedenen Ansichten"
An ChatGPT > "Bitte ein weiteres Stylesheet in dem Gia in verschiedenen Stimmungen ist."
Später wurden weitere Stylesheets für div. Tätigkeiten und Perspektiven erstellt.
An dieser Stelle haben wir uns dann entschieden von der kommerziellen ChatGPT Version zu dem selbsthostbaren FLUX.1-dev von ForestLabs zu wechseln.
Als weitere Vorbereitung wurden im nächsten Schritt die verschiedenen
Ansichten, Perspektiven in Einzelbilder aufgeteilt so dass diese als
Input für das FluxGym Programm vorlagen. Dieses Programm erzeugt eine "LORA" die zu der LLM Flux.dev über die Entwicklungsoberfläche ComfyUI hinzugeladen werden kann, um den Charakter konsistent zu halten.
An dieser Stelle waren die Vorbereitungen soweit abgeschlossen.
Mit dem ComfyUI-Workflow FLUX.1-dev wurden dann über einen Command Prompt die eigentlichen Bilder erzeugt.