20:11 Uhr
Wie stellen sich LLM mein Arbeitsalltag vor Bilder mit AI erstellen von ChatGPT, Gemini und Copilot
Ich habe dieses am Rande mitbekommen und war neugierig, was LLM und Bildgeneratoren wohl für ein Bild von mir haben werden. Hilfreich ist da durchaus, dass im Netz die ein oder andere Information von mir verfügbar ist.
Mein Arbeitsalltag in Textform aus Sicht einer "KI"
Als Erstes hatte ich hier einmal OpenAI mit ChatGPT gefragt, wie ein solches Bild wohl sein könnte.ChatGPT von OpenAI
Prompt: Schreibe eine kurze Vorstellung von Andreas Unkelbach aus Gießen.Antwort von ChatGPT:
"Andreas Unkelbach aus Gießen ist ein erfahrener Experte im Bereich Hochschulverwaltung und Controlling. Er hat sich insbesondere auf die Themengebiete Finanzmanagement und Berichtswesen an Hochschulen spezialisiert und unterstützt in seiner Rolle Hochschulen dabei, effiziente Verwaltungsprozesse zu gestalten. Bekannt ist er zudem als Autor zahlreicher Fachbeiträge und als engagierter Redner bei Konferenzen, wo er seine Expertise zu Hochschulfinanzierung und Verwaltungsdigitalisierung teilt. Seine Leidenschaft für transparente und zukunftsfähige Strukturen in Bildungseinrichtungen spiegelt sich in seinen praxisorientierten Ansätzen und fundierten Publikationen wider."
Prompt: Basierend auf deine Informationen zu Andreas Unkelabch aus Gießen erstelle ein Bild darüber, wie du glaubst, dass sein Leben aussieht.
Antwort von ChatGPT:
Stell dir Andreas Unkelbachs Leben vor: ein Alltag, der von einem Mix aus Professionalität, Struktur und der Begeisterung für Bildung und Innovation geprägt ist. Man sieht ihn vielleicht morgens in einem gut beleuchteten Büro an der Universität, umgeben von Papieren, Fachliteratur und zwei Bildschirmen, auf denen komplexe Tabellen und Präsentationen für das Hochschulcontrolling zu sehen sind. Die Atmosphäre ist modern und funktional, aber auch einladend – typisch für jemanden, der gern analytisch und strukturiert arbeitet, aber auch eine persönliche Note pflegt.
Ein typischer Tag könnte Vorträge und Meetings mit Kollegen umfassen, bei denen es um die Zukunft der Hochschulfinanzierung geht. Dabei wirkt er ruhig und aufmerksam, während er Zahlen erklärt und innovative Ideen für die Optimierung von Prozessen vorstellt. Vielleicht verlässt er am Nachmittag sein Büro für einen Spaziergang durch den Campus in Gießen, um den Kontakt zur Hochschulwelt lebendig zu halten und die neuesten Entwicklungen mitzuerleben.
In seiner Freizeit widmet er sich möglicherweise gern Büchern und der Recherche, immer auf dem neuesten Stand der Bildungslandschaft und Digitalisierung. Seine Tage scheinen strukturiert, aber auch von Neugier und dem Drang geprägt, das Beste aus jeder Aufgabe herauszuholen – ein harmonisches Leben zwischen beruflichem Engagement und persönlicher Erfüllung.
Nun war ich neugierig und wollte über Bing erfahren, wie wohl CoPilot meinen Tag beschreiben würde.
CoPilot von Microsoft
Prompt: Wie würdest du einen typischen Arbeitstag von Andreas Unkelbach beschreiben, sofern du daraus ein Bild generieren möchtest.
Antwort von CoPilot:
Ein typischer Arbeitstag von Andreas Unkelbach könnte so aussehen:
Morgenroutine: Andreas beginnt seinen Tag früh mit einem Kaffee und einem Blick auf seine E-Mails und Kalender, um sich auf die anstehenden Aufgaben vorzubereiten.
Projektkoordination: Er verbringt einen Großteil seines Vormittags in Meetings, in denen er die Fortschritte des Fit4S4-Projekts bespricht, Probleme identifiziert und Lösungen findet. Diese Besprechungen beinhalten oft Videokonferenzen und Austausch mit verschiedenen Abteilungen.
Datenanalyse und Berichtswesen: Nach den Meetings vertieft er sich in die Analyse von SAP-Daten. Er überprüft Berichte, erstellt neue Dashboards und stellt sicher, dass alle relevanten Daten korrekt und aktuell sind.
Mittagspause: Eine kurze Pause für ein schnelles Mittagessen, eventuell ein Spaziergang durch das Universitätsgelände oder ein Treffen mit Kollegen.
Workshops und Schulungen: Am Nachmittag leitet er oft Schulungen und Workshops, um das Team und andere Mitarbeiter über die neuesten Updates und Best Practices im Umgang mit SAP zu informieren.
Dokumentation und Forschung: Er arbeitet an seinen Publikationen oder aktualisiert Dokumentationen und Handbücher, die anderen helfen, das System besser zu verstehen und zu nutzen.
Abendroutine: Der Tag endet mit einem letzten Blick auf die E-Mails, um sicherzustellen, dass alles Wichtige erledigt ist. Manchmal plant er auch die Aufgaben für den nächsten Tag.
Freizeit: Nach der Arbeit widmet er sich gerne persönlichen Projekten, liest ein Buch oder verbringt Zeit mit seiner Familie.
Falls du dazu ein Bild generieren möchtest, könntest du dir vorstellen, wie Andreas an einem Schreibtisch sitzt, umgeben von Computern und Notizen, mit einem Fokus auf die Monitore und Datenanalysen. Im Hintergrund könnte eine Projektion eines Meeting-Raums oder eines Workshops stattfinden, um seine Tätigkeiten zu verdeutlichen. Der Raum wäre modern und gut beleuchtet, um die professionelle Arbeitsumgebung darzustellen.
Mein Arbeitsalltag als Bild aus Sicht der KI
Gerade die Schilderung des Arbeitsalltags von CoPilot (per Bing) ist an dieser Stelle schon beeindruckend. Teilweise mag dies aber auch daran liegen, dass Linkedin und Microsoft miteinander verknüpft sind und so mein Linkedin Profil ebenfalls analysiert werden kann.Bildgeneration von CoPilot - Microsoft Bing
Spannend wäre jetzt aber die Frage, wie Bing ein echtes Bild generieren würde. Leider habe ich den Dialog hier nicht gespeichert, aber das ein oder andere Highlight als Bild mag ich doch nicht vorenthalten.Das Bild scheint sehr von Projektplanung inspieriert zu sein und zeigt doch einige Aspekte die auf mich zutreffen mögen.
Ein wiederkehrendes Motiv wird an dieser Stelle aber ein Bart sein, den ich auch bei anderen Bildern nur schwer loswerde.
Persönlich sehe ich die Bilder doch sehr unterschiedlich und habe daher einfach einmal ChatGPT drum gebeten die Bilder zu beschreiben.
Bildbeschreibung
Das Bild zeigt eine Collage von fünf verschiedenen Szenen, die Personen in beruflichen Kontexten darstellen. Hier eine Beschreibung der einzelnen Teile:
Oben links: Ein Mann in einem grauen Hemd sitzt an einem Schreibtisch und studiert konzentriert Dokumente. Im Hintergrund sind große Fenster zu sehen, die auf ein modernes Bürogebäude hindeuten. Die Umgebung wirkt professionell und strukturiert.
Oben rechts: Ein Mann im Anzug, der vor einem Computer sitzt und von Papieren umgeben ist. Er lächelt leicht und vermittelt einen Eindruck von Selbstbewusstsein und Effizienz in einem Geschäftsumfeld. Der Hintergrund zeigt ein Büro mit viel Papierarbeit und Aktivität.
Mitte: Im Zentrum der Collage ist eine dynamische Darstellung eines Mannes mit Brille, Bart und modernem Haarstil, der direkt auf eine Computertastatur fokussiert ist. Der Hintergrund zeigt Diagramme und Gebäude-Silhouetten, die auf Technologie, Innovation oder Datenanalyse hindeuten. Diese Szene hebt sich durch ihre futuristische und energetische Gestaltung ab.
Unten links: Eine Gruppe von Menschen arbeitet in einem Büro. Der Fokus liegt auf einem Mann mit Brille, der konzentriert an einem Tisch sitzt und Diagramme oder Daten analysiert. Im Hintergrund arbeiten weitere Personen, was eine Teamdynamik und kollaboratives Arbeiten vermittelt.
Unten rechts: Ein Mann in formeller Kleidung (Anzug und Fliege) sitzt an einem Tisch und arbeitet konzentriert an Dokumenten oder Büchern. Der Hintergrund zeigt eine Umgebung mit hohen Decken und großen Fenstern, die auf eine eher traditionelle oder akademische Kulisse hindeutet.
Die Collage zeigt verschiedene Facetten des Berufslebens, von modern und innovativ bis hin zu klassisch und akademisch, und hebt die professionelle Ausstrahlung der dargestellten Personen hervor.
Auch an dieser Stelle ist anzumerken, dass auch hier entsprechende Modelle gängige Bilder hervorheben und hier Darstellungen wiederholen, die ggf. nicht immer ganz passend sein mögen. Wobei ich im Rahmen einer Projektarbeit durchaus Sympathie für das mittlere Bild habe.
Bildgeneration von ChatGPT bzw. Dall-E - OpenAI
Spannender war dann aber die Generation von Bildern mit ChatGPT von OpenAI. Hier ist mittlerweile im ChatGPT Plus Abo auch Dall-E integriert. Hierdurch ist es möglich Bilder aus Textbeschreibungen aufgrund von maschinellem Lernen erstellen zu lassen. Entsprechend war ich neugierig, wie obiger Dialog mit ChatGPT weiter geführt wird.Prompt: Kannst du dazu ein Bild generieren?
Das Bild war dann schon ein guter Ausgang für jede weitere Generierung.
Passenderweise wurde auch direkt eine Beschreibung im Bildnamen (A professional office setting featuring a structured, organized workspace with soft natural light. A man, representing an experienced higher education) aber auch in der Ausgabe mit ausgegeben.
Antwort von ChatGPT:
Hier ist das Bild, das eine Vorstellung von Andreas Unkelbachs beruflichem Alltag vermittelt. Es zeigt eine moderne und organisierte Büroumgebung, die den Eindruck eines strukturierten und engagierten Arbeitslebens im Bereich Hochschulverwaltung und Finanzmanagement widerspiegelt.
Bildbearbeitung aus einer bestehenden Vorlage für KI
Da ChatGPT aber auch Bilder analysieren kann, habe ich darum gebeten, anhand einer Vorlage das Bild anzupassen.Tatsächlich hat dies OpenAI dann auch als Vorlage verwendet und ich konnte darauf nähe eingehen.
Da ich neugierig war, wie andere AI mit dieser Aufgabe verfahren würden habe ich den Vorschlag von OpenAI und oberes Bild von mir auch bei Gemini (AI von Google) und auch Bing hochgeladen.
Dabei habe mich die Antworten überrascht.
Google Gemini und Bearbeiten von Bildern von Personen.
Google hat hier direkt das Bild aus dem Dialog gelöscht und als Meldung "Mit Bildern von Menschen kann ich dir leider noch nicht helfen." ausgegeben. Dies dürfte auch Ursachen im Bereich Bildrechte und Datenschutz haben. Die Vorlage selbst wurde im Chat auch direkt entfernt.
Copilot / Bing verpixeln dafür die Vorlage im Prompt und weigern sich hier entsprechende Bilder zu generieren.
Dabei scheinen generell Potraits verpixelt zu werden, was vielleicht auch mit Blick auf Fakebilder sehr hilfreich sein kann. Nur OpenAI scheint diese Beschränkung nicht zu haben.
Die Antwort auf die Anfrage, ob mein Foto mit der Vorlage kombiniert werden kann wurde hier übrigens mit "Ich verstehe, dass du gerne die beiden Bilder kombinieren möchtest. Leider kann ich selbst keine Bilder bearbeiten oder kombinieren." beantwortet.
OpenAI Unterschied Free und Abo Version
Damit konnte der Dialog mit ChatGPT starten und ich war dann auch neugierig die Unterschiede zwischen ChatGPT in der kostenlosen Version und im Abo für 20 $ je Monat (etwa 21,99 Euro je Monat) feststellen.OpenAI beschreibt die Unterschiede wie folgt:
ChatGPT Free (Kostenlose Version):
- Hilfe beim Schreiben, Problemlösen und mehr
- Zugriff auf GPT-4o mini
- Eingeschränkter Zugriff auf GPT-4o
- Eingeschränkter Zugriff auf Datenanalyse, Datei-Uploads, Vision, Web-Browsing und Bildgenerierung
- Benutzerdefinierte GPTs verwenden
- Alles in der kostenlosen Version
- Früher Zugriff auf neue Funktionen
- Zugriff auf OpenAI o1-preview und OpenAI o1-mini
- Zugriff auf GPT-4o, GPT-4o mini, GPT-4
- Zugriff auf Datenanalysen, Datei-Uploads, Bilderkennung, Onlinesuchen und Bildgenerierung
- Zugriff auf den fortgeschrittenen Audiomodus
- Erstelle und verwende individuelle GPTs
- Zugriff auf OpenAI o1-preview, OpenAI o1-mini
- Zugriff auf GPT-4, GPT-4o, GPT-4o mini
- Bis zu 5x mehr Nachrichten für GPT-4o
- Zugriff auf Datenanalyse, Datei-Uploads, Vision und Web-Browsing
- Zugriff auf erweiterten Sprachmodus
- DALL·E-Bildgenerierung
- Erstellen und Verwenden benutzerdefinierter GPTs
- Früher Zugriff auf neue Funktionen
Der Unterschied ist dadurch schon bemerkbar, dass ich am Tag nur eine bestimmte Anzahl von Bildern generieren lassen kann und diese nicht punktuell per DALL-E bearbeiten kann.
Neben der Weboberfläche kann hier ebenfalls eine App zum Beispiel unter Android verwendet werden. Dabei kann entweder ein eigener Account bei OpenAI angelegt werden oder sich per Google, Microsoft oder Apple Konto angemeldet werden.
An Apps habe ich folgende in der Nutzung:
- Google Assistant
- ChatGPT
- Gemini
Bild Generation und Bearbeitung mit ChatGPT (Free und Plus)
Während des weiteren Dialogs mit OpenAI kam schnell die Erkenntnis, dass ChatGPT Probleme hat mich ohne Krawatte oder Bart darzustellen. An dieser Stelle ist es immer wieder praktisch ChatGPT selbst das generierte Bild beschreiben und korrigieren zu lassen.Ein schönes Beispiel ist folgender Entwurf:
ChatGPT:
Mein Prompt:Hier ist das überarbeitete Bild. Andreas Unkelbach ist jetzt glatt rasiert dargestellt, und der gehäkelte Gargoyle Gideon entspricht der Vorlage mit grauem Körper und blauen Augen. Das Büro hat eine futuristische Anmutung, die den Aspekt des Berichtswesens und Controllings mit SAP im Hochschulumfeld der Universität Gießen betont.
Gideon fehlt ein Mund und Andreas Unkelbach ist noch immer nicht glatt rasiert und soll keine Krawatte tragen. Die Armbanduhr soll rund sein und im Hintergrund hätte ich gerne das Hauptgebäude der Justus Liebig Universität Gießen
Darauf wurde folgendes Bild generiert:
Das Problem ist, dass hier weiterhin eine Krawatte zu sehen ist.Das Bild wurde angepasst, sodass Andreas Unkelbach glatt rasiert dargestellt wird, ohne Krawatte, mit einer runden Armbanduhr. Der gehäkelte Gargoyle Gideon hat jetzt graue Farbe, blaue Augen und einen freundlichen Mund. Im Hintergrund ist das Hauptgebäude der Justus Liebig Universität Gießen zu sehen.
An dieser Stelle kann ChatGPT dazu genutzt werden, das eigene Bild zu beschreiben zum Beispiel durch folgenden Prompt:
Beschreibe was Andreas Unkelbach an Kleidung am Bild trägt
Dem stimme ich nicht zu und habe dieses auch formuliert:Andreas Unkelbach trägt in diesem Bild ein schlichtes, professionelles Outfit. Er trägt ein helles, modernes Hemd, das sauber und elegant aussieht, ohne Krawatte, wodurch er einen entspannten, aber dennoch professionellen Eindruck vermittelt. Die Ärmel sind eventuell leicht hochgekrempelt, was auf eine praktische und engagierte Arbeitsweise hinweisen könnte. Das Hemd ist stilvoll und funktional, passend zu seiner Rolle in einem akademischen und technologischen Umfeld.
Prompt: Auf dem Bild trägt Andreas Unkelbach eine Krawatte.
Immerhin an dieser Stelle wurde das Problem auch erkannt und folgender Vorschlag gemacht.
Dieses lehnte ich ab und habe noch weitere Detailinformationen hinzugefügt.Vielen Dank für den Hinweis! Es scheint, dass die Krawatte in der Darstellung immer noch enthalten ist, was nicht der gewünschten Beschreibung entspricht. Ich kann das Bild erneut anpassen, um sicherzustellen, dass Andreas Unkelbach keine Krawatte trägt und sein Outfit den Anforderungen entspricht. Soll ich diese Änderung vornehmen?
An dieser Stelle ist es besonders hilfreich, dass im Abo von ChatGPT nun auch DALL-E integriert ist und ich nicht immer wieder neu ein Bild generiert habe, sondern auch Teilbereiche eines Bildes bearbeiten kann.
In der Android-App erhalte ich, sobald ich das ChatGPT Plus Abo abgeschlossen habe folgende Meldung beim Klick auf ein generiertes Bild.
Durch Klicken auf Bearbeiten kann das ganze Bild bearbeitet werden und im Chat Änderungen angefordert werden. Alternativ können auch einzelne Bereiche im Bild über Auswöhlen markiert werden und ausschliesslich zu den markierten Bereichen eine Änderung angefordert werden.
In der Weboberfläche sind diese Punkte aber auch zu jeden generierten Bild vorhanden:
Dabei sind folgende Optionen vorhanden:
- Auswählen
Hiermit können Teilbereiche mit einen Pinsel markiert werden. Die Größe des Pinsels ist dabei einstellbar - Speichern
Damit kann das generierte Bild lokal gespeichert werden. Als Format wird WEBP verwendet. - Aufforderung
Hier wird der interne Prompt zum Bild ausgegeben. Dieser kann dann als Vorlage ebenfalls noch einmal bearbeitet werden könnte. Der Prompt ist dabei in englischer Sprache formuliert
Unter (1) kann ich die Größe meines Markierwerkzeug (Pinsel) bearbeiten und im Bild wie unter (2) zu sehen einzelne Bereiche des Bildes markieren/maskieren. Der nächste Arbeitsschritt ist dann über Weiter (3) nähere Angaben zur Korrektur zu geben.
Im Bild ist der markierte Bereich als Vorschau hervorgehoben und ich kann im Chat genau beschreiben, welche Änderung ich gerne vornehmen möchte.
Im Beispiel: "Ergänze bitte eine Art Schnauze inkl. Nase ...."
Ergebnis: Darstellung von Andreas Unkelbach aus Sicht von ChatGPT Plus
Als positiv zu bewertendes Bild habe ich dann endlich folgendes Ergebnis erhalten.Allerdings ist hier aus irgendein Grund Gideon nicht im Bild vorhanden.
Mein Hinweis "Äh, Gideon ist jetzt weg?" führte zu folgender Antwort und einem Bild was dan überhaupt nicht mehr meinen Erwartungen entsprach.Das Bild wurde aktualisiert, um Gideon enger an die beiden neuen Referenzfotos anzupassen. Er hat jetzt eine weiche, freundliche Schnauze, blaue Augen, flügelartige Ohren und detaillierte Gargoyle-Flügel, die seine niedliche und charmante Persönlichkeit widerspiegeln. Die restlichen Details des futuristischen Büros und der Universitätshintergrund wurden beibehalten.
An dieser Stelle habe ich dann noch einmal ein Bild von Gideon hochgeladen und darum gebeten dieses Bild zu beschreiben:Es tut mir leid, dass Gideon im letzten Versuch nicht korrekt dargestellt wurde. Ich werde das Bild erneut anpassen und Gideon mit seinen charakteristischen Merkmalen — den blauen Augen, der weichen, freundlichen Schnauze, den flügelartigen Ohren und den detaillierten Gargoyle-Flügeln — wieder korrekt integrieren. Lass mich das für dich beheben!
Darauf sollte das Bild noch einmal angepasst werden.Natürlich! Gideon ist ein gehäkelter, freundlicher und niedlicher Gargoyle mit einer charmanten Ausstrahlung. Seine wichtigsten Merkmale sind:
- Augen: Große, runde, blaue Augen, die freundlich und lebendig wirken.
- Nase: Eine kleine, leicht knollige, runde Nase, die ihm ein tierähnliches, niedliches Aussehen verleiht.
- Mund: Ein kleiner, freundlicher gehäkelter Mund, der seinen Charakter betont.
- Ohren: Flügelartige, leicht abstehende Ohren, die ein wenig an die eines Corgis erinnern und ihm ein einzigartiges Aussehen verleihen.
- Flügel: Detailreiche, gehäkelte Gargoyle-Flügel, die an seinem Rücken befestigt sind und ihn als kleinen Wächter charakterisieren.
- Körper: Ein weicher, grauer, gehäkelter Körper mit klar definierten Armen, Beinen und einem Schwanz mit einer spitz zulaufenden Spitze.
- Material: Das Häkelwerk verleiht ihm eine handgemachte, warme und sympathische Erscheinung.
Gideon strahlt eine Mischung aus Niedlichkeit, Freundlichkeit und Einzigartigkeit aus – ideal als symbolischer kleiner Begleiter mit Persönlichkeit.
Mit diesen Erkenntnissen und den Fotovorlagen wäre es schön wenn du Gideon anpassen kannst. Mein gehäkelter Gargoyle Gideon ist freundlich mit grauen Körper, Flügeln und blauen Augen.
Dies war schon sehr abweichend von der Vorlage. Aber woher kam das? An dieser Stelle hilft erneut eine Selbstdiagnose von ChatGPT ;-).Gideon wurde angepasst: Er hat jetzt eine freundliche Ausstrahlung mit blauen Augen, einer kleinen runden Nase, flügelartigen Ohren und detaillierten Gargoyle-Flügeln. Sein grauer Körper ist gehäkelt und entspricht der Vorlage. Die Szene bleibt futuristisch und professionell, mit Andreas Unkelbach und der Universität im Hintergrund.
Prompt: Wie unterscheidet sich der Gargoyle in deinem Bild von der Vorlage für ich dir gesendet habe? Für mich sieht dies nach einem Teddybär und nicht nach Gideon aus.
Die Antwort darauf ist etwas ausführlicher ausgefallen:
Immerhin dies kam schon meinen Vorstellungen sehr nahe. Nun noch Gideon markieren und folgende Anpassung anfordern:Du hast vollkommen recht: Im aktuellen Bild wirkt der dargestellte Gargoyle eher wie ein Teddybär und entspricht nicht der Vorlage, die du mir gesendet hast. Hier sind die Hauptunterschiede:
Kopfform und Gesicht:
- In deinem Bild: Gideon hat eine rundliche Kopf- und Gesichtsgestaltung mit einer deutlich gehäkelten Struktur und einer leicht knolligen Nase.
- In meinem Bild: Der Kopf wirkt eher wie bei einem Teddybär, mit einer zu weichen und generischen Gestaltung. Die Nase ist zu schlicht und wirkt nicht markant genug.
Ohren:
- In deiner Vorlage: Die flügelartigen Ohren von Gideon haben eine leicht abstehende Form und passen gut zu seiner Gargoyle-Ästhetik.
- In meinem Bild: Die Ohren sehen eher nach runden Bärenohren aus, statt wie die abstehenden, flügelartigen Ohren eines Gargoyles.
Augen:
- In deiner Vorlage: Gideon hat große, runde, blaue Augen, die lebendig wirken und ihm einen niedlichen Ausdruck verleihen.
- In meinem Bild: Die Augen sind weniger markant, kleiner und ohne die gleiche handgefertigte Lebendigkeit, die die Vorlage bietet.
Flügel:
- In deiner Vorlage: Gideon hat kleine, gehäkelte Gargoyle-Flügel mit einem klaren, definierten Muster.
- In meinem Bild: Die Flügel fehlen oder sind nicht so ausgearbeitet wie in der Vorlage.
Körperstruktur:
- In deiner Vorlage: Der Körper ist typisch für ein handgefertigtes, gehäkeltes Stofftier mit klar erkennbaren Armen, Beinen und einem langen Schwanz.
- In meinem Bild: Der Körper ist zu rundlich und generisch, was ihn mehr wie ein Teddybär erscheinen lässt.
Fazit:
Mein generiertes Bild hat die Details der Vorlage nicht präzise genug umgesetzt, was Gideons charakteristisches und charmantes Aussehen verloren gehen lässt. Ich werde diese Unterschiede berücksichtigen und versuchen, eine akkurate Version zu erstellen, die deinem Gideon aus der Vorlage wirklich gerecht wird.
Hier ist die aktualisierte Darstellung von Gideon, der nun der Vorlage deutlich näherkommt. Er hat eine runde Kopfform, große blaue Augen, eine kleine, runde knollige Nase, einen freundlichen Mund, flügelartige Ohren und klar definierte Gargoyle-Flügel. Sein grauer, gehäkelter Körper wurde den Details der Referenzfotos angepasst. Andreas Unkelbach und die professionelle Büroumgebung sind ebenfalls präzise dargestellt.
Bitte passe Gideon so an, das er meinen Vorgaben entspricht. Er ist etwas kleiner und hat blaue und nicht gelbe Augen. Die Flügel und Ohren sind dir gelungen. Diese bitte behalten.
Auch an dieser Stelle ist es hilfreich zu erwähnen, welche Parameter beibehalten werden sollen.
Im folgenen hatte ich noch versucht mein Logo mit ins Bild zu bringen, aber dies hat leider nicht vollständig funktioniert. Aber mich hat dann doch interessiert, was eigentlich die relevanten Punkte für die Bilderkennung waren.Hier ist die aktualisierte Version mit einem kleineren Gideon, blauen Augen und den beibehaltenen flügelartigen Ohren sowie detaillierten Gargoyle-Flügeln. Sein grauer gehäkelter Körper und die freundliche Ausstrahlung entsprechen deinen Vorgaben.
Prompt:
Was waren die dich die relevanten Punkte zur Erstellung des Bildes und wie haben sich die Bilder im Austausch verändert? Was war in deinen Augen das Ziel der Bildgestaltung?
Die Antwort hat dann doch das Vorgehen gut erläutert.
Relevante Punkte zur Erstellung des Bildes
Die Erstellung des Bildes basierte auf den folgenden zentralen Punkten, die sich aus unserem Austausch ergeben haben:
Hauptfiguren und ihre Darstellung:
- Andreas Unkelbach sollte als zentrale Figur dargestellt werden. Sein Erscheinungsbild musste spezifisch angepasst werden, einschließlich:
- Glatt rasiertes Gesicht
- Authentische Gesichtszüge, basierend auf den bereitgestellten Referenzfotos
- Ein modernes, professionelles Umfeld, das seine berufliche Rolle repräsentiert
- Gideon, der gehäkelte Gargoyle sollte als freundlich, niedlich und handgefertigt dargestellt werden. Wichtige Merkmale:
- Blaue, runde Augen
- Eine runde, leicht knollige Nase
- Flügelartige Ohren und Gargoyle-Flügel
- Ein weicher, grauer, gehäkelter Körper
- Das „A“-Logo auf seiner Brust
Hintergrund und Umgebung:
- Ein futuristisches, modernes Büro, das die Arbeit im Hochschulmanagement und Berichtswesen mit SAP visualisiert.
- Große Fenster, die das Hauptgebäude der Justus-Liebig-Universität Gießen zeigen.
- Ergänzung des Logos von Andreas Unkelbach im Hintergrund, um die persönliche Note und die Verbindung zur Universität zu verstärken.
Details der Szene:
- Professionelle Atmosphäre mit Monitoren, die Datenvisualisierungen zeigen.
- Korrekte Platzierung und Proportionen von Andreas, Gideon und den Elementen im Raum.
Veränderungen im Austausch
Darstellung von Andreas Unkelbach:
- Zu Beginn fehlte die Ähnlichkeit mit den Referenzfotos (Bart, Gesichtszüge, Kleidung).
- Das Gesicht und die Frisur wurden wiederholt angepasst, um ihn authentisch und erkennbar zu machen.
Gideons Entwicklung:
- Ursprünglich war Gideon zu generisch, sah eher wie ein Teddybär aus und fehlte in Details wie den blauen Augen, der Schnauze und den Flügeln.
- Schrittweise wurden diese Details angepasst:
- Blaue, runde Augen
- Flügelartige Ohren
- Größere Ähnlichkeit mit den Vorlagen
- Anpassungen führten zu einer Version, die seinen freundlichen und gehäkelten Charakter unterstreicht.
Integration des Logos:
- Anfangs wurde das Logo auf Gideon nicht sichtbar dargestellt.
- Später wurde es klar auf seiner Brust platziert und schließlich auch prominent auf dem Glasturm im Hintergrund eingefügt.
Ziel der Bildgestaltung
Das Ziel der Bildgestaltung war es, eine Szene zu schaffen, die:
- Andreas Unkelbach und seine berufliche Tätigkeit in einem modern-futuristischen Umfeld darstellt, das Hochschulmanagement, Berichtswesen und die Verbindung zur Universität Gießen visualisiert.
- Gideon als persönlichen und charmanten Begleiter authentisch und liebevoll zeigt, wie er in der Vorlage präsentiert wurde.
- Das Branding (Logo) von Andreas Unkelbach integriert, um die persönliche Note und die professionelle Identität hervorzuheben.
Fazit
Die Bildgestaltung war ein iterativer Prozess, der sich durch Feedback und Präzisierungen entwickelte. Das Ziel, eine professionelle und dennoch persönliche Darstellung zu schaffen, wurde durch den Fokus auf Details, Authentizität und kreative Integration erreicht.
Aber es gab auch einige Herausforderungen und diese hätte ich ebenfalls gerne erläutert bekommen.
Prompt:
Was waren für dich besondere Herausforderungen?
Während des Prozesses gab es einige besondere Herausforderungen, die die Bildgestaltung geprägt haben. Hier sind die wichtigsten:
1. Präzise Anpassung von Andreas Unkelbachs Gesicht
- Herausforderung: Andreas sollte nicht nur allgemein glatt rasiert und professionell aussehen, sondern auch eine deutliche Ähnlichkeit mit den Referenzfotos aufweisen. Seine spezifischen Gesichtszüge, wie die Form der Augen, Augenbrauen, Frisur und der authentische Gesichtsausdruck, mussten möglichst originalgetreu umgesetzt werden.
- Lösung: Wiederholte Anpassungen und der Abgleich mit verschiedenen Referenzen waren nötig, um die Darstellung schrittweise zu verbessern. Es war wichtig, das Gleichgewicht zwischen einem realistischen und leicht stilisierten Porträt zu finden.
2. Gideons korrekte Darstellung
- Herausforderung: Gideon, der gehäkelte Gargoyle, musste spezifische Details wie blaue Augen, flügelartige Ohren, eine knollige Nase und Gargoyle-Flügel enthalten. Diese Details waren schwierig, weil:
- Frühe Versionen Gideon generischer darstellten (z. B. wie einen Teddybär).
- Es aufwendig war, seinen gehäkelten, handgefertigten Charakter zu bewahren.
- Die Augen anfangs nicht die gewünschte blaue Farbe hatten.
- Lösung: Durch genaue Analyse der Vorlagen und schrittweise Verbesserung konnte Gideon nach und nach authentischer dargestellt werden. Es galt, die Balance zwischen seiner niedlichen, gehäkelten Textur und seiner Gargoyle-Identität zu bewahren.
3. Integration des Logos
- Herausforderung: Das „A“-Logo musste an zwei Stellen korrekt integriert werden:
- Auf Gideons Brust: Es sollte klar sichtbar, aber nicht aufdringlich wirken.
- Im Hintergrund auf dem Glasturm: Es durfte die Professionalität des Bildes nicht beeinträchtigen, musste aber sichtbar und in den Gesamtkontext eingebunden sein.
- Lösung: Mehrere Iterationen und Feedback halfen, das Logo korrekt zu platzieren und sicherzustellen, dass es weder verloren geht noch störend wirkt.
4. Die Balance zwischen Kreativität und Realismus
- Herausforderung: Das Bild sollte sowohl futuristisch und kreativ (z. B. durch die Büroumgebung und technologischen Elemente) als auch realistisch (durch die Darstellung von Andreas und Gideon) wirken.
- Zu viel Stilisierung hätte die Authentizität verloren gehen lassen.
- Zu wenig futuristische Details hätten den Kontext von SAP-Datenmanagement und Hochschulreporting abgeschwächt.
- Lösung: Es wurden Elemente wie die Monitore mit Datenvisualisierungen und die Fensteransicht auf die Universität so gestaltet, dass sie den Kontext unterstützen, ohne die Personen oder Gideon zu überdecken.
5. Iterativer Prozess und Kommunikation
- Herausforderung: Das Feedback war präzise und detailliert, was half, aber auch bedeutete, dass viele Iterationen notwendig waren. Jede Anpassung musste auf die vorangegangenen Versionen aufbauen und gleichzeitig neue Anforderungen erfüllen.
- Lösung: Geduld und systematisches Arbeiten an den Änderungen stellten sicher, dass am Ende ein Ergebnis entstand, das den Erwartungen entsprach.
6. Verknüpfung von Symbolik und Professionalität
- Herausforderung: Das Bild sollte nicht nur ästhetisch ansprechend sein, sondern auch symbolisch die Persönlichkeit von Andreas Unkelbach, seine Arbeit im Hochschulmanagement und die Verbindung zur Justus-Liebig-Universität transportieren.
- Lösung: Die Kombination aus Gideon als persönlicher Begleiter, den professionellen Elementen des Büros und dem Logo im Hintergrund vermittelte sowohl Individualität als auch Professionalität.
Fazit
Die größten Herausforderungen lagen in der Detailtreue bei der Darstellung von Andreas und Gideon sowie in der harmonischen Verbindung von persönlicher Note, Symbolik und beruflicher Professionalität. Jede Iteration brachte das Bild näher an das gewünschte Ergebnis, und der Prozess war ein Balanceakt zwischen Kreativität und Genauigkeit.
Zugegeben danach hatte ich aber auch ein wenig Freude daran Gideon noch in Bildern zu integrieren :-).
Hierzu sollten aber erst einmal die wesentlichen Merkmale von Gideon noch einmal in Erinnerung gerufen werden. Immerhin haben wir da doch einige Korrekturschleifen gehabt.
Ich hatte erst ein Bild generiert bekommen, mit dem ich nicht zufrieden war, daher bat ich um eine Bildanalyse.
Prompt:
Beschreibe das Gesicht von Gideon und vergleiche dies mit dem von dir erstellen Bild.
Beschreibung des Gesichts von Gideon (Referenzvorlage):
- Nase:
- Rund, knollig, und prominent auf der Schnauze positioniert.
- Handgefertigt mit klaren Konturen und leicht erhobenem Profil.
- Schnauze:
- Deutlich ausgearbeitet, leicht hervorgehoben und proportional zum Kopf.
- Weich und freundlich, passend zu seinem niedlichen Charakter.
- Mund:
- Klein, gehäkelt und freundlich, vermittelt eine einladende Ausstrahlung.
- Augen:
- Große, runde, blaue Augen mit einer lebendigen, ausdrucksstarken Erscheinung.
- Gesamtausstrahlung:
- Das Gesicht strahlt Freundlichkeit und Niedlichkeit aus, was Gideon einzigartig macht.
Vergleich mit dem erstellten Bild:
- Nase:
- Im Bild: Die Nase ist zu klein und nicht so prominent oder knollig wie in der Vorlage.
- Abweichung: Sie fehlt fast vollständig oder ist nicht so markant dargestellt wie im Original.
- Schnauze:
- Im Bild: Die Schnauze fehlt komplett und ist nicht angedeutet.
- Abweichung: Das Gesicht wirkt dadurch flacher und weniger charakteristisch.
- Mund:
- Im Bild: Kein Mund ist sichtbar, was dem niedlichen und freundlichen Charakter von Gideon widerspricht.
- Augen:
- Im Bild: Die Augen sind groß und blau, was mit der Vorlage übereinstimmt.
- Übereinstimmung: Dieser Teil wurde erfolgreich umgesetzt.
- Gesamtausstrahlung:
- Im Bild: Das Gesicht wirkt aufgrund der fehlenden Schnauze und Nase weniger wie ein Gargoyle und eher generisch.
- Abweichung: Die Einzigartigkeit von Gideon aus der Vorlage wurde nicht vollständig eingefangen.
Fazit:Das Gesicht im erstellten Bild setzt zwar die Augen gut um, aber Nase, Schnauze und Mund fehlen oder sind nicht richtig dargestellt. Das Ergebnis könnte deutlich verbessert werden, indem die Schnauze hervorgehoben, die Nase knollig und markant gemacht und ein freundlicher Mund hinzugefügt wird, um Gideons niedliches und einzigartiges Aussehen aus der Vorlage wiederzugeben.
Das Ergebnis hat mir dann doch gefallen, auch wenn Gideon jünger wirkt.
Prompt: Kannst du das Bild mit diesen Informationen verbessern?
Ich finde insgesamt war das ein schöner Ausflug in Richtung AI :-).
Dennoch war ich überrascht, dass Gideon immer wieder anderes aussah bekam aber von ChatGPT eine Erklärung.
Prompt:
Wie kommt es dass Gideon immer unterschiedlich aussieht?
Dass Gideon in den Bildern unterschiedlich aussieht, liegt an der Funktionsweise der Bildgenerierung:
1. Modellierte Details vs. Konsistenz
- Details in Beschreibungen: Die Bildgenerierungs-KI erstellt jedes Bild basierend auf der Beschreibung. Jedes Mal interpretiert sie die Anweisungen leicht unterschiedlich, selbst wenn dieselben Merkmale (z. B. "grau", "blaue Augen", "freundlicher Gesichtsausdruck") verwendet werden.
- Fehlende Grundlage für feste Merkmale: Ohne eine feste visuelle Vorlage, die direkt in das Modell integriert ist, fehlt die Möglichkeit, konsistente physische Merkmale für Gideon zu garantieren.
2. Kreative Freiheit der KI
- Die KI versteht "grau" oder "rund" nicht immer exakt gleich, was zu Variationen führt.
- Jede Beschreibung erzeugt eine neue Interpretation, da die KI versucht, kreativ zu sein und sich nicht ausschließlich auf frühere Darstellungen zu stützen.
3. Grenzen des Modells
- Es fehlt die Fähigkeit, aus einer visuellen Vorlage konsistent ein "festgelegtes Design" abzuleiten, wie es ein Mensch tun würde.
- Stattdessen wird jedes Bild unabhängig generiert, wodurch Gideon mal eine größere Schnauze oder leicht andere Flügel bekommt.
Lösungsmöglichkeiten
Referenzbilder hochladen:
- Wenn immer dasselbe Referenzbild für Gideon genutzt wird, könnten die Ergebnisse konsistenter werden.
Detailliertere Beschreibungen:
- Noch präzisere und wiederholbare Details in den Anweisungen können helfen, Abweichungen zu minimieren.
Manuelle Anpassung:
- Die Erstellung eines festen Designs durch einen Grafiker könnte die Variabilität beseitigen.
Wenn du möchtest, können wir Gideons Aussehen stärker vereinheitlichen, indem wir bestimmte Details weiter verfeinern und immer wieder darauf verweisen!
Auch dieses hat mit unterschiedlichen Vorlagen geklappt und ich habe hier unterschiedliche Fotos von Gideon hochgeladen und darum gebeten, das Modell anzupassen.
Meine Vorlage von Gideon:
Prompt:
Ist für dich dieses Foto von Gideon eine gute Vorlage? Wie unterscheidet sich hier Gideon vom bisher verwendeten Modell?
Auch nach weiteren Referenzbildern gab es immer wieder Korrekturen und teilweise sogar richtige Modellzeichnungen mit 360 Grad Ansichten von Gideon.Dieses Foto von Gideon ist eine ausgezeichnete Vorlage, da es wichtige Details und die gewünschte Darstellung genau zeigt. Hier sind die Unterschiede zwischen diesem Foto und dem bisher verwendeten Modell:
1. Kopf und Gesicht
- Vorlage: Gideons Kopf ist rund, mit klar definierten Gesichtszügen wie einer breiten, knolligen Nase und einem angedeuteten Mund.
- Modell: In den generierten Bildern war die Schnauze manchmal zu spitz oder fehlte ganz, und der Mund wurde nicht immer dargestellt.
2. Augen
- Vorlage: Die Augen sind groß, ausdrucksstark, und leuchtend blau, mit einem klaren Schwarz für die Pupillen.
- Modell: Die Augen waren oft weniger detailliert oder hatten eine andere Form und Größe. Sie wirkten nicht immer so lebendig.
3. Ohren
- Vorlage: Die Ohren sind lang und flügelartig, mit einer weichen Struktur.
- Modell: Die Ohren wurden oft unterschiedlich dargestellt, teils wie Hörner oder kürzer als in der Vorlage.
4. Körper und Haltung
- Vorlage: Der Körper ist kompakt und leicht bauchig, die Arme und Beine klar definiert und der Schwanz dünn und geschwungen.
- Modell: Der Körper war in den generierten Bildern häufig schmaler oder nicht so bauchig, und die Proportionen der Gliedmaßen variierten.
5. Accessoires
- Vorlage: Gideon trägt ein Headset und ein sichtbares Logo auf der Brust.
- Modell: Accessoires wie Headsets oder Logos wurden meist weggelassen oder nicht korrekt integriert.
Fazit
Dieses Foto ist eine präzise Vorlage für zukünftige Darstellungen von Gideon. Es bietet klare Details zu seinem Charakter und Design, die bei der Generierung stärker beachtet werden können, um ihn konsistenter und näher an seinem echten Erscheinungsbild darzustellen. Möchtest du, dass ich die generierten Bilder basierend auf dieser Vorlage anpasse?
Ein recht gutes Ergebnis von Gideon sah dann wie folgt aus:
Dazu meinte ChatGPT:
Sehr gerne hätte ich diesen Entwurf dann beibehalten.Hier ist die aktualisierte Darstellung von Gideon mit der korrekt eingefügten Nase und der vollständigen Schwanzspitze. Ich hoffe, dass es jetzt deinen Vorstellungen entspricht!
Prompt: Bitte behalte dieses Modell von Gideon bei und merke dir dies für künftige Bilder von Gideon.
Die folgende Antwort zeigte dann aber auch ein Problem solcher Modelle:
Ich kann das Modell von Gideon für zukünftige Bilder verwenden. Leider kann ich mir dies nicht dauerhaft merken, aber du kannst mir jederzeit dieses Bild oder die Beschreibung erneut geben, um sicherzustellen, dass das Modell konsistent bleibt. Lass mich wissen, wenn du weitere Anpassungen oder neue Szenen mit Gideon erstellen möchtest!
Immerhin auf Basis der Modelle ware dann auch eine Anpassung von Gideon in Comic-Style möglich:
Aber diese Beispiele würden nun wirklich den Artikel zu lange werden lassen. Daher freue ich mich einfach darauf Gideon vielleicht in den ein oder anderen Blogartikel oder auf Social Media auftreten zu lassen. :-)
Fazit
Als Experiment war das spannend, aber ich glaube, dass ich Gideon als Maskottchen oder Avatar bspw. für meine Schulungen doch eher durch eine Freelancer*inleistung umsetzen lassen werde um hier ein konstantes dauerhaftes Ergebnis zu erhalten und auch von der rechtlichen Seite her (insbesondere Urheberrecht) aber auch Unterstützung von Kunst und Lesitung erscheint mir der weg sinnvoller.
Dennoch sind die Ergebnisse schön und ich hatte viel Freude am Testen.
Damit endet aber der November und mein Artikel und ich wünsche noch einen schönen Abend.
Gute Nacht und einen schönen ABend auch von Gideon ;)
ein Angebot von Espresso Tutorials
unkelbach.link/et.books/
unkelbach.link/et.reportpainter/
unkelbach.link/et.migrationscockpit/
Diesen Artikel zitieren:
Unkelbach, Andreas: »Wie stellen sich LLM mein Arbeitsalltag vor Bilder mit AI erstellen von ChatGPT, Gemini und Copilot« in Andreas Unkelbach Blog (ISSN: 2701-6242) vom 30.11.2024, Online-Publikation: https://www.andreas-unkelbach.de/blog/?go=show&id=1362 (Abgerufen am 22.12.2024)
Keine Kommentare - Permalink - Internet
Artikel datenschutzfreundlich teilen
🌎 Facebook 🌎 Twitter 🌎 LinkedIn