KI – Künstliche Intelligenz: Mach mal die Spieß

Pixar-style KI Midjourney v5

KI - Helferleins oder Teufelszeug?

Diese Dinger sind ja seit einiger Zeit in aller Munde: Egal, ob es um ChatGPT, dem Chatbot von OpenAI geht, mit dem man sich unterhalten kann, der auch Fragen beantworten und z. B. bei Textformulierungen helfen kann, oder ob es die Bild-KI sind, die grad wie Schwammerl aus der Erde sprießen.

Anfangs war ich ja skeptisch. Die Abklärung bzgl. Urheberrechte ist recht schwammig. Und als Kreativ-Kopf fühlt man sich ein klein wenig auf den Schlips getreten. Maschinen übernehmen unsere Jobs? Kann das sein? Ich versteh die Angst von vielen. Und genau deshalb wollt ich’s mir mal ansehen. Ich seh sie nicht als Konkurrenz, sondern vielleicht sogar als mögliches Werkzeug für diverses kreatives Zeugs. Ich probier gern mal was Neues aus und wollte wissen, was die Dinger können. Also, los geht’s.

Mein Start mit Midjourney

Willkommen in der Welt der prompts. So, und jetzt sitz ich vor Discord, hab Midjourney aktiviert und überleg, was ich machen könnte. Ich starte mit etwas einfachem. „german shepherd, happy“ – Nicht mehr und nicht weniger. Keine genauen Spezifikationen, das Ergebnis ist also sehr zufällig. Aber trotzdem: 

KI generiert - Midjourney v4 / Happy German Shepherd

Die Ergebnisse mag ich. Naja, gut, ich mag Schäferhunde, und ich mag, wenn sie fröhlich sind. Ich mag auch, dass der erste mit seiner übergroßen Nase ein bissl witzig aussieht und an einen Hund aus einem Animationsfilm erinnert. 

Was könnt ich noch machen? Was soll der Maschinen-Künstler noch für mich auswerfen? Ich hab nur ein paar Gratis-Credits und noch keinen Tau, für wie lange die reichen. 

Zu dem Zeitpunkt war ich „auf der Jagd“ nach einem Foto eines Silberreihers, den ich bei unseren morgendlichen Gassirunden zweimal gesehen hab. Vor die Kamera wollte er jedoch nicht wirklich, hat sich im Schilf versteckt oder ist weggeflogen, als ich ihm wohl etwas zu nah gekommen bin. Danach hab ich ihn nicht mehr gesehen. (Bis heute nicht.) Irgendwann hab ich mir gedacht „Was tust du denn grad, lieber Reiher, wenn du nicht hier bist?“ – Danke. Damit war eine kleine Idee geboren. 

Ein Silberreiher, der sich grad anderweitig die Zeit vertreibt. Beim Yoga mit einem Kumpel, in einer Bar, an einer anderen Stelle im Schilf, oder auch selbst beim Fotografieren mit seiner eigenen Kamera. Also, Midjourney, zeig, was du kannst. 

 

Kann sich ja sehen lassen. Ich hab bei den drei Einzelbildern nochmal mit Photoshop Hand angelegt, aber nicht wirklich viel korrigiert. Das wär schon auch ohne gegangen. Aber ich bin halt ein Photoshop-Fuzzi 😉

Die Claudschi von KI generiert

Und jetzt will ich’s wissen. Wie sieht’s aus, wenn ich mich selbst „kreieren“ lass? Klar, die Angabe dafür muss etwas genauer sein. Ich versuch’s mal mit: „40-year-old woman with roundish face, smiling, dark hair, chin-length bob, glasses with brown frames, blue hoodie, sitting by a desk, looking into the screen of her PC, colourful pens, a sketchpad and a cup of coffee lying on the table“ – Jaja, ich bin keine 40 mehr, aber alles drüber zeigt dann doch ältere Versionen von mir, die mir gottseidank noch nicht entsprechen 😉

Aber was ich dann sehe, sind fremde Menschen. Ja, die Angaben wurden übernommen. Aber nix davon sieht mir wirklich ähnlich. Wäre ja auch ein Zufall gewesen, es gibt natürlich unzählige mögliche Ergebnisse. Ich könnte das immer und immer wieder eingeben, bis vielleicht mal ein Treffer dabei wäre, der mir ähnlich sieht. 

Portraits / Midjourney v5

Ich könnte eventuell noch die Angaben verfeinern, um näher dran zu kommen, aber trotzdem gibt es immer noch extrem viel Interpretationsspielraum für die KI. Ich bin auch keine Bedienungsanleitungs-Leserin. Ich mach einfach drauflos. Außerdem fehlt mir grad die Lust dazu, mich in die Spezifikationen der prompts einzulesen, um alles ein wenig steuerbarer zu machen. Ich könnte das Ganze noch in Photoshop bearbeiten, um aus den Bildern was zu machen, das mir ähnelt. Aber auch dazu fehlt mir die Lust. 

Also, versuch ich’s mit mehr oder weniger übertriebenen Styles. Styles, bei denen es vielleicht keine Rolle mehr spielt, einen genauen Treffer zu landen, sondern nur ein paar grobe Inhalte gut passen müssen, damit man das Ergebnis mit mir verbinden könnte. 

Niji

„Niji“ ist ein eigener Modus in Midjourney, mit dem man Bilder im Anime- und Manga-Stil erstellen kann. Das probier ich gleich mal als erstes. Die Angabe bleibt unverändert. Los, Niji!

Aaaaw, sehr herzig. Und ja, es ist, wie ich dachte. Da könnte ich gleich mal vier davon nehmen, die mir irgendwie ähneln, weil es eben vom Stil her gar nicht nach einem akkuraten Abbild verlangt. Schön find ich auch, dass die KI versteht, dass Kaffee sehr wichtig ist und mir auf einigen Bildern zwei oder drei Tassen davon schenkt 😉

Kurz: Eine nette Möglichkeit. Aber ich will mehr.

Anime

Und wieder: Selbe Angabe, nur mit dem Zusatz „anime-style“. Und ja, mittlerweile hab ich ein Abo. 😉

Ja, die Ergebnisse sind erstaunlich, auch wenn kein wirklicher Volltreffer dabei ist. Aber de KI schenkt mir immer noch gerne etwas mehr Kaffee ein 😉 Doch generell bin ich kein allzu großer Anime-Fan. Also weiter… 

Pixar

Wieder dieselbe Angabe, nur mit dem Zusatz „pixar-style“.
Midjourney, bitte versau das nicht, ich bin Pixar-Fan.

Oh bitte. Auch, wenn da ein paar sind, die eigentlich so gar nicht passen, sind wiederum ein paar Ergebnisse dabei, die ich sofort übernehmen würd. Und ja, die Figuren hier kommen einem vor, als hätte man sie schon in irgendeinem Film gesehen. 
Teilweise gibt’s Fehler. Beispielsweise, wenn Gegenstände von Händen gehalten werden. Hände sind ja auch so ein Thema, aber mit Version 5 hat Midjourney da ordentlich nachgelegt und vieles verbessert. Davor war das teilweise richtig grauslich anzusehen.

Marvel

(An dieser Stelle Engelsgesang vorstellen) Ich mag Marvel. Extrem. Der Stil hat einfach was sehr Lässiges. Und ich war sehr neugierig, wie ich „marvellisiert“ aussehen würde. Also, Midjourney, dann bemüh dich mal. 

Nicht übel. Gefällt mir. Also, einige davon. Nicht alles. Und ein oder zwei könnt ich auch ein bisschen in Richtung „ja, so in etwa seh ich aus“ deuten, wenn auch die Trefferquote nicht allzu groß ist. Und da geht’s jetzt nicht darum, welche Leistung Midjourney hier generell abliefert, denn das ist wirklich sagenhaft. Sondern mir ging’s da wirklich darum, ob die KI es schafft, „mich“ zu generieren, wo sie mich ja nicht kennt und nur auf eine kleine Beschreibung von mir mögliche Ergebnisse erstellt. Da müsste ich wohl noch weitere Durchläufe probieren, bis es zufällig mal passt, oder eben mit Photoshop ran. 

Wobei…  – EIN ERGEBNIS war dabei, das fast hinhaut. Und das hab ich dann mit Photoshop noch verfeinert:

Ich hab nicht viel gemacht. Die Haarfarbe angepasst, die Gesichtsform korrigiert und ein klein wenig Volumen angefügt. Außerdem hab ich den Stift aus dem Kaffeehäferl wegretuschiert. Ich trink Kaffee mit Milch, aber bitte nicht mit Tinte oder Graphit 😉 

Man kann durchaus eine Ähnlichkeit erkennen. Als ich mir das fertige Bild angesehen hab, war es mir fast zu ähnlich, und damit fand ich’s sogar etwas langweilig. Nicht falsch verstehen, ich find mich selbst nicht langweilig. Aber ich mag vielleicht doch eher absurdere Ergebnisse als solche, die der Realität dann doch sehr nah kommen.  

Werden Künstliche Intelligenzen Kreative ersetzen?

Insgesamt ist es erstaunlich, was Midjourney raushaut. Ich glaube allerdings nicht, dass es in Sparten wie der Fotografie oder auch im Grafikdesign die echte Handarbeit ablösen wird. Denn grundsätzlich gehört, finde ich, auch hier noch ein Quentchen von gestalterischem Verständnis und Wissen dazu, um mit Hilfe der KI etwas wirklich Schönes zu erschaffen, das dann auch noch der eigenen Idee entspricht und nicht nur ein Zufallsergebnis abbildet. Vielleicht bin ich aber auch nur sagenhaft naiv?

Wenn ich von mir ausgehe, dann will ich meine Foto-Ideen mit der Kamera umsetzen und nicht mit Tastatur und Internet (außer der Reiher lässt sich weiterhin nicht blicken). Habe ich eine Design-Idee, dann kritzel ich auf Papier x mögliche Ideen, bis sich herauskristallisiert, in welche Richtung es gehen wird. Ich möchte das gar nicht anders. Ob andere das anders handhaben, weiß ich nicht. Zum Teil sicher, jeder Workflow eines jeden Kreativen ist sein eigener. Ob man sich von diversen Quellen wie Pinterest, Instagram oder Bilddatenbanken inspirieren lässt oder sich die Inspiration durch KI holt – ich persönlich sehe da keinen Unterschied. Man hat eine Idee und geht verschiedene Wege, um ans Ziel zu kommen. Am Ende ist und bleibt es seine eigene Idee, seine eigene Erschaffung.

Und es eröffnet vielen, die sich vielleicht gern etwas künstlerisch oder kreativ ausdrücken wollen, aber mit Pinsel, Stift oder auch Grafiktablett auf dem Kriegsfuß stehen, trotzdem aber gute Ideen haben, neue Möglichkeiten. Ich denke auch, dass es sich um eine Ergänzung oder um einen neuen Zweig handeln wird. 

Es ist wie mit allem: Es gibt Menschen, die das gut finden oder auch nicht. „Digital Art, und dann noch von einer KI? Nein, danke, ich lass lieber einen Profi-Illustrator ran“ oder aber „Spannend, was XY da durch Eingabe von einigen Begriffen erschaffen hat.“ – Schauen wir mal, wo es uns hinführt. Ich für meinen Teil behalt mein Midjourney-Abo mal noch und warte gerade sehnsüchtig auf die Adobe KI Firefly. 😉 (Update 26.03.2023: Ich hab’s! Ich hab den Zugang zur Beta-Version bekommen und werd mal ein bisserl rumprobieren)

Aber um die Frage vom Anfang zu beantworten. Ich find, die diversen KI sind beides: Helferleins UND Teufelszeug 😉

Und wird schwindeln nun salonfähig?

Ja klar, der Fake-Landschaft wird hier grad massivst in die Hände gespielt. Von „Fake“ würde ich allerdings nur dann sprechen, wenn tatsächlich KI-generierte Bilder als angeblich echte Fotografien veröffentlicht werden. 

Da gibt’s diese Geschichte von diesem Instagram-Nutzer Jos Avery, der zahlreiche Portraits postete und mit keiner Silbe erwähnt hat, dass diese von einer KI erschaffen wurden. Klar – mit seiner Eingabe. Aber es waren schlicht keine echten Fotos, da war niemals eine Kamera im Spiel. – Das seh ich etwas kritisch. Er hat dann irgendwann, als er einen Haufen Follower hatte, „gebeichtet“, dass es KI-Bilder sind. Und das hat ihm nicht nur Bewunderung eingebracht. Mittlerweile ist in der Profil-Beschreibung angeführt, dass es sich um „AI, photos, digital art“ handelt. 

Schwierig wird’s, wenn es tatsächlich um Fakes geht wie z.B. beim angeblichen Kniefall Putins vor Xi Jinping. Oder auch bei der „Serpens Catus“, der angeblichen Schlangenkatze aus dem Amazonas-Gebiet. Hier wurde das Bild mittels KI erstellt, ein anderer Nutzer hat’s dann verbreitet und sich eine witzige Geschichte dazu überlegt, und schon ging das Ding viral. Und ja, viele sehen nicht so kritisch hin und glauben, was sie sehen. – Und ich denk, damit werden wir uns in Zukunft öfters mal herumschlagen dürfen. Aktuell gibt’s noch einige Hinweise oder verräterische Details in diversen KI-Bildern. Aber die Dinger werden immer besser, lernen dazu, und dann… puha. 

Outtakes

Was ich euch nicht vorenthalten will, sind Ergebnisse, die ich als „Outtakes“ bezeichnen würde, was zum Teil noch schmeichelhaft ist. Andere Bild-KI haben sich vielleicht bemüht, sollten aber noch ein wenig üben. – Hier also meine Favoriten in Sachen „Griff ins Klo“:

Auch hier hab ich dieselbe Angabe wie bei Midjourney verwendet. Vielleicht funktionieren andere Bild-KI einfach anders? Ich weiß es nicht, denn auch hier hab ich drauf verzichtet, eine Anleitung zu lesen. Vielleicht sind sie aber auch für andere Themen besser geeignet, evtl. hauen die Bilder raus, die von Van Gogh stammen könnten. Ich weiß es wirklich nicht. Aber immerhin war es erheiternd. Danke auch dafür 😉

"Künstliche Intelligenz ist wie ein Haustier - es hört nie auf, dich zu überraschen, aber hoffentlich pinkelt es nicht auf deinen Teppich."