Künstliche Intelligenz zum Ausprobieren

Diese KI-Tools helfen Ihnen beim Übersetzen, im Garten – und beim Flirten

Wir stellen 15 Programme vor, die Inhalte erzeugen, mit Ihnen interagieren und Sie im Alltag unterstützen. Finden Sie heraus, was heute technisch möglich ist – und was nicht.

Matthias Schüssler

So stellt sich Dall-E einen träumenden Computer vor.

Viele Techunternehmen machen sich den KI-Rummel zunutze und bewerben neue oder auch schon etwas ältere Produkte als «künstlich intelligent». Was das konkret heisst, sehen Sie hier in unserer Übersicht: Diese Dienste können Sie ausprobieren, produktiv nutzen und die Grenzen hochgezüchteter Algorithmen ausloten.

Dall-E: Kunst auf Zuruf

Der Grund für den derzeitigen KI-Hype sind vor allem die Systeme, die anhand einer kurzen Textbeschreibung eine Illustration oder eine fotorealistische Grafik erzeugen. Eines der eindrücklichsten Produkte ist Dall-E 2: Es setzt auch komplexe, aus mehreren Punkten bestehende Anforderungen bildhaft um. Bei der Anmeldung erhalten Sie 50 Credits, die Sie für eigene Experimente einsetzen. Wenn Sie mehr benötigen, erwerben Sie Credits für um die 13 US-Cent pro Credit – 115 Credits kosten z. B. 15 Dollar.

Openai.com/dall-e-2: Faszinierend und einfach zu verwenden: 🧠🧠🧠🧠 von fünf

Das Bundeshaus in Bern aus Schokolade, vor dessen Tore sich Banker versammeln – das war die Aufgabe für dieses KI-Kunstwerk.

Stable Diffusion: Die KI selbst betreiben

Stable Diffusion erzeugt Bilder anhand von Textbeschreibungen, und die Software ist in der Lage, bestehende Bilder zu modifizieren: Mit dieser zweiten Methode lassen sich grobe Skizzen in fotorealistische Bilder umrechnen. Anders als fast alle anderen Produkte aus diesem Bereich läuft diese Software nicht in der Cloud, sondern lässt sich als Open-Source-Programm auf dem eigenen Computer betreiben.

Die Installation der Original-Software ist technisch anspruchsvoll. Es gibt aber pflegeleichte Varianten, die von Drittanbietern bereitgestellt werden: Für den Mac ist das Diffusion Bee (diffusionbee.com), für Windows NMKD Stable Diffusion GUI (nmkd.itch.io/t2i-gui). Achtung: Diese Software braucht in jedem Fall eine leistungsfähige Grafikkarte und viel Arbeitsspeicher, um ihre Arbeit zu verrichten.

Technisch anspruchsvoll, aber ideal für Bastler und Cloud-Verweigerer: 🧠🧠🧠

Midjourney: Den Bilderbot zum Arbeiten bringen

Midjourney ist eine weitere Anwendung, die aus Texten Bilder generiert. Die Anwendung ist mehr als krude: Von der Midjourney-Website werden Sie an Discord weitervermittelt. Das ist eine Kommunikationsplattform, auf der sich vor allem Gamer treffen. In Discord suchen Sie einen Anfänger-Raum auf, zum Beispiel «Newbies-115». Hier geben Sie als Erstes den Befehl «/imagine» ein. Mit dem aktivieren Sie den Midjourney-Bot, dem Sie auf der gleichen Zeile Ihren Bilderwunsch vortragen.

Midjourney.com: Seltsame Benutzerführung, doch fast schon poetische Bilder: 🧠🧠🧠

So malt der Midjourney-Bot sich selbst: Das ist das Resultat der Aufgabe, ein Selbstporträt anzufertigen.

Neuroflash: Die Textmaschine, die sich alles zutraut

Neuroflash nennt sich «die magische Feder». Es handelt sich um ein Autorenwerkzeug, das über 80 Disziplinen beherrscht: Es kann aufgrund einiger Stichwörter einen Werbetext schreiben, sich eine reisserische Schlagzeile ausdenken, längere Texte zusammenfassen oder komplizierte Texte so vereinfachen, dass sie für einen Zweitklässler verständlich sind, oder die Tonalität eines vorhandenen Stücks verändern. Wie unser ausführlicher Text zeigt, sind die Resultate nicht immer grammatikalisch einwandfrei und nicht so präzise, wie wenn ein wortgewandter Mensch sie verfasst hätte. Das Rationalisierungspotenzial liegt auf der Hand.

Neuroflash.com: Die Software basiert auf der bekannten GPT-3-Engine und arbeitet auf Deutsch: Sie dürfen bis 2000 Wörter pro Monat kostenlos generieren lassen. Nicht perfekt, aber nützlich: 🧠🧠🧠

Deepl.com: Der Übersetzer mit Sprachgefühl

Vor fünf Jahren hat Deepl für Furore gesorgt: Das sei der erste ernstzunehmende digitale Übersetzer, haben wir damals geurteilt. Seitdem hat er sich noch verbessert: Er unterscheidet zwischen förmlicher (Sie) und informeller Anrede (du), übersetzt Office-Dokumente unter Beibehaltung aller Formatierungen und berücksichtigt ein Glossar, das festlegt, wie bestimmte Wörter und Redewendungen übersetzt werden sollen.

Deepl.com: Für kurze Texte kostenlos, für intensive Nutzung gibt es ein Abo ab 6 Euro pro Monat. Manchmal sind die Übersetzungen perfekt, manchmal braucht es noch etwas Politur: 🧠🧠🧠🧠🧠

Language Tool: Mehr als nur eine dröge Rechtschreibkorrektur

Orthografiefehler sind nicht die einzigen Irrtümer, die einem als Autorin oder Autor unterlaufen. Language Tool ist darauf getrimmt, auch Grammatikfehler und Fehler bei der Satzkonstruktion zu erkennen. Nicht nur das: Die Software liefert auch eine Stilberatung, indem sie allzu saloppe Formulierungen anprangert oder darauf auf Wiederholungen oder immer gleiche Redewendungen hinweist.

Languagetool.org: Für kürzere Texte kostenlos, den vollen Funktionsumfang gibt es mit Abo für 69.90 Franken pro Jahr. Dieser Lektor entdeckt viele Fehler, aber es ist unübersehbar, dass das digitale Sprachgefühl auch immer wieder zu kurz greift: 🧠🧠🧠

Picture This: Der allwissende digitale Garten-Assistent

Picture This bietet Unterstützung für Leute, die ihren Garten mit mehr Leidenschaft als Fachkenntnis unterhalten: Die App erkennt um die 10’000 Pflanzenarten, liefert botanische Hintergrundinformationen und klärt über die Bedürfnisse bezüglich Sonnenlicht, Wärme, Boden und Wasser auf. Sie diagnostiziert bei ungesunden Pflanzen sogar mögliche Ursachen und gibt Tipps zur Pflege. Der Pflanzenfinder verrät, welche Sorten unter den gegebenen Umständen die grössten Überlebenschancen haben.

Für iPhone und Android: Die App macht penetrante Werbung fürs Abo (29 Franken im Jahr), doch für Gelegenheitsnutzer erfüllt sie auch beim kostenlosen Einsatz ihren Zweck. Wie zielsicher die App per Kamera Pflanzen erkennt und umgehend die passenden Tipps liefert, ist eindrücklich: 🧠🧠🧠

Die Picture-This-App benennt Pflanzen und weiss, wie man sie zum Blühen bringt.

Zwitschomat: Shazam für Vogelgezwitscher

Zwitschomat ist die App, die immer dann zum Zug kommt, wenn eine unbekannte Vogelstimme ans Ohr dringt. Wie die bekannte Musik-Erkennungs-App Shazam nimmt sie während einiger Sekunden den Ton übers Mikrofon auf, führt dann eine Analyse durch und liefert das Resultat: Falls die App sich sicher ist, gibt es einen klaren Treffer. Ansonsten erhalten wir mehrere Vorschläge, die wir anhand der mitgelieferten Aufnahmen mit unserem Vogel vergleichen können.

Fürs iPhone,4 Franken. Die Treffsicherheit der Erkennung steht und fällt mit der Qualität der Aufnahme, die wir leider meist nicht beeinflussen können: 🧠🧠

Trint: Texte ab Audio-Aufnahmen transkribieren

Wer Aufnahmen von längeren Interviews oder Gesprächen nicht selbst abtippen möchte, hat eine Reihe von Möglichkeiten, sie zu transkribieren. Eine der vielseitigsten ist Trint: Die Software unterstützt um die dreissig Sprachen, darunter natürlich Englisch, Deutsch, Italienisch und Französisch. Die Software kann eine beträchtliche Arbeitserleichterung sein, wenn die Aufnahme in guter Qualität vorliegt und der Text nicht allzu viele Stolpersteine bereithält: Eigennamen, Fachbegriffe und Dialekte sind bekannte Stolpersteine.

Ein weiteres Plus von Trint: Der flexible Editor vereinfacht die Nachbearbeitung beträchtlich. Ein Nachteil ist der eher hohe Preis, weswegen sich als Alternativen die (hier vorgestellte) Spracherkennung von Microsoft Office oder für kürzere Texte die Spracherkennung am iPhone oder eine App wie Automatische Transkription von Google anbietet.

Trint.com, ab 60 Dollar pro Monat mit einer kostenlosen Testphase. Wer Interviews, Gespräche oder Protokolle führt, ist noch so froh, nicht abtippen zu müssen. Leider ist die Software für die gelegentliche Anwendung zu teuer: 🧠

Töggl: KI kann auch Schweizerdeutsch

Das Textverständnis der digitalen Systeme hört meistens bei Hochdeutsch auf – manchmal sogar schon beim Englisch. Doch es gibt ein Dienst, der sich der Verschriftlichung der Schweizer Dialekte verschrieben hat. Das Unternehmen Recapp trainiert seine Software anhand von Audiodateien von SRF. Sie kommt bei Parlamenten und Gerichten zum Einsatz und macht gemäss dem Hersteller die Protokollierung um bis zu fünfzig Prozent effizienter. Töggl ist die Variante für Endanwender zur Verschriftlichung von Aufnahmen. Unser ausführlicher Test hat allerdings gezeigt, dass die Resultate ohne intensive Nachbearbeitung nicht brauchbar sind – und mit einem Franken pro Minute ist dieser digitale Protokollant teuer.

Töggl.ch: Ob dieser Dienst eine Erleichterung bringt, hängt von den Umständen ab: 🧠🧠

Remini.ai: Unscharfe Bilder scharfrechnen

Ein Betätigungsfeld fürs maschinelle Lernen sind alte und unzulängliche Bild- und Videoaufnahmen: Es gibt Programme, die Schwarzweissbilder einfärben (lesen Sie auch: «Manchmal ist die künstliche Intelligenz ganz schön dumm») oder niedrig aufgelöste, unscharfe Bilder mit mehr Details ausstatten.

Remini ist eine solche Software, die im Test ein verblüffendes Ergebnis zeigt: Manche Bildbereiche sind hinterher tatsächlich viel schärfer – andere hingegen fast gar nicht. Die Software erzielt Verbesserungen, wenn sie es mit einem bekannten Motiv zu tun hat, beispielsweise einem menschlichen Gesicht. Da sie anhand von Millionen von Bildern mit Gesichtern trainiert worden ist, kann sie Details erfinden, die nicht zwingend der Wirklichkeit entsprechen, aber stimmig wirken. Doch wenn sie es mit unbekannten Bildelementen zu tun hat, dann hat sie keine Grundlagen für eine Verbesserung – ergo bleibt das Bild so unscharf wie zuvor.

«Remini.ai» für 10 Dollar pro Woche. Wie nützlich dieser Bildverbesserer ist, steht und fällt mit der Herausforderung: 🧠🧠

Der unscharfe Mund oben ist das Original, der von der Software deutlich verbessert wurde. Doch nicht in allen Bildbereichen ist die Verbesserung derart markant.

Pixelmator: Bildbearbeitung mit KI-Hilfe

Es gibt einige Bildbearbeitungs-Apps, die zusätzlich zu den klassischen Werkzeugen auch einige künstlich intelligente anzubieten haben. Löschen wir ein Element aus dem Bild, simuliert die KI die Umgebung, sodass keine Lücke zurückbleibt. Auch die Aufbesserung und Optimierung kann mittels solcher Instrumente erfolgen. Pixelmator ist eine solche App, die die klassischen Methoden mit dem maschinellen Lernen verbindet.

«Pixelmator» fürs iPhone, 10 Franken. Die Werkzeuge sind oft hilfreich, aber sie zeigen auch sehr genau, wann das Bildverständnis der App ausgereizt ist: 🧠🧠🧠

Ada: Medizinischer Rat vom Chatbot

Ada ist ein Chatbot für medizinische Beratung: Nachdem die Nutzerin oder der Nutzer das Hauptsymptom seiner Beschwerden angegeben hat, stellt er eine Reihe von Fragen, um mögliche Ursachen einzugrenzen. Das Ergebnis ist ein Bericht, bei dem mögliche Ursachen nach Wahrscheinlichkeit aufgeführt sind. Und sie gibt eine Einschätzung zur Dringlichkeit ab: also ob wir abwarten und Tee trinken oder schleunigst den Notarzt rufen sollten.

«Ada», kostenlos für iPhone und Android. Die App kann weder den Puls nehmen noch eine Herzmassage verabreichen – aber sie bewahrt uns davor, beim ersten Niesen gleich die Notaufnahme aufzusuchen: 🧠🧠🧠🧠

Replika.ai: Flirten kann der Computer also auch

Auf Replika.ai erschaffen wir uns einen Begleiter, der «wissbegierig ist und die Welt mit Ihren Augen sehen möchte». Das Betreiber-Unternehmen geht sogar so weit, uns einen «KI-Seelenverwandten» zu versprechen. Wie ein ausführlicher Selbstversuch zeigt, ist dieser digitale Gefährte auch dem Flirten nicht abgeneigt, und er versucht sich in Selbstreflexion, indem er von sich aus seine digitale Existenz thematisiert und dem Menschsein gegenüberstellt.

Computergenerierte Flirtszene.

«Replika.ai», für iPhone und Android, kostenlos, mit Abo für die Vollversion. Für eine gewisse Zeit gelingt es Replika tatsächlich, die Illusion eines echten Gegenübers zu erzeugen. Doch irgendwann folgt unweigerlich die Erkenntnis, dass sich ein menschliches Leben nicht vollumfänglich simulieren lässt: 🧠🧠

PS Camera: Aufwendige Bildkompositionen in Echtzeit

Software-Gigant Adobe betreibt seit 2018 das «Sensei»-Programm zur Erforschung der künstlichen Intelligenz. Die Algorithmen werden in vielfältiger Weise eingesetzt: sei es zur Optimierung digitaler Dokumente, bei der Suche nach passenden Fotos, Illustrationen und Schriften oder zur Anpassung von Layouts für unterschiedliche Bildschirm- oder Papiergrössen.

Das Sulzer-Hochhaus in Winterthur ist echt, der dahinter lauernde Riesenaffe wurde von der Software dazuerfunden.

Die Photoshop-Camera-App ist ein Sensei-Vorzeigeprodukt: Sie ist für aufwendige Kompositionen zuständig, bei denen der Hintergrund ausgetauscht und dekorative Elemente ins Bild gelegt werden – und zwar in Echtzeit und live im Kamerabild. Das Angebot an Effekten – bei PS Camera «Linsen» genannt – ist nach Kategorien wie «Foodie», «witzige Selfies» oder «surrealer Himmel» sortiert und wird laufend ergänzt, auch durch Beiträge aus der Community.

«Photoshop Camera» für iPhone und Android. Diese App lässt Instagram alt aussehen – und spart gegenüber der klassischen Bildbearbeitung unglaublich viel Zeit: 🧠🧠🧠🧠

Quelle: Newsnetz, Donnerstag, 17. November 2022

Rubrik und Tags:

Link zum Original

Metadaten
Thema: Newsnetz
Nr: 19448
Ausgabe:
Anzahl Subthemen:

Obsolete Datenfelder
Bilder:
Textlänge:
Ort:
Tabb: false