Unterschiedliche Online-Werkzeuge auf KI-Basis

Die Fülle ein verfügbaren KI-Tools ist verwirrend. Für den Anfang empfiehlt sich, Anbieter zu nutzen, die eine kuratierte Auswahl an Zugängen zu generativer KI anbieten. Im deutschsprachigen Raum sind das u.a. https://fobizz.com/ oder https://schulki.de/. Die dort angebotenen „Freivolumina“ sind für erste Schritte vollkommend ausreichend.

Man muss bei KI-Werkzeugen oft deutlich unterscheiden, zwischen dem eigentlichen Programmcode, der einen bestimmten Namen trägt und Anbietern, die einen durch Menschen verstehbaren Zugriff auf diesen Code in Form von Apps oder Webseiten anbieten.

Kosten

Alle Anbieter bieten kostenlose Testzugänge an, deren Möglichkeiten jedoch sehr beschnitten sind - vor allem qualitativ. Die Kosten - gerade für den Zugriff auf qualitativ hochwertige Dienste - sind erheblich und können bis zu 20-30 Euro / Monat betragen. Oft werden nur Jahresabonnements angeboten. Sie sollten unbedingt nur monatliche Verträge abschließen, bevor Sie sich länger an einen Anbieter binden. Prüfen Sie, ob eine zentrale Finanzierung - etwa durch das Medienzentrum - für Ihre Anforderungen eine Option sein könnte. Die Chancen dafür stehen nur dann gut, wenn Sie eine konkrete Nutzung mit entsprechenden Szenarien vorweisen können, die nicht nur durch Einzelpersonen, sondern z.B. eine Fachschaft getragen wird.

Sprache

ChatGPT

Plattformen
webbasiert, zusätzlich Apps für iOS, Android (kostenpflichtig bei Nutzung von GPT4)

Datenschutzeinschätzung
ChatGPT über Apps oder die Webseite https://www.openai.com ist für die Arbeit mit Schüler:innen nicht datenschutzkonform nutzbar. ChatGPT bietet allerdings anderen Anbietern eine Schnittstelle (API) an. Über z.B. https://fobizz.com/ oder https://schulki.de/ kann man auch mit Schüler:innen durch Nutzung pseudonymisierter Accounts nach Aussage der Anbieter datenschutzkonform arbeiten. Eine unabhängige Prüfung dieser Aussagen durch Datenschutzbehörden hat bisher noch nicht stattgefunden. Ich schätze das Datenschutzrisiko daher moderat ein.

Kurzbeschreibung
ChatGPT ermöglicht den Zugriff auf die Sprachmodelle GPT3.5 und GPT4.x (kostenpflichtig) durch einen interaktiven Chat. Bisher bietet das dahinterliegende Sprachmodell von OpenAI die qualitativ besten Ausgaben. Eine Nutzung ohne Kenntnisse im Bereich Prompting führt in der Regel zu unbefriedigenden Ergebnissen. Der Datenstand der kostenlosen Variante endet 2021.


DeepL

Plattformen
webbasiert, zusätzlich Apps für iOS, Android (kostenpflichtig bei Nutzung von GPT4)

Datenschutzeinschätzung
DeepL ist über Apps oder die Webseite https://www.deepl.com für die Arbeit mit Schüler:innen datenschutzkonform nutzbar, da kein Accountzwang besteht und die Datenverarbeitung in der europäischen Union erfolgt. DeepL bietet zusätzlich anderen Anbietern eine Schnittstelle (API) an, wofür ein personalisierter Account benötigt wird. Ich schätze das Datenschutzrisiko daher gering ein.

Kurzbeschreibung
DeepL ist traditionell ein Übersetzungswerkzeug mit hoher Qualität und unter https://www.deepl.com/translator per Browser erreichbar. Weniger bekannt ist die Möglichkeit, mit https://www.deepl.com/write deutsche und englische Texte syntaktisch, grammatisch und stilistisch verbessern lassen zu können. Das funktioniert bei kurzen Texte kostenlos und ohne jeden Accountzwang.


Perplexity.ai

Plattformen
webbasiert

Datenschutzeinschätzung
Perplexity.ai ist über die Webseite https://www.perplexity.ai/ für die Arbeit mit Schüler:innen nicht datenschutzkonform nutzbar. Die Datenverarbeitung erfolgt außerhalb der europäischen Union. Ich schätze das Datenschutzrisiko daher hoch ein.

Kurzbeschreibung
„Perplexity AI ist eine KI-gestützte Suchmaschine und ein Chatbot, der fortschrittliche Technologien wie die Verarbeitung natürlicher Sprache (NLP) und maschinelles Lernen nutzt, um genaue und umfassende Antworten auf Benutzeranfragen zu geben. Sie wurde entwickelt, um das Internet in Echtzeit zu durchsuchen und aktuelle Informationen zu verschiedenen Themen anzubieten. Perplexity AI ist ein leistungsfähiges Tool mit einer intuitiven Benutzeroberfläche, das Nutzern helfen kann, Informationen zu einer Vielzahl von Themen zu finden“ (übersetzt mit DeepL, Originallink)

Perplexity.ai stößt damit in eine Lücke, die ChatGPT offenlässt - das Finden von Quellen in u.a. wissenschaftlichen Archiven.


AskYourPDF

Plattformen
webbasiert

Datenschutzeinschätzung
AskYourPDF ist über die Webseite https://askyourpdf.com/de für die Arbeit mit Schüler:innen prinzipiell weitgehend datenschutzkonform nutzbar, wenn ein schulisches Gerät verwendet wird, welches mehrere Personen nutzen - idealerweise ein Gerät im Gastmodus, welches sich nach der Abmeldung von selbst zurücksetzt.

Kurzbeschreibung
AskYourPDF erlaubt das Hochladen von PDF-Dateien, zu dessen Inhalten Anfragen gestellt werden können. AskYourPDF kann z.B. Kapitel zusammenfassen oder Textstellen mit bestimmten Inhalten heraussuchen. Gerade bei komplexen Dokumenten kann AskYourPDF eine große Hilfe beim Auffinden von Informationen sein, die für den jeweiligen Kontext relevant sind, ohne dass man das gesamte Dokument komplett lesen muss. Kostenlos können nur Dokumente mit geringen Seitenzahlen verwendet werden.


Bilder

Midjourney

Plattformen
webbasiert

Datenschutzeinschätzung
Midjourney ist über die Webseite https://www.midjourney.com/ für die Arbeit mit Schüler:innen nicht datenschutzkonform nutzbar. Die Datenverarbeitung erfolgt außerhalb der europäischen Union. Ich schätze das Datenschutzrisiko daher hoch ein. Allerdings nutzen einige Schulanbieter die API von Midjourney, sodass man indirekt Zugriff mit moderatem Datenschutzrisiko auf das Modell erhält.

Kurzbeschreibung
„Midjourney ist eine Künstliche Intelligenz (KI), die in der Lage ist, KI-Kunst zu erschaffen. Das proprietäre Programm wurde von dem gleichnamigen Forschungsinstitut aus San Francisco, Kalifornien, USA, geschaffen, welches von David Holz gegründet wurde und aktuell geleitet wird. Er war zuvor ein Mitgründer der Firma Leap Motion und arbeitete bei der NASA. Midjourney wird vollständig durch Befehle an einen Discord-Bot gesteuert. Um ein neues Bild zu erschaffen, wird der Befehl „/imagine“ verwendet, gefolgt von einer Beschreibung des gewünschten Bildes (vgl. Prompt Engineering). Dabei können prinzipiell verschiedene Sprachen verwendet werden, darunter auch Deutsch. Anstelle von Text-Befehlen (Midjourney als Text-Bild-Generator) können zur Bilderzeugung auch Bild-Befehle (image prompts) verwendet werden (Stand Version 5.2: Entweder mindestens zwei Bilder oder ein Bild kombiniert mit einem Text-Befehl). Midjourney funktioniert somit auch als Bild-zu-Bild-Generator. Midjourney erschafft zunächst eine Vorschau mit vier möglichen Entwürfen. Der Nutzer hat dann die Möglichkeit, jeden dieser Entwürfe zu finalisieren. Ebenso ist es möglich, einzelne Entwürfe geringfügig überarbeiten zu lassen oder aber alle vier Entwürfe zu verwerfen und vier ganz andere Bilder anzufordern. Midjourney konnte bis Ende März 2023 von jedermann zunächst kostenlos ausprobiert werden, aufgrund von „zuviel Missbrauch“ wurde diese Möglichkeit beendet. Ein unregistrierter Nutzer hatte 25 Minuten Rechenzeit zur Verfügung, das meint die aktive Arbeitszeit des Bots. Für zahlende Nutzer stehen drei mögliche Abo-Modelle zur Auswahl, die sich hinsichtlich der Anzahl der enthaltenen Minuten unterscheiden.Das Erstellen eines Bildes „kostet“ durchschnittlich etwa eine Minute. “ ( Quelle )


DALL-E

Plattformen
webbasiert

Datenschutzeinschätzung
DALL-E ist über die Webseite https://openai.com/dall-e-2 für die Arbeit mit Schüler:innen nicht datenschutzkonform nutzbar. Die Datenverarbeitung erfolgt außerhalb der europäischen Union. Ich schätze das Datenschutzrisiko daher hoch ein. Allerdings nutzen einige Schulanbieter die API von DALL-E, sodass man indirekt Zugriff mit moderatem Datenschutzrisiko auf das Modell erhält.

Kurzbeschreibung
„DALL-E (stilisiert als DALL·E) und die Nachfolger DALL-E 2 und DALL-E 3 sind von OpenAI entwickelte Computerprogramme, die Bilder aus Textbeschreibungen aufgrund von maschinellem Lernen erstellen können. Der Name ist ein Kofferwort aus dem kleinen animierten Roboter Wall-E aus dem gleichnamigen Film und dem spanischen Surrealisten Salvador Dalí.[1] Das Programm nutzt künstliche neuronale Netzwerke, ⁣um Wörter als Input in Anordnungen von Pixeln als Output zu transferieren. Mithilfe von Textanordnungen können von dem Programm fotorealistische Bilder erstellt werden. Die künstliche Intelligenz kann dabei völlig neue Konzepte abbilden und Bilder in verschiedenen künstlerischen Stilrichtungen kreieren. Um Bilder erzeugen zu können, wurde das Modell mithilfe von Millionen im Internet verfügbaren Bildern trainiert. Das Programm basiert auf dem ebenfalls von OpenAI entwickelten Generative Pre-trained Transformer 3 (GPT-3), einem Textgenerator, welcher Texte, Textzusammenfassungen und sogar Gedichte verfassen kann.“ (Quelle)


Stable Diffusion

Plattformen
webbasiert

Datenschutzeinschätzung
StableDiffusion ist über die Webseite https://stablediffusionweb.com/ für die Arbeit mit Schüler:innen prinzipiell weitgehend datenschutzkonform nutzbar, wenn ein schulisches Gerät verwendet wird, welches mehrere Personen nutzen - idealerweise ein Gerät im Gastmodus, welches sich nach der Abmeldung von selbst zurücksetzt. Weiterhin nutzen einige Schulanbieter StableDiffusion, sodass man indirekt Zugriff mit moderatem Datenschutzrisiko auf das Modell erhält. StableDiffusion ist OpenSource und lässt sich damit auch prinzipiell völlig ohne Datenschutzproblematik auf dem eigenen Rechner betreiben, was zunehmend weniger Wissen erfordert.

Kurzbeschreibung
„Stable Diffusion ist ein Deep-Learning-Text-zu-Bild-Generator. Die Open-Source-Software wird hauptsächlich zur Generierung detaillierter Bilder auf der Grundlage von Textbeschreibungen verwendet, kann aber auch für andere Aufgaben wie Inpainting, Outpainting und die Erzeugung von Bild-zu-Bild-Übersetzungen auf der Grundlage einer Textaufforderung (Prompt) eingesetzt werden. Stable Diffusion verwendet ein latentes Diffusionsmodell als Variante eines tiefen generativen neuronalen Netzes, das von der CompVis-Gruppe an der LMU München in Zusammenarbeit von Stability AI, CompVis LMU und Runway mit Unterstützung von EleutherAI und LAION entwickelt wurde. Im Oktober 2022 erhielt Stability AI in einer von Lightspeed Venture Partners und Coatue Management angeführten Finanzierungsrunde 101 Millionen US-Dollar. Der Code und die Modellgewichte von Stable Diffusion wurden veröffentlicht[6] und können auf vielen Consumer-Hardware-Systemen ausgeführt werden, sofern diese mit einer GPU mit mindestens 8 GB Grafikspeicher ausgestattet sind. Die Verwendung auf weniger leistungsfähiger Hardware bzw. ohne GPU-Beschleunigung ist mittlerweile ebenfalls möglich, jedoch deutlich langsamer. Dieser offene Ansatz stellt eine Abkehr von früheren proprietären Text-zu-Bild-Modellen wie DALL-E und Midjourney dar, die nur über Cloud-Dienste zugänglich waren.“ (Quelle)


Videos

HeyGen

Plattformen
webbasiert

Datenschutzeinschätzung
HeyGen ist über die Webseite https://app.heygen.com/login für die Arbeit mit Schüler:innen nicht datenschutzkonform nutzbar. Die Datenverarbeitung erfolgt außerhalb der europäischen Union. Ich schätze das Datenschutzrisiko daher hoch ein, insbesondere weil Bild und Stimme mit Teil der Verarbeitung sind.

Kurzbeschreibung
HeyGen erlaubt das Hochladen von z.B. Videos, in denen eine Person im Mittelpunkt steht und einen Text spricht. Dieses Video wird automatisiert mit passender Lippensynchronisierung in unterschiedliche Sprachen übersetzt. Die Qualität ist je nach Sprache beeindruckend.



Synthesia

Plattformen
webbasiert

Datenschutzeinschätzung
Synthsia ist über die Webseite https://www.synthesia.io/ für die Arbeit mit Schüler:innen mit Abstrichen durchaus datenschutzkonform nutzbar, z.B. über die Nutzung mit schulischen Geräten und entsprechender datenschutzsensibler Einweisung der Schüler:innen. Die Datenverarbeitung erfolgt außerhalb der europäischen Union. Ich schätze das Datenschutzrisiko daher moderat ein.

Kurzbeschreibung
Synthesia erlaubt das Hochladen von Texten, die durch unterschiedliche Avatare in Form eines Videos gesprochen werden. Die generierten Videos stehen dann zum Download bereit. Je nach Länge und Lizenzmodell entstehen unterschiedlich hohe Kosten.



Musik / Audio

Lalai

Plattformen
webbasiert

Datenschutzeinschätzung
Lalal.ai ist über die Webseite https://www.lalal.ai/de/ für die Arbeit mit Schüler:innen mit Abstrichen durchaus datenschutzkonform nutzbar, z.B. über die Nutzung mit schulischen Geräten und entsprechender datenschutzsensibler Einweisung der Schüler:innen. Die Datenverarbeitung erfolgt außerhalb der europäischen Union. Ich schätze das Datenschutzrisiko daher moderat ein.

Kurzbeschreibung
Lalal ermöglich die Aufteilung von bestehenden Audiofiles (Musikstücke) in einzelne Tracks (z.B. Gesang, Schlagzeug etc.). Der Dienst ist vorerst noch kostenlos in einer Testphase nutzbar.



Beatoven

Plattformen
webbasiert

Datenschutzeinschätzung
Beatoven.ai ist über die Webseite https://www.beatoven.ai/ für die Arbeit mit Schüler:innen durch Accountzwang nicht datenschutzkonform nutzbar, Die Datenverarbeitung erfolgt außerhalb der europäischen Union. Ich schätze das Datenschutzrisiko daher hoch ein.

Kurzbeschreibung
Beatoven erlaubt die maschinelle Generierung von Musik auf Basis von Presets und Prompts.



murf.ai

Plattformen
webbasiert

Datenschutzeinschätzung
murf.ai ist über die Webseite https://www.murf.ai/ für die Arbeit mit Schüler:innen durch Accountzwang nicht datenschutzkonform nutzbar, Die Datenverarbeitung erfolgt außerhalb der europäischen Union. Ich schätze das Datenschutzrisiko daher hoch ein.

Kurzbeschreibung
Murf.ai ist ein Text-to-Speech-Dienst, des es erlaubt, digitale Texte in hoher Qualität mit unterschiedlichen Stimmenmustern ausgeben zu lassen. So lassen sich in Kombination mit Sprachmodellen etwa Hörverstehenstexte auf unterschiedlichen Niveaus erstellen. Unterschiedliche Stimmen können dabei z.B. in einem Dialog unterschiedliche Rollen übernehmen.