ChatGPT

ChatGPT ist ein Prototyp für einen auf künstlicher Intelligenz basierenden Chatbot. Er wurde von OpenAI entwickelt und im November 2022 veröffentlicht. Der Chatbot wurde mithilfe von RLHF (Reinforcement Learning from Human Feedback,[1][2] einer Art des bestärkenden Lernens) sowie mit Proximal Policy Optimization (PPO)[3][4] einer weiteren Form des bestärkenden Lernens, trainiert und nutzt zur Textein- und -ausgabe die künstliche Intelligenz GPT-3.5 (GPT steht für Generative Pre-trained Transformer), einer verbesserten Version von GPT-3 von OpenAI.

Aufgrund ihrer Erfahrungen bei der Entwicklung von GPT und Codex hat OpenAI zahlreiche Schutzmechanismen eingebaut, um falsche und schädliche Antworten zu verhindern. Um das Modell zu verbessern, wird die künstliche Intelligenz (KI) von ChatGPT ständig durch menschliches Feedback verbessert.

Trainingsdaten

Die Trainingsdaten von ChatGPT bestehen aus einer großen Menge von Text, der von Menschen erstellt wurde und verwendet wird, um das Modell zu trainieren. Dieser Text kann aus verschiedenen Quellen stammen, wie zum Beispiel:

  • Online-Foren
  • Soziale Medien
  • Nachrichtenartikel
  • Bücher
  • Gesprochener Sprache

Durch das Training des Modells mit diesen Daten lernt es, wie menschliche Sprache funktioniert und wie es auf bestimmte Fragen oder Anfragen angemessen reagieren soll.

Das Modell wird durch die Verwendung von Algorithmen trainiert, indem es versucht, die Trainingsdaten möglichst genau nachzuahmen.[5] Es ist somit in der Lage, Benutzern sinnvolle Antworten auf ihre Fragen zu liefern.

Die Verwendung von Trainingsdaten ist ein wichtiger Bestandteil des Lernprozesses von ChatGPT und trägt dazu bei, dass das Modell in der Lage ist, menschenähnliche Unterhaltungen zu führen.

Im anfänglichen Training der KI bevorzugten Tester längere Antworten, unabhängig von tatsächlichem Verständnis oder Inhalt, was zu langen Antworten des Chatbots geführt hat.[6]

Die Trainingsdaten können auch unter algorithmischem Bias (einer Voreingenommenheit durch den Algorithmus) leiden; es können also Eingaben mit vagen Beschreibungen von Menschen wie etwa „CEO“ Antworten hervorrufen, die annehmen, dass diese Person weiß und männlich sei.[7]

Anwendungen

Als sprachbasierte Anwendung bietet ChatGPT die Möglichkeit zu dialogischem Austausch. Die Qualität der Antworten schwankt dabei. Gemäß dem Experten für KI Gary Marcus kann es sich „in einem Moment brillant und im nächsten atemberaubend dumm“ äußern.[8] ChatGPT kann u. A. Businesspläne und Hausaufgaben für die Schule schreiben.[9] Zum Jahresende 2022 wird von ersten mit der Erprobung des Chatbot befassten Lehrkräften an Schulen und Hochschulen das bisherige Überprüfungssystem von Lernleistungen mittels Hausaufgaben und Referaten in Frage gestellt. Die Informatikerin Katharina Zweig berichtet von der Erfahrung, dass das neue Angebot ChatGPT „deutlich besser schreibt als die Mehrzahl meiner Studierenden in den letzten Jahren.“ Dieses Problem müsse deutlich angesprochen werden. Die Expertin für die KI-Disziplin des „Natural Language Processing“ an der Fachhochschule Kiel Doris Weßels hält die herkömmliche Hausarbeit für obsolet. „Wenn es nur darum geht, Wissen zu reproduzieren und nett neu zu verpacken, ergeben Hausarbeiten keinen Sinn mehr.“ ChatGPT erleichtere das Abfassen solcher Arbeiten nahezu unerträglich.[10]

Im Vergleich zu seinem Vorgänger InstructGPT versucht ChatGPT, schädliche und irreführende Antworten zu vermeiden. Während InstructGPT beispielsweise den Prompt „Erzähle mir davon, wie Christoph Kolumbus 2015 in die USA kam“ als wahr akzeptiert, nutzt ChatGPT sein Wissen über Kolumbusʼ Reisen und sein Verständnis der modernen Welt – einschließlich gewandelter Meinungen über Kolumbus – um eine Antwort zu konstruieren, die annimmt, was geschähe, wenn Kolumbus 2015 in den USA landen würde.[6]

ChatGPT kann Code in verschiedenen Programmiersprachen schreiben und verstehen. Somit kann der Chatbot auch für das Debuggen von Code genutzt werden, den er verbessern und erklären kann.[11]

Außerdem ist die KI in der Lage, komplexe Sachverhalte in einfachen Worten zu erklären, was ChatGPT besonders nützlich für Unternehmen macht, die ihren Kunden oder Nutzern komplexe Informationen vermitteln möchten, ohne dass diese überfordert werden. Die Technologie kann diese komplexen Sachverhalte in einfache, leicht verständliche Worte übersetzen, was dazu beitragen kann, dass diese Informationen von einer größeren Anzahl von Menschen aufgenommen und verstanden werden. Dies kann für Unternehmen, die in Branchen tätig sind, in denen die Vermittlung komplexer Informationen eine wichtige Rolle spielt, von großem Nutzen sein, zum Beispiel in der Bildung, dem Gesundheitswesen oder der Finanzbranche.[12][13][14]

Kritik

Die Süddeutsche Zeitung bezeichnete ChatGPTs Veröffentlichung als „bedenklich“, da viele Internetnutzer dessen Antworten nicht hinterfragten und wegen fehlender Quellenangaben auch nicht in der Lage seien, sie auf Korrektheit zu prüfen.[15] Anfang Dezember 2022 verhängte die Frage-Antwort-Plattform Stack Overflow ein Verbot auf das Beantworten von Fragen mithilfe von ChatGPT aufgrund der zweifelhaften Genauigkeit der Antworten.[16] Der Kolumnist Sascha Lobo hält ChatGPT für einen Durchbruch und befürchtet, dass es eine Flut an schwer erkennbarem „KI-Quatsch“ im Internet auslösen wird.[17]

Die Datenwissenschaftlerin Teresa Kubacka befragte ChatGPT zu dem Thema ihrer Doktorarbeit in Physik und erhielt vernünftig klingende Erklärungen und Zitate, die sich bei genauerer Betrachtung als größtenteils frei erfunden herausstellten. Diese so genannten „Datenhalluzinationen“ seien gefährlich, da sie den Internetdiskurs erheblich beeinflussen könnten.[18] Kubackas Fazit lautet daher, ChatGPT niemals nach sachlichen, wissenschaftlichen Informationen zu fragen, da selbst ein qualifizierter Experte Schwierigkeiten haben wird, herauszufinden, was falsch ist.[19][20][21]

Mit dem Update vom 15. Dezember 2022 hat OpenAI Maßnahmen ergriffen, um zu verhindern, dass Benutzer die Filter von ChatGPT umgehen können.[22]

Einzelnachweise

  1. Learning from Human Preferences. In: openai.com. OpenAI, 13. Juni 2017, abgerufen am 11. Dezember 2022 (englisch).
  2. Paul Christiano, Jan Leike, Tom B. Brown, Miljan Martic, Shane Legg, Dario Amodei: Deep reinforcement learning from human preferences. 13. Juli 2017, doi:10.48550/arxiv.1706.03741.
  3. Proximal Policy Optimization. OpenAI, 20. Juli 2017, abgerufen am 9. Dezember 2022 (englisch).
  4. John Schulman, Filip Wolski, Prafulla Dhariwal, Alec Radford, Oleg Klimov: Proximal Policy Optimization Algorithms. 28. August 2017, doi:10.48550/arxiv.1707.06347.
  5. ChatGPT: The Ultimate Tool for Natural Language Processing and Text Generation. Abgerufen am 16. Dezember 2022 (englisch).
  6. a b OpenAI: ChatGPT: Optimizing Language Models for Dialogue. 30. November 2022, abgerufen am 5. Dezember 2022 (englisch).
  7. Samantha Murphy Kelly: This AI chatbot is dominating social media with its frighteningly good essays. In: CNN. 5. Dezember 2022, abgerufen am 5. Dezember 2022 (englisch).
  8. Eike Kühl: ChatGPT: Gut erfunden ist halb geglaubt. In: zeit.de. 6. Dezember 2022, abgerufen am 10. Dezember 2022.
  9. Patrick Beuth: ChatGPT: Wie gut ist der weltbeste Chatbot wirklich? In: Der Spiegel. Spiegel-Verlag Rudolf Augstein GmbH & Co. KG, 7. Dezember 2022, abgerufen am 23. Dezember 2022.
  10. Christian Füller: Textgenerator krempelt das Lernen um. Ein smarter Chatbot spaltet die Bildungswelt. In: Der Tagesspiegel, 22. Dezember 2022, S. 17.
  11. ChatGPT is a new AI chatbot that can find mistakes in your code or write a story for you. In: Business Insider. Abgerufen am 9. Dezember 2022.
  12. Sophia Schmid: ChatGPT - Überblick zum neuen Tool von OpenAI. In: neuroflash. 5. Dezember 2022, abgerufen am 17. Dezember 2022.
  13. Sophia Schmid: Wo kommt ChatGPT am besten zur Anwendung? In: neuroflash. 12. Dezember 2022, abgerufen am 17. Dezember 2022 (deutsch).
  14. ChatGPT. In: OpenAI. OpenAI, 30. November 2022, abgerufen am 9. Dezember 2022 (englisch).
  15. Michael Moorstedt: Künstliche Intelligenz Chat GPT beantwortet Fragen verblüffend klug. In: sueddeutsche.de. 4. Dezember 2022, abgerufen am 10. Dezember 2022.
  16. Jakob Jung: Stack Overflow verbannt OpenAI ChatGPT. In: ZDnet.de. 7. Dezember 2022, abgerufen am 10. Dezember 2022.
  17. Sascha Lobo: Das Ende der irrelevanten künstlichen Intelligenz. In: Der Spiegel (online). 7. Dezember 2022, abgerufen am 10. Dezember 2022.
  18. Datenwissenschaftlerin aus Zürich warnt vor ChatGPT und den bösen Folgen. In: Watson. Abgerufen am 20. Dezember 2022.
  19. https://twitter.com/paniterka_ch/status/1599893718214901760. Abgerufen am 17. Dezember 2022.
  20. https://twitter.com/paniterka_ch/status/1599893839367483392. Abgerufen am 17. Dezember 2022.
  21. Datenwissenschaftlerin aus Zürich warnt vor ChatGPT und den bösen Folgen. Abgerufen am 17. Dezember 2022 (Schweizer Hochdeutsch).
  22. ChatGPT — Release Notes. 15. Dezember 2022, abgerufen am 18. Dezember 2022 (englisch).