Veröffentlicht am 13. Juni 2023 Alle Kategorien, Technology

GPT-4 ist der Generative Pre-Trained Transformer (GPT) der vierten Generation. GPT ist ein maschinelles Lernmodell, im Wesentlichen ein neuronales Netzwerk. Das Programm wird mithilfe von Daten trainiert, um jede Art von Sprache zu generieren.

Das Sprachmodell GPT-3.5 hat weltweit weiterhin große Wellen geschlagen. Bei der Veröffentlichung wurde eine schockierende Anzahl von Anwendungsfällen entdeckt, die sowohl Aufregung als auch Angst hervorriefen. Es kann intensive juristische Prüfungen bestehen, ausführliche Artikel in Langform schreiben und wurde sogar zum Codieren von Websites verwendet. ChatGPT, die chatbasierte Schnittstelle des Netzwerks, ist in der Lage, all dies und mehr mit Hilfe menschlicher Anweisungen zu tun, die von jedem Nutzer in der Welt bereitgestellt werden.

Open AI, das Unternehmen hinter GPT in all seinen Generationen und Tools, hat sich zum größten Namen in der Technologiebranche entwickelt. Ihre Produkte haben unter anderem Ängste vor steigender Arbeitslosigkeit und der Zukunft der Bildung geweckt. ChatGPT wurde in vielen Schulen wegen seiner Fähigkeit, Aufsätze von höchster Qualität zu erstellen und praktisch alle Schulaufgaben zu lösen, verboten. Es wurde auch von Unternehmen jeder Größe übernommen, von neuen Startups bis hin zu Technologiegiganten wie Microsoft.

Die Updates haben seit der Veröffentlichung von ChatGPT schnell zugenommen. GPT-4 dürfte der nächste große Schritt sein.

ChatGPT Pro, der kostenpflichtige Dienst für ChatGPT, bietet jetzt zusätzlich zu den Prioritätszugängen und Ladezeiten auch Zugang zu GPT-4.

All diese Aufregung wirft mehrere Fragen auf, von denen wir wissen, dass Sie sich fragen:

Was genau ist GPT?
Warum waren GPT-3.5 und ChatGPT so revolutionär?
Was ist GPT-4 und was bedeutet seine Veröffentlichung für die Welt?

Wir werden kurz auf die frühe Geschichte des GPT von Open AI eingehen. Anschließend befassen wir uns mit GPT-4 und den Unterschieden zu früheren Versionen, einschließlich aller aufregenden neuen Dinge, die Sie erwarten können.

Was genau ist GPT?

Generative Pre-trained Transformer (GPT) ist ein hochmodernes Sprachverarbeitungsmodell für künstliche Intelligenz (KI), das von Open AI entwickelt wurde.

GPT ist in der Lage, Text „menschlicher“ zu generieren. KI-Texte gibt es schon seit einiger Zeit. Aber GPT ist in der Lage zu denken, zu verarbeiten und Ihnen einen Text zu hinterlassen, der menschlicher ist und auf einem umfangreichen Sprachbestand basiert. Dadurch ist es zu neuen Aufgaben fähig:

Kommunikation
Sprachübersetzung
Generieren von menschenähnlichem Text für Konversationszwecke
Chatbot-Aufgaben

Im Gegensatz zu KI-Textgeneratoren haben sich GPT-Modelle als fähig erwiesen, eine „natürliche“ Sprache zu erzeugen. Der von ChatGPT erstellte Text ähnelt sowohl vom Stil als auch vom Inhalt dem von Menschen geschriebenen Text. Es ist aber auch analysefähig, einschließlich der Generierung von Code.

Frühe GPT

Lassen Sie uns zunächst einen kurzen Überblick über das GPT-Projekt geben.

Die ersten NLP-Modelle (Natural Language Processing) von Open AI konnten Aufgaben wie das Beantworten von Fragen oder das Zusammenfassen von Informationen ohne überwachtes Training ausführen. Das Verständnis natürlicher Sprache, einschließlich der oben genannten Aufgaben, wurde schon früh ermöglicht. Die meisten anderen NLP-Modelle vor GPT-1 wurden speziell für eine bestimmte Aufgabe trainiert. Eine wäre beispielsweise für die Klassifizierung von Gefühlen, eine andere für die textliche Folgerung und so weiter. GPT-1 war erfolgreich bei der Verallgemeinerung von Aufgaben, die nicht auf eine einzige Aufgabe zugeschnitten waren, für die es entwickelt wurde.

GPT-1

GPT-1 war im NLP-Bereich bahnbrechend, da es die wesentlichen Einschränkungen früherer Modelle überwand. Erstens war es in der Lage, Aufgaben zu verallgemeinern, die über das hinausgingen, wofür ein NLP ausgebildet wurde. Es überwand auch den Bedarf an riesigen Mengen kommentierter Daten, die nur schwer zu beschaffen sind, um eine Aufgabe zu erfüllen.

Im Jahr 2018 erreichte GPT-1 einen NLP-Meilenstein, indem es demonstrierte, wie Vorabtraining und ein massives neuronales Netzwerk auf Basis von Textdaten die Aufgaben der Sprachgenerierung erheblich verbessern konnten. Die Fähigkeit, diese Aufgaben zu erledigen, war jedoch sehr begrenzt (im Vergleich zu den neueren Versionen, die jeder verwendet).

Diese GPT-1-Veröffentlichung beschrieb das halbüberwachte Lernen für alle NLP-Aufgaben. Es befasste sich mit der unüberwachten Sprachmodellierung als Vorab-Trainingstool. Anschließend wurden die Ergebnisse durch betreutes Training verfeinert. Der Datensatz, auf dem GPT-1 trainiert wurde, war BookCorpus, der rund 7.000 Bücher für das Training bereitstellte.

GPT-1 war ein Proof-of-Concept-Projekt; es wurde nicht veröffentlicht. Es erwies sich dennoch als erfolgreich und GPT-1 konnte Sprache auf natürliche Weise verarbeiten und verstehen.

GPT-2

Nur ein Jahr nach der Einführung von GPT-1 wurde der GPT-2-Artikel veröffentlicht. Dieser zweite Artikel trug den Titel „Sprachmodelle sind unbeaufsichtigte Multitask-Lernende“. Dieses Mal wurde das Produkt für den Einsatz im Bereich des maschinellen Lernens freigegeben. Fachleute haben es für die verschiedenen Aufgaben der Texterstellung eingesetzt, die wir bereits genannt haben.

Vergessen Sie nicht, dass NLP ein sehr junges Phänomen ist und jede Iteration eine enorme Verbesserung gegenüber der letzten darstellt. Im Jahr 2019 konnte GPT-2 ein paar Sätze generieren und brach dann zusammen. Zu diesem Zeitpunkt war dies ein erfolgreiches und revolutionäres Ergebnis.

GPT-2 unterschied sich von GPT-1 in zwei Schlüsselbereichen: Aufgabenkonditionierung und Zero-Shot-Lernen sowie Zero-Shot-Aufgabentransfer.

Einfach ausgedrückt handelt es sich bei der Aufgabenkonditionierung darum, das Modell so zu gestalten, dass es aus genau denselben Eingaben unterschiedliche Ausgaben für mehrere unterschiedliche Aufgaben erzeugt. Die Ausgaben sind in diesen Fällen einzigartige Sequenzen natürlicher Sprache.

Zero-Shot-Lernen ist ein Aspekt der Zero-Shot-Aufgabenübertragung. Für das Modell werden keine Beispiele bereitgestellt, da es die Aufgabe allein anhand der bereitgestellten Anweisungen versteht. An diesem Punkt würde GPT-1 die Sequenzen neu anordnen und verfeinern. Von GPT-2 wurde stattdessen erwartet, dass es die Art der Aufgabe allein durch die Sprache versteht und Antworten liefert.

Auch der Datensatz für GPT-2 wurde erheblich erweitert. Der verwendete WebText-Datensatz umfasste etwa 40 GB Textdaten aus über 8 Millionen Quellen. Im Vergleich zu BookCorpus war dies eine gewaltige Erweiterung.

GPT-3

Der Artikel für GPT-3 trug den Titel „Sprachmodelle sind nur Few-Shot-Lernende“. Die Idee war, dass Sprachmodelle keiner Feinabstimmung und nur sehr wenig Anleitung benötigen, um NLP-Aufgaben zu verstehen und auszuführen. Open AI hat das Modell mit 175 Milliarden Parametern erstellt, eine enorme (über 100-fache) Erweiterung gegenüber früheren Modellen. Der Datensatz wurde weiter auf fünf verschiedene Korpora erweitert.

Diese Verbesserungen ermöglichten es GPT-3, vollständige Artikel zu schreiben, die nicht leicht zu unterscheiden waren von von Menschen verfassten Artikeln. Es konnte aber auch zufällige Aufgaben ausführen, für die es nicht speziell ausgebildet war. Es verfügte beispielsweise über die Fähigkeit, mathematische und kodierende Probleme zu lösen oder sprachliche Aufgaben zu lösen. Für erstere erwies es sich als besonders vielversprechend. GPT-3 konnte Beschreibungen von Codierungsaufgaben in natürlicher Sprache bereitstellen.

GPT-3.5 und ChatGPT

ChatGPT basiert auf GPT-3.5, einem Update von GPT-3. Das 3.5-Modell basierte auf einem erweiterten Datensatz, wodurch sein Potenzial weiter erweitert wurde. Dies wurde auf das konversationsbasierte Open-Source-ChatGPT angewendet. Dieses Mal konnten Menschen aus aller Welt erleben, wie die KI in der Lage ist, Seiten mit menschenähnlichem Text zu generieren.

ChatGPT, das Open-AI-Produkt, das jeder nutzt, wurde wegen seiner Fähigkeiten aus den Schulen verbannt. Aber viele Fachleute und Unternehmen haben es in ihre Standardarbeitsabläufe integrieren können. Es ist mittlerweile die am schnellsten wachsende Webanwendung. Nach nur zwei Monaten erreichte es über 100 Millionen Nutzer. Mit etwas Anleitung und Faktenprüfung können Texte und Analysen erstellt werden, die den höchsten professionellen Standards entsprechen. Zu den größten Fans zählen Vermarkter, Programmierer und verschiedene Analysten.

Neben beruflichen Zwecken sind auch akademische und freizeitliche Anwendungen weit verbreitet. Das Modell (GPT-3.5) ist in der Lage, Fachleuten dabei zu helfen, ihr Handwerk zu verfeinern und ihre potenzielle Effizienz zu maximieren. Es kann aber auch für etwas so Einfaches wie ein interessantes Gespräch verwendet werden. Es kann originelle Witze schreiben, ein Lied komponieren, komplexe Themen aufschlüsseln und vieles mehr. Es kann aber auch die Rolle eines Lehrers oder Tutors übernehmen. Mit einer einfachen Anleitung kann ChatGPT aufschlüsseln, wie man komplexe mathematische Probleme mit gründlichen, aber leicht verständlichen schriftlichen Anweisungen löst. Einige Leute haben sogar berichtet, dass sie ChatGPT für Beziehungsberatung und andere psychologische Bedürfnisse nutzen.

Was kommt als nächstes?

So bahnbrechend das alles auch ist, wir alle haben noch nichts gesehen. GPT-4 wird das Training voraussichtlich am 22. August 2023 beenden.

GPT-4 dürfte in jeder Hinsicht eine massive Verbesserung gegenüber 3.5 darstellen:

Verarbeitungsmöglichkeiten
Datensätze
Benutzerabsichten verstehen
Sachliche Richtigkeit
Argumentation
Verhalten anpassen (gemäß Benutzerwünschen)

Sie können GPT-4 als eine Überarbeitung betrachten, die jeden Aspekt dessen verbessert, was ChatGPT derzeit bietet.

Was ist der Unterschied zwischen Chat GPT-3 und GPT-4?

GPT-3 war im Wesentlichen ein Texteingabe- und Textausgabe-Modell. GPT-4 ist multimodal, verwendet Bilder, gibt Bildnachweise an und nimmt Bildeingaben für komplexe Anweisungen entgegen.

Es stellt sich auch die einfachere Frage der verfügbaren Daten. GPT-4 ist monumental und GPT-3 winzig, wenn man die beiden vergleicht. Die Datensätze sind nicht vergleichbar (einen visuellen Vergleich finden Sie im Bild unten).

GPT-4 kann auch mit mehr Texteingaben arbeiten als GPT-3. Das bedeutet, dass es viel längere Dokumente lesen und entsprechend Ihren Anweisungen verarbeiten kann. Dann kann es noch viel mehr herausbringen und ganze Romane schreiben, oder auch nur Kurzgeschichten, wenn Sie das bevorzugen.

Genauigkeit

Open-AI-Forschung zeigt enorme Verbesserungen bei der sachlichen Genauigkeit von GPT-4. Bisher hat sich ChatGPT in dieser Hinsicht als äußerst nützlich erwiesen. Aber es macht immer noch Fehler und es mangelt an Daten in vielen Nischenbereichen. Der Bereich, in dem sich die Modelle jedoch ständig verbessert haben, liegt in der Reduzierung von Argumentations- und Sachfehlern. Offene KI-Tests ergaben, dass GPT-4 bei Argumentationsfehlern um 40 % bessere Ergebnisse erzielt als GPT-3.5.

Steuerung

„Steuerbarkeit“ ist eines der Hauptmerkmale von ChatGPT. Benutzer, die wissen, wie man Fragen stellt, können das Verhalten der KI ändern. Dies ist wichtig, damit es in verschiedenen Kontexten nützlich ist:

Inhalte mit einem bestimmten „Ton“ produzieren
Einen Aufsatz mit einer bestimmten Ausrichtung schreiben

Sie können ChatGPT direkt anweisen, als wütend, glücklich, knapp, vorsichtig, obsessiv oder als irgendetwas anderes zu schreiben. Das Verständnis dieser Eingabeaufforderungen und der Reaktion der KI bestimmt weitgehend, wie nützlich sie für Sie sein können.

Die GPT-4-Verbesserungen konzentrieren sich hauptsächlich auf diesen Aspekt von GPT-Modellen. Gleichzeitig wird das neue Modell über stärkere integrierte Schutzmaßnahmen gegen illegale oder unmoralische Anfragen verfügen. Das Endergebnis ist eine bessere Anpassungsfähigkeit an Benutzereingaben.

Wahnsinnige Dinge, die der neue Chat GPT-4 leisten kann

Es gibt auch interessante neue Funktionen, die in früheren GPT-Modellen nicht enthalten waren. Diese neuen Aufgaben eröffnen neue Anwendungsfälle, die Benutzer aller Fachrichtungen zu schätzen wissen.

Verbesserte visuelle Erkennung

GPT-4 kann visuelle Eingaben entgegennehmen und visuelle Ausgaben erzeugen. Aber es kann diese Fähigkeiten auch für viele wichtige Aufgaben nutzen, die ganze Berufe und Branchen verändern werden.

Ein Beispiel ist die Eingabe eines Wireframes, einer handskizzierten, groben Skizze, wie eine Website aussehen und funktionieren wird. GPT-4 kann diese Informationen nutzen und den Code ausgeben, um diese Website basierend auf der Skizze zu erstellen.

GPT-4 kann auch Eingaben in einer Form entgegennehmen und sie basierend auf Benutzeranweisungen in einer anderen Form präsentieren. Es kann große Textdokumente aufnehmen und diese Informationen als ansprechende PPT-Präsentation ausgeben. Diese zeitsparende Aufgabe kann riesige Textblöcke in prägnante, schöne Präsentationen umwandeln. Stundenlanges Formatieren ist vorbei, einfache Ein- und Ausgaben sind drin.

Codierung

Das Erlernen des Programmierens erfordert einen erheblichen Zeitaufwand, und nicht jeder kann diesen Aufwand rechtfertigen. Die Anwendungsfälle für diese Fähigkeiten sind beeindruckend. Personen ohne Programmiererfahrung können Websites erstellen und sogar Anwendungen erstellen.

Mit GPT-4 haben bereits Menschen ohne Vorkenntnisse Google Chrome-Erweiterungen erstellt. Ein lustiges Beispiel ist diese Erweiterung, die Webseiten in „Piratensprache“ „übersetzt“. Sagen Sie ihm einfach, er soll etwas tun, auch auf alberne Weise, und er findet einen Weg. GPT-4 bietet alles, was Sie für den Erstellungsprozess benötigen, einschließlich Schreiben, Codieren und Beheben etwaiger Fehler. Sie müssen lediglich die Anweisungen geben. GPT-4 ist auch besser darin, Anweisungen zu verstehen, was diese Potenziale noch überraschender macht.

Vermarkter und andere verlassen sich bei ihren täglichen Abläufen und Verantwortlichkeiten auf Erweiterungen. Zusätzlich zu den Freizeitanwendungen gibt es für GPT-4 viele professionelle Anwendungen. Für viele Fachleute kann die Auslagerung von Aufgaben an GPT-4 Arbeitsabläufe optimieren oder sogar Aufgaben erledigen, die sie normalerweise nicht erledigen würden oder könnten.

Für kreative Unternehmer eröffnen sich neue Potenziale. Mit GPT-4 können Sie neue Erweiterungen und andere Tools erstellen, die Ihr Unternehmen oder Ihre Karriere unterstützen. Sie können damit neue Funktionen auf Ihrer Website erstellen, Ihre Produktivität steigern und vieles mehr.

Freizeitbeschäftigung

Warum so ernst?

Die Einsatzmöglichkeiten von GPT-4 gehen über Geld und Produktivität hinaus. Sie können es auch zur Unterhaltung nutzen, sei es für kurze Lacher oder umfassendere Unterhaltung.

Wenn Ihre Arbeit erledigt ist und Sie sich langweilen, warum entwickeln Sie dann nicht ein neues Spiel für sich? Keine Programmierfähigkeit? Kein Problem.

Sie können das Pong Spiel in weniger als einer Minute nachbilden. Oder Sie können sich etwas mehr Zeit nehmen und etwas ganz anderes erstellen (oder neu erstellen).

Akademiker

Dies ist einer der umstrittensten Aspekte der Entwicklung von Open AI, seit ChatGPT der Öffentlichkeit zugänglich gemacht wurde. Schulbehörden haben es verboten. Professoren haben es genutzt, um automatisch Arbeiten zu verfassen. Die Schüler haben damit alle ihre Hausaufgaben gemacht. Aber im Großen und Ganzen kann GPT-4 in dieser Hinsicht auch harmlos sein.

Natürlich können Sie Ihre Prüfungen nicht mit ChatGPT schreiben. Aber es kann ein toller Lernpartner sein!

Eine weitere Verbesserung gegenüber früheren Modellen ist, dass der GPT-4 fast jede einzelne BAR-Prüfung (Anwaltszulassung in den USA) bestehen kann. Es kann die meisten Prüfungen bestehen, einschließlich medizinischer Prüfungen, SATs und AP-Prüfungen. Wenn Sie Hilfe beim Lernen benötigen, kann GPT-4 ein großartiger Nachhilfelehrer sein.

Wie fange ich mit GPT-4 an?

Derzeit ist die einzige Möglichkeit, auf GPT-4 zuzugreifen, eine kostenpflichtige Mitgliedschaft bei ChatGPT Plus.

ChatGPT Plus ist die Premium-Version von ChatGPT. Durch den Kauf eines Abonnements erhalten Sie Zugriff auf GPT-4 statt nur auf das Standard-GPT-3.5. Die Mitgliedschaft beinhaltet außerdem einen vorrangigen Zugriff und eine schnellere Bearbeitung. Sie profitieren von den oben besprochenen GPT-4-Vorteilen, einschließlich der Bildeingabekapazität, zusätzlich zu einem verbesserten Erlebnis mit ChatGPT.

Seit März 2023 gibt es eine Warteliste, um GPT-4 als API-Entwickler zu erhalten. Dadurch erhalten Sie Zugriff auf GPT-4 und alles, was Sie zum Erstellen von Anwendungen und Servicelösungen benötigen.

Wenn Sie interessiert sind, ist es ein guter Zeitpunkt, mit einer der größten technischen Revolutionen dieser Generation zu beginnen.

Für die Zukunft ist GPT-5 in weiter Ferne und stellt einen möglichen Nachfolger dar. Zu lernen, wie man mit den frühen NLP-Modellen umgeht, kann Ihnen einen Vorteil verschaffen und es Ihnen ermöglichen, zukünftige Aktualisierungen optimal zu nutzen. Die Technologie verändert bereits unsere Welt, daher ist jetzt genau der richtige Zeitpunkt, damit anzufangen.

Myles Leva

Was ist GPT 4?