ChatGPT: API veröffentlicht – Entwickler können den Chat-Bot jetzt in Apps nutzen
Für ChatGPT hat OpenAI nun eine API und Whisper-Modelle veröffentlicht, welche Entwickler in ihre Apps und Produkte integrieren können.
Hamburg - ChatGPT- und Whisper-Modelle sind jetzt über eine API verfügbar, was Entwicklern Zugang zu modernsten Chat, Sprach- und Spracherkennungsfunktionen gibt. Durch eine Reihe von systemweiten Optimierungen hat OpenAI seit Dezember eine deutliche Kostenreduzierung für ChatGPT erreicht. Diese Einsparungen werden nun an die API-Benutzer weitergegeben.
Unternehmen | OpenAI |
Sitz | San Francisco, California, USA |
Gründung | 11. Dezember 2015 |
Leitung | Sam Altman |
ChatGPT API: Entwickler können Open-Source-Modell Whisper nutzen
Entwickler können das Open-Source-Modell Whisper large-v2 jetzt über die API mit schnelleren und kosteneffektiveren Ergebnissen nutzen. ChatGPT-API-Benutzer können außerdem kontinuierliche Modellverbesserungen erwarten und haben die Option, dedizierte Kapazitäten auszuwählen, um eine bessere Kontrolle über die Modelle zu haben.
ChatGPT-API: Aktuelles Modell gpt-3.5-turbo und Infos zu ChatML
Die ChatGPT-Modellfamilie, die OpenAI veröffentlicht hat, ist gpt-3.5-turbo. Es ist dasselbe Modell, das im ChatGPT-Produkt verwendet wird. Es kostet $0,002 pro 1.000 Tokens, was 10-mal günstiger ist als beim bisherigen GPT-3.5-Modell. Außerdem lässt sich das Modell für viele Nicht-Chat-Anwendungsfälle nutzen - OpenAI hat beobachtet, dass frühe Tester von text-davinci-003 zu gpt-3.5-turbo wechseln und dabei nur eine geringe Anpassung ihrer Anfragen vornehmen müssen.
Tokens - Begriffserklärung
Tokens werden bei der Textcodierung durch ChatGPT verwendet. Tokens können als Teile von Wörtern betrachtet werden. Bevor die API die Anfragen verarbeitet, wird die Eingabe in Tokens aufgeteilt. Diese Tokens werden nicht genau an den Stellen geschnitten, an denen die Wörter beginnen oder enden - Tokens können abschließende Leerzeichen und sogar Teilwörter enthalten.
Traditionell verarbeiten GPT-Modelle unstrukturierten Text, der dem Modell als Sequenz von „Tokens“ übergeben wird. ChatGPT-Modelle verarbeiten stattdessen eine Sequenz von Nachrichten, zusammen mit Metadaten. (Für Neugierige: Unter der Haube wird die Eingabe immer noch als Sequenz von „Tokens“ für das Modell dargestellt, das Rohformat, das vom Modell verwendet wird, ist ein neues Format namens Chat Markup Language („ChatML“).)

Was ist ChatML? ChatML ist eine neue Formatierungssprache, die speziell für die Verarbeitung von Textnachrichten durch ChatGPT-Modelle entwickelt wurde. Die Sprache ist eine Erweiterung von HTML und XML und verwendet eine ähnliche Syntax, um Text mit strukturellen Elementen zu versehen. Im Gegensatz zu diesen Sprachen ist ChatML jedoch auf die spezifischen Anforderungen von Chat-Interaktionen zugeschnitten.
Die Verwendung von ChatML ermöglicht es Entwicklern, Chat-Nachrichten in einem für ChatGPT-Modelle optimierten Format zu präsentieren. Dies kann dazu beitragen, die Genauigkeit und Qualität von Chat-Antworten zu verbessern, da die Modelle die Nachrichten besser verstehen können.
Erst kürzlich haben wir in der Redaktion ChatGTP einen Meinungsartikel zu den Konsolen PS5 und Xbox Series X schreiben lassen, der erstaunlich emotional war. Mit der Weiterentwicklung von ChatML wird sicherlich auch in diesem Bereich noch viel Interessantes auf uns warten.
ChatGPT-Upgrades: Entwickler sollen regelmäßig stabile neue Versionen erhalten
OpenAI informiert auf ihrer Webseite darüber, dass sie ständig ihre ChatGPT-Modelle verbessern wollen und Entwicklern Zugang zu stabilen Versionen geben möchten. Dennoch haben Entwickler immer die Möglichkeit, zwischen bestimmten Modellversionen auszuwählen. Aktuell wurde gpt-3.5-turbo-0301 veröffentlicht, welches bis zum 1. Juni 2023 unterstützt wird. Ab April möchte das KI-Unternehmen das Modell auf eine neue, stabile Version aktualisieren.
Whisper-API: large-v2-Modell ist jetzt verfügbar
Whisper ist das Sprach-zu-Text-Modell, welches OpenAI im September 2022 als Open-Source veröffentlicht hatte. Dieses war in der Anwendung noch recht kompliziert. Jetzt ist das neue large-v2-Modell von Whisper verfügbar, welches einen On-Demand-Zugriff ermöglicht. Die Whisper-API kann einmal in die Quellsprache transkribieren, oder ins Englische übersetzen. Dabei wird eine Vielzahl von Formaten akzeptiert (m4a, mp3, mp4, mpeg, mpga, wav, webm).

OpenAI weist in ihrer Veröffentlichungs-Meldung nochmals auf die Chancen durch Künstliche Intelligenz für die Wirtschaft hin und sagt: „Wir glauben, dass KI unglaubliche Chancen und wirtschaftliche Stärkung für jeden bieten kann, und der beste Weg, dies zu erreichen, besteht darin, jedem den Aufbau damit zu ermöglichen. Wir hoffen, dass die von uns heute angekündigten Änderungen zu zahlreichen Anwendungen führen werden, von denen jeder profitieren kann.“