OpenAI verstärkt Entwicklerengagement mit leistungsstärkeren Modellen in seiner API
OpenAI hat am Montag neue API-Updates vorgestellt, die GPT-5 Pro, sein neuestes Sprachmodell, sowie das neue Video-Generierungsmodell Sora 2 und ein kleineres, kostengünstigeres Sprachmodell einführen.
Die Updates sind Teil einer Reihe von Ankündigungen, die darauf abzielen, Entwickler in OpenAIs Ökosystem zu gewinnen, einschließlich der Einführung eines Tools zur Erstellung von Agenten und der Möglichkeit, Apps in ChatGPT zu erstellen.
Die Einführung von GPT-5 Pro könnte für Entwickler, die Anwendungen in den Bereichen Finanzen, Recht und Gesundheitswesen entwickeln, ansprechend sein – Branchen, die eine „hohe Genauigkeit und Tiefe des Denkens“ benötigen, so Sam Altman, CEO von OpenAI.
Altman bemerkte auch, dass Sprachfähigkeiten in Zukunft entscheidend sein werden, da sie schnell zu einer der Hauptmethoden werden, mit denen Menschen mit KI interagieren. Zu diesem Zweck führt OpenAI „gpt-realtime mini“ ein, ein kleineres, kostengünstigeres Sprachmodell in der API, das latenzfreie Streaming-Interaktionen für Audio und Sprache unterstützt. Das neue Modell ist 70 % günstiger als OpenAIs vorheriges fortschrittliches Sprachmodell, verspricht jedoch die „gleiche Sprachqualität und Ausdruckskraft“.
Schließlich können Schöpfer, die an OpenAIs Entwicklerökosystem beteiligt sind, jetzt auf Sora 2 im API-Vorabzugriff zugreifen. OpenAI veröffentlichte Sora 2, seinen neuesten Audio- und Video-Generator, letzte Woche zusammen mit der Sora-App, einem TikTok-Konkurrenten, der mit kurzen KI-generierten Videos gefüllt ist. Die Sora-App ermöglicht es Benutzern, Videos von sich selbst, Freunden oder allem basierend auf einem Prompt zu erstellen und über einen TikTok-ähnlichen algorithmischen Feed zu teilen.
„[Entwickler] haben jetzt Zugriff auf dasselbe Modell, das die beeindruckenden Videoausgaben von Sora 2 direkt in Ihrer eigenen App antreibt“, sagte Altman.
Sora 2 baut auf der vorherigen Generation auf und bietet realistischere, physikalisch konsistente Szenen mit synchronisiertem Sound und größerer kreativer Kontrolle – von detaillierter Kameraführung bis hin zu stilisierten visuellen Effekten.