Nachrichten (DE)

OpenAI bringt o3- und o4-mini-Modelle mit fortschrittlicher Bildbeurteilung und Tools auf den Markt

OpenAI
Foto: OpenAI - Novikov Aleksey/ Shutterstock.com

OpenAI bringt o3- und o4-mini-Modelle mit Fortschritten im visuellen Denken und der Verwendung integrierter Tools auf den Markt. Das Unternehmen gab an diesem Mittwoch die Einführung der neuen Modelle der O-Serie bekannt, die einen erheblichen Fortschritt in der Verarbeitungsfähigkeit darstellen. Der o3 ist der bisher leistungsstärkste in der Reihe, während der o4-mini optimierte Leistung bei geringeren Kosten und höherer Geschwindigkeit bietet. Esses-Modelle wurden darauf trainiert, länger zu denken, bevor sie reagierten, wobei Kettenschlussfolgerungen mit Unterstützung mehrerer Modalitäten integriert wurden.

Modelle ermöglichen die direkte Integration von Bildern in den Argumentationsprozess. Usuários lädt möglicherweise Diagramme, Skizzen oder Whiteboards von geringer Qualität zur Analyse und Bearbeitung hoch. Die Essa-Funktionalität erweitert Anwendungen in technische und kreative Bereiche.

Schlüsselfunktionen der neuen Modelle

OpenAI o3 ist führend in der Leistung in Bezug auf Codierung, Mathematik, Naturwissenschaften und visuelle Wahrnehmungs-Benchmarks. Ele übertrifft frühere Versionen bei Aufgaben, die erweitertes Denken und den Einsatz nativer Tools erfordern. Das Modell kombiniert Websuche, Codeausführung in Python, Dateianalyse und Bildgenerierung in einzelnen Streams.

Der o4-mini ist auf Effizienz ausgelegt. Ele behält bei ähnlichen Aufgaben ein hohes Maß an Genauigkeit bei, jedoch mit reduzierter Latenz und geringeren Kosten. Die Version Essa richtet sich an Benutzer, die schnelle Antworten ohne nennenswerte Qualitätseinbußen benötigen.

Beide Modelle unterstützen vollständige Tools. Incluem Webnavigation, Dateianalyse, Automatisierungen und kontextbezogenes Gedächtnis für konsistentere Interaktionen.

Verfügbarkeit und Erstzugang

ChatGPT Plus, Pro und Team erhielten sofortigen Zugriff auf die Modelle in der Optionsauswahl. Der o3 scheint die erste Wahl für komplexe Aufgaben zu sein, während die o4-mini- und Hochleistungsvarianten die bisherigen Optionen ersetzen. Die API-Veröffentlichung erfolgt für Entwickler schrittweise.

Kostenlose Benutzer können bald auf eingeschränkte Funktionen stoßen. Das Unternehmen priorisiert einen kontrollierten Rollout, um Stabilität zu gewährleisten und Feedback zu sammeln.

Fortschritte beim Denken mit Bildern

OpenAI hebt die Fähigkeit zum „Denken mit Bildern“ als Unterscheidungsmerkmal hervor. Modelle beschreiben nicht nur visuelle Inhalte, sondern integrieren Bildinformationen direkt in die Problemlösungslogik. Mit Isso können Sie visuelle Elemente während der Verarbeitung manipulieren, zuschneiden oder transformieren.

Beispiele hierfür sind die Analyse technischer Diagramme oder manueller Skizzen. Das System identifiziert räumliche Beziehungen und wendet schrittweise Überlegungen an, um genaue Schlussfolgerungen zu ziehen.

Diese Innovation eröffnet Möglichkeiten für Anwendungen in den Bereichen Technik, Bildung und wissenschaftliche Forschung. Profissionais kann Flussdiagramme oder Notizen für detaillierte Erläuterungen oder Korrekturen einreichen.

Leistung in Benchmarks und Vergleichen

o3 stellt neue Rekorde bei unabhängiger Kodierung und fortgeschrittenen Mathematikbewertungen auf. Ele zeigt Überlegenheit bei Problemen, die mehrere logische Schritte und interne Überprüfung erfordern. Resultados weist bei standardisierten Metriken deutliche Fortschritte gegenüber seinem Vorgänger o1 auf.

Der o4-mini vereint Leistung und Effizienz. Ele erreicht bei ausgewählten Aufgaben Werte nahe o3, allerdings bei deutlich geringerem Ressourcenverbrauch. Die Essa-Optimierung erleichtert Unternehmen und einzelnen Entwicklern die Verwendung in großem Maßstab.

Sicherheitsbewertungen zeigen, dass beide Modelle widerstandsfähig gegen Versuche sind, Beschränkungen zu umgehen. Eles lehnt schädliche Inhalte konsequent ab.

Integration mit Tools und Ökosystem

Modelle integrieren von Natur aus Werkzeuge in die Argumentation. Isso umfasst die Codeausführung Python für komplexe Berechnungen und die Websuche nach aktuellen Daten. Durch die Kombination können Sie reale Probleme lösen, die mehrere Quellen und Überprüfungen erfordern.

Tools wie Dateianalyse und Bildgenerierung erweitern den Nutzen. Usuários erstellt vollständige Abläufe in einer einzigen Interaktion, von der Suche bis zur Anzeige der Ergebnisse.

Das Unternehmen hat ergänzende Tools für Programmierer veröffentlicht. Elas erleichtern die Integration in Entwicklungsumgebungen und beschleunigen Arbeitsabläufe.

Sicherheitsmaßnahmen und -bewertungen

OpenAI wendete ein aktualisiertes Vorbereitungsrahmenwerk an, um Risiken zu bewerten. Die Modelle erreichten in kritischen Kategorien wie biologischen Fähigkeiten, Cybersicherheit oder Selbstverbesserung keine hohen Schwellenwerte. Eine unabhängige Überprüfung bestätigte die ordnungsgemäße Ausrichtung.

Zu den Maßnahmen gehören strenge Tests zur Ablehnung schädlicher Inhalte und Widerstandsfähigkeit gegen Jailbreaks. Das Unternehmen überwacht weiterhin die Produktionsnutzung auf notwendige Anpassungen.