Anthropic bringt Claude Opus 4.8 auf den Markt: erhebliche Fortschritte bei KI, autonomer Codierung und größerer Systemehrlichkeit
Anthropic kündigte die Veröffentlichung seines neuesten Modells für künstliche Intelligenz, Claude Opus 4.8, an, was einen bedeutenden Fortschritt in der Fähigkeit autonomer Systeme darstellt. Das Unternehmen hebt entscheidende Verbesserungen in mehreren Bereichen hervor und verwandelt das Modell in einen effektiveren und zuverlässigeren Mitarbeiter für komplexe Aufgaben. Das Esta-Update zielt darauf ab, die Interaktion der Benutzer mit der KI zu optimieren und ihr Potenzial in professionellen und technischen Szenarien zu erweitern.
Das neue Modell umfasst Innovationen in der autonomen Codierung, dem multidisziplinären Denken und der autonomen Computernutzung sowie die Verbesserung der intellektuellen Arbeit und der autonomen Finanzanalyse. Die Essas-Funktionen positionieren den Claude Opus 4.8 als robustes Werkzeug zur Bewältigung von Herausforderungen, die eine hohe Genauigkeit und Informationsverarbeitungskapazität erfordern. Die Einführung von Opus 4.8 spiegelt die kontinuierlichen Bemühungen wider, die Leistung und Integrität der künstlichen Intelligenz zu verbessern.
Aprimoramentos in Leistung und Zuverlässigkeit
Die von Experten durchgeführte Avaliações-Analyse ergab, dass sich Claude Opus 4.8 in seinen Beurteilungen bei der Durchführung von Aktionsaufgaben als zuverlässigeres und genaueres Modell erweist. Anthropic betont, dass die Verbesserungen bei der Ehrlichkeit erheblich waren. Usuários berichtete zunächst, dass Opus 4.8 eher dazu neigt, Unsicherheiten über seine eigene Funktionsweise zu signalisieren und unbegründete Aussagen zu vermeiden. Das Verhalten von Este legt die Messlatte für Transparenz und Sicherheit bei der Interaktion mit KI höher.
Die internen Einschätzungen des Unternehmens bestätigen diese Einschätzung und zeigen, dass bei Opus 4.8 die Wahrscheinlichkeit, dass Fehler im Code unbemerkt bleiben, im Vergleich zum Vorgänger etwa viermal geringer ist. Die Fehlerselbsterkennungsfähigkeit von Essa stellt einen Sprung in der Robustheit und Zuverlässigkeit des Systems dar. Das Modell ist daher darauf ausgelegt, mit größerer Autonomie zu arbeiten und das Risiko der Verbreitung ungenauer oder falscher Informationen zu verringern.
Avaliações Ausrichtung und prosoziale Merkmale
Ergebnisse von Ausrichtungsbewertungen legen nahe, dass Claude Opus 4.8 neue Höhen bei der Messung prosozialer Merkmale erreicht. Isso bietet eine größere Unterstützung für Benutzerautonomie und konsistentes Handeln im besten Interesse des Benutzers. Die Architektur des Modells wurde entwickelt, um eine ethischere und menschenzentriertere Interaktion zu fördern und sicherzustellen, dass seine Abläufe auf die Ziele des Benutzers abgestimmt sind.
Die Häufigkeit von Fehlverhalten wie Täuschung wurde in Opus 4.8 deutlich reduziert und weist niedrigere Werte auf als in Opus 4.7. Die Esses-Nummern ähneln denen der Vorschauversion von Claude Mythos. Die Konsistenz von Essa bei der Ausrichtung zeigt das Engagement von Anthropic für die Entwicklung von KI-Modellen, die nicht nur leistungsstark, sondern auch verantwortungsvoll und sicher in ihren Interaktionen sind.
Benchmarks und Geschwindigkeitsoptimierung
Von Anthropic veröffentlichte Benchmarks zeigen die überlegene Leistung von Claude Opus 4.8 bei Codierungstests. Das Modell erreichte 69,2 % im SWE-Bench Pro, ein Index, der es in diesem und mehreren anderen Benchmarks über Konkurrenten wie GPT-5.5 und Gemini 3.1 Pro stellt. Embora oder GPT-5.5 behalten die Führung im Terminal-Encoding-Benchmark, die Gesamtleistung von Opus 4.8 ist bemerkenswert.
Der Schnellmodus von Claude Opus 4.8 wurde ebenfalls verbessert und arbeitet nun mit der 2,5-fachen Geschwindigkeit. Adicionalmente kostet dieser Modus jetzt dreimal weniger als frühere Modelle. Die Geschwindigkeits- und Kosteneffizienzoptimierung von Essa erweitert den Zugang zu erweiterten KI-Funktionen für eine größere Anzahl von Entwicklern und Unternehmen. Der Anthropic versucht, hohe Leistung mit betrieblicher Effizienz in Einklang zu bringen.
Novas-Funktionen für Entwickler
Anthropic erweitert seine Produktlinie um wichtige neue Funktionen und ergänzt die Veröffentlichung von Claude Opus 4.8. Die Funktionen von Essas zielen darauf ab, Entwicklern, die die Plattform nutzen, mehr Flexibilität und Kontrolle zu bieten.
- Dynamischer Job Fluxos (Suchvorschau):Claude kann jetzt größere Aufgaben innerhalb von Claude Code erledigen. Ele kann Arbeit planen und Hunderte von Subagenten parallel in einer einzigen Sitzung ausführen. Es ist möglich, Migrationen im Quellcodemaßstab durchzuführen, die Hunderttausende Codezeilen umfassen. Die Funktion ist für die Pläne Claude Code Enterprise, Team und Max verfügbar.
- Controle Aufwand:No Claude.ai und Cowork können Benutzer den Grad des Aufwands wählen, den Claude in eine Antwort steckt. Bei einer niedrigeren Einstellung reagiert Claude schneller und verbraucht Ratengrenzen langsamer. Opus 4.8 verwendet standardmäßig die hohe Aufwandsstufe, die laut Anthropic die beste Balance zwischen Qualität und Benutzererfahrung bietet.
- Mensagens-API:Die Mensagens-API akzeptiert Systemeingaben innerhalb der Nachrichtenmatrix, sodass Entwickler Claude-Anweisungen während der Aufgabenausführung aktualisieren können.
Disponibilidade und zukünftige Entwicklungen
Claude Opus 4.8 ist jetzt in allen Regionen verfügbar, wobei der Preis für die regelmäßige Nutzung im Vergleich zur Vorgängerversion Opus 4.7 unverändert bleibt. Das Unternehmen garantiert, dass der Übergang zum neuen Modell für bestehende Benutzer reibungslos verläuft.
Anthropic setzt seine Arbeit an der Entwicklung von Modellen mit den gleichen Fähigkeiten wie Opus 4.8 fort, jedoch zu geringeren Kosten. Além Darüber hinaus konzentriert sich das Unternehmen auf eine neue Modellklasse, die noch intelligenter sein wird als das Opus. Medidas-Sicherheitsmodelle für das Claude Mythos-Modell werden mit einer kleinen Anzahl von Organisationen entwickelt und getestet. Es wird erwartet, dass Modelle der Mythos-Klasse in den kommenden Wochen allen Kunden zur Verfügung gestellt werden.
Veja Tambem em Aktuelle Nachrichten (DE)
Xiaomi Smart Band 10 Pro kommt mit einem helleren Bildschirm und einer Akkulaufzeit von bis zu 21 Tagen auf den Weltmarkt
Studie schlägt neue Planetenbildung vor: Die meisten Sub-Neptune haben keinen Kern oder Mantel wie die Erde
Der südkoreanische Hersteller treibt den Test der One UI 8.5-Schnittstelle voran und erweitert den Zugang für neue Mobiltelefone
Apple veröffentlicht watchOS 26.4 und macOS Tahoe 26.4 mit nativer Unterstützung für AirPods Max 2
Die Details des OnePlus Ace 6 Ultra deuten auf einen 8500-mAh-Akku und einen 165-Hz-Bildschirm für anspruchsvolles Gaming hin
Die Einstiegsversion des Caoa Chery Tiggo 5X Sport widerspricht dem Markt und gewinnt in der Fipe-Tabelle an Wert
Oura Ring 4 bietet Technologieanwendern eine detaillierte Gesundheitsüberwachung in einem diskreten Format
Das INSS sendet per WhatsApp eine Lebensnachweisbenachrichtigung an Begünstigte mit ausstehenden Problemen
War Robots, ein Actionspiel aus dem Jahr 2014, erscheint überraschend kostenlos für PS4 und PS5
Samsung Galaxy A57 kommt mit IP68 dünner; Überprüfen Sie den Preisvergleich und das technische Datenblatt mit A56
Der elektrische Lukendeckel Dolphin Mini übertrifft die Fahrzeuge mit Verbrennungsmotor und führt im Februar den Einzelhandelsverkauf an