Aktuelle Nachrichten (DE)

Anthropic bringt Claude Opus 4.8 auf den Markt: erhebliche Fortschritte bei KI, autonomer Codierung und größerer Systemehrlichkeit

Anthropic, Claude
Foto: Anthropic, Claude - gguy / Shutterstock.com

Anthropic kündigte die Veröffentlichung seines neuesten Modells für künstliche Intelligenz, Claude Opus 4.8, an, was einen bedeutenden Fortschritt in der Fähigkeit autonomer Systeme darstellt. Das Unternehmen hebt entscheidende Verbesserungen in mehreren Bereichen hervor und verwandelt das Modell in einen effektiveren und zuverlässigeren Mitarbeiter für komplexe Aufgaben. Das Esta-Update zielt darauf ab, die Interaktion der Benutzer mit der KI zu optimieren und ihr Potenzial in professionellen und technischen Szenarien zu erweitern.

Das neue Modell umfasst Innovationen in der autonomen Codierung, dem multidisziplinären Denken und der autonomen Computernutzung sowie die Verbesserung der intellektuellen Arbeit und der autonomen Finanzanalyse. Die Essas-Funktionen positionieren den Claude Opus 4.8 als robustes Werkzeug zur Bewältigung von Herausforderungen, die eine hohe Genauigkeit und Informationsverarbeitungskapazität erfordern. Die Einführung von Opus 4.8 spiegelt die kontinuierlichen Bemühungen wider, die Leistung und Integrität der künstlichen Intelligenz zu verbessern.

Aprimoramentos in Leistung und Zuverlässigkeit

Die von Experten durchgeführte Avaliações-Analyse ergab, dass sich Claude Opus 4.8 in seinen Beurteilungen bei der Durchführung von Aktionsaufgaben als zuverlässigeres und genaueres Modell erweist. Anthropic betont, dass die Verbesserungen bei der Ehrlichkeit erheblich waren. Usuários berichtete zunächst, dass Opus 4.8 eher dazu neigt, Unsicherheiten über seine eigene Funktionsweise zu signalisieren und unbegründete Aussagen zu vermeiden. Das Verhalten von Este legt die Messlatte für Transparenz und Sicherheit bei der Interaktion mit KI höher.

Die internen Einschätzungen des Unternehmens bestätigen diese Einschätzung und zeigen, dass bei Opus 4.8 die Wahrscheinlichkeit, dass Fehler im Code unbemerkt bleiben, im Vergleich zum Vorgänger etwa viermal geringer ist. Die Fehlerselbsterkennungsfähigkeit von Essa stellt einen Sprung in der Robustheit und Zuverlässigkeit des Systems dar. Das Modell ist daher darauf ausgelegt, mit größerer Autonomie zu arbeiten und das Risiko der Verbreitung ungenauer oder falscher Informationen zu verringern.

Avaliações Ausrichtung und prosoziale Merkmale

Ergebnisse von Ausrichtungsbewertungen legen nahe, dass Claude Opus 4.8 neue Höhen bei der Messung prosozialer Merkmale erreicht. Isso bietet eine größere Unterstützung für Benutzerautonomie und konsistentes Handeln im besten Interesse des Benutzers. Die Architektur des Modells wurde entwickelt, um eine ethischere und menschenzentriertere Interaktion zu fördern und sicherzustellen, dass seine Abläufe auf die Ziele des Benutzers abgestimmt sind.

Die Häufigkeit von Fehlverhalten wie Täuschung wurde in Opus 4.8 deutlich reduziert und weist niedrigere Werte auf als in Opus 4.7. Die Esses-Nummern ähneln denen der Vorschauversion von Claude Mythos. Die Konsistenz von Essa bei der Ausrichtung zeigt das Engagement von Anthropic für die Entwicklung von KI-Modellen, die nicht nur leistungsstark, sondern auch verantwortungsvoll und sicher in ihren Interaktionen sind.

Benchmarks und Geschwindigkeitsoptimierung

Von Anthropic veröffentlichte Benchmarks zeigen die überlegene Leistung von Claude Opus 4.8 bei Codierungstests. Das Modell erreichte 69,2 % im SWE-Bench Pro, ein Index, der es in diesem und mehreren anderen Benchmarks über Konkurrenten wie GPT-5.5 und Gemini 3.1 Pro stellt. Embora oder GPT-5.5 behalten die Führung im Terminal-Encoding-Benchmark, die Gesamtleistung von Opus 4.8 ist bemerkenswert.

Der Schnellmodus von Claude Opus 4.8 wurde ebenfalls verbessert und arbeitet nun mit der 2,5-fachen Geschwindigkeit. Adicionalmente kostet dieser Modus jetzt dreimal weniger als frühere Modelle. Die Geschwindigkeits- und Kosteneffizienzoptimierung von Essa erweitert den Zugang zu erweiterten KI-Funktionen für eine größere Anzahl von Entwicklern und Unternehmen. Der Anthropic versucht, hohe Leistung mit betrieblicher Effizienz in Einklang zu bringen.

Novas-Funktionen für Entwickler

Anthropic erweitert seine Produktlinie um wichtige neue Funktionen und ergänzt die Veröffentlichung von Claude Opus 4.8. Die Funktionen von Essas zielen darauf ab, Entwicklern, die die Plattform nutzen, mehr Flexibilität und Kontrolle zu bieten.

  • Dynamischer Job Fluxos (Suchvorschau):Claude kann jetzt größere Aufgaben innerhalb von Claude Code erledigen. Ele kann Arbeit planen und Hunderte von Subagenten parallel in einer einzigen Sitzung ausführen. Es ist möglich, Migrationen im Quellcodemaßstab durchzuführen, die Hunderttausende Codezeilen umfassen. Die Funktion ist für die Pläne Claude Code Enterprise, Team und Max verfügbar.
  • Controle Aufwand:No Claude.ai und Cowork können Benutzer den Grad des Aufwands wählen, den Claude in eine Antwort steckt. Bei einer niedrigeren Einstellung reagiert Claude schneller und verbraucht Ratengrenzen langsamer. Opus 4.8 verwendet standardmäßig die hohe Aufwandsstufe, die laut Anthropic die beste Balance zwischen Qualität und Benutzererfahrung bietet.
  • Mensagens-API:Die Mensagens-API akzeptiert Systemeingaben innerhalb der Nachrichtenmatrix, sodass Entwickler Claude-Anweisungen während der Aufgabenausführung aktualisieren können.

Disponibilidade und zukünftige Entwicklungen

Claude Opus 4.8 ist jetzt in allen Regionen verfügbar, wobei der Preis für die regelmäßige Nutzung im Vergleich zur Vorgängerversion Opus 4.7 unverändert bleibt. Das Unternehmen garantiert, dass der Übergang zum neuen Modell für bestehende Benutzer reibungslos verläuft.

Anthropic setzt seine Arbeit an der Entwicklung von Modellen mit den gleichen Fähigkeiten wie Opus 4.8 fort, jedoch zu geringeren Kosten. Além Darüber hinaus konzentriert sich das Unternehmen auf eine neue Modellklasse, die noch intelligenter sein wird als das Opus. Medidas-Sicherheitsmodelle für das Claude Mythos-Modell werden mit einer kleinen Anzahl von Organisationen entwickelt und getestet. Es wird erwartet, dass Modelle der Mythos-Klasse in den kommenden Wochen allen Kunden zur Verfügung gestellt werden.