Senaste Nytt (SV)

Anthropic lanserar Claude Opus 4.8: betydande vinster inom AI, autonom kodning och större systemärlighet

Anthropic, Claude
Foto: Anthropic, Claude - gguy / Shutterstock.com

Anthropic tillkännagav lanseringen av sin senaste artificiella intelligensmodell, Claude Opus 4.8, vilket markerar ett betydande framsteg inom autonoma systemkapacitet. Företaget lyfter fram avgörande förbättringar inom flera områden, vilket gör modellen till en mer effektiv och pålitlig samarbetspartner för komplexa uppgifter. Esta-uppdateringen syftar till att optimera användarnas interaktion med AI och utöka dess potential i professionella och tekniska scenarier.

Den nya modellen innehåller innovationer inom autonom kodning, multidisciplinära resonemang och autonom datoranvändning, förutom att förbättra intellektuellt arbete och autonom finansiell analys. Essas-funktioner positionerar Claude Opus 4.8 som ett robust verktyg för att hantera utmaningar som kräver hög noggrannhet och informationsbehandlingskapacitet. Ankomsten av Opus 4.8 återspeglar ett pågående arbete för att förfina prestanda och integritet hos artificiell intelligens.

Aprimoramentos i prestanda och tillförlitlighet

Avaliações utförd av experter avslöjade att Claude Opus 4.8 visar sig vara en mer pålitlig och korrekt modell i sina bedömningar när man utför åtgärdsuppgifter. Anthropic betonar att förbättringarna i ärlighet har varit betydande. Usuários rapporterade initialt att Opus 4.8 har en större benägenhet att signalera osäkerheter om sin egen funktion, att undvika att göra ogrundade påståenden. Este-beteende höjer ribban för transparens och säkerhet vid interaktion med AI.

Företagets interna bedömningar bekräftar denna uppfattning, vilket indikerar att Opus 4.8 är ungefär fyra gånger mindre sannolikt att tillåta brister i sin kod att förbli obemärkta, jämfört med sin föregångare. Essa:s felsjälvdetekteringsförmåga representerar ett steg i systemets robusthet och tillförlitlighet. Modellen är därför utformad för att fungera med större autonomi och mindre risk för att sprida felaktig eller felaktig information.

Avaliações anpassning och prosociala egenskaper

Resultat från anpassningsbedömningar tyder på att Claude Opus 4.8 når nya höjder i mått på prosociala egenskaper. Isso inkluderar större stöd för användarens autonomi och konsekvent agerande i användarens bästa. Modellens arkitektur utformades för att främja mer etisk och människocentrerad interaktion, vilket säkerställer att dess verksamhet är i linje med användarens mål.

Frekvensen av felaktigt beteende såsom bedrägeri har reducerats avsevärt i Opus 4.8, vilket visar lägre nivåer än i Opus 4.7. Esses-nummer liknar förhandsgranskningsversionen av Claude Mythos. Essa-konsistens i anpassningen visar Anthropic:s engagemang för att utveckla AI-modeller som inte bara är kraftfulla, utan också ansvarsfulla och säkra i sin interaktion.

Benchmarks och hastighetsoptimering

Benchmarks släppta av Anthropic indikerar den överlägsna prestandan hos Claude Opus 4.8 i kodningstest. Modellen fick 69,2% i SWE-Bench Pro, ett index som placerar den över konkurrenter som GPT-5.5 och Gemini 3.1 Pro i detta och flera andra benchmarks. Embora o GPT-5.5 bibehåller ledningen i terminalkodningsriktmärket, den övergripande prestandan för Opus 4.8 är anmärkningsvärd.

Snabbläget för Claude Opus 4.8 har också förbättrats för att fungera med 2,5 gånger hastigheten. Adicionalmente, detta läge kostar nu tre gånger mindre än tidigare modeller. Essa optimering av hastighet och kostnadseffektivitet utökar tillgången till avancerade AI-funktioner till ett större antal utvecklare och företag. Anthropic strävar efter att balansera hög prestanda med operativ effektivitet.

Novas-funktioner för utvecklare

Anthropic lägger till viktiga nya funktioner till sin produktlinje, som komplement till releasen av Claude Opus 4.8. Essas-funktioner syftar till att erbjuda större flexibilitet och kontroll till utvecklare som använder plattformen.

  • Dynamiskt jobb Fluxos (förhandsgranskning av sökning):Claude kan nu utföra större uppgifter inom Claude Code. Ele kan schemalägga arbete och köra hundratals subagenter parallellt i en enda session. Det är möjligt att utföra migrering i källkodsskala som spänner över hundratusentals rader kod. Funktionen är tillgänglig för Claude Code Enterprise-, Team- och Max-planer.
  • Controle av ansträngning:No Claude.ai och Cowork, kan användare välja nivån av ansträngning Claude lägger på ett svar. Med en lägre inställning kommer Claude att svara snabbare och konsumera hastighetsgränser långsammare. Opus 4.8 använder den höga ansträngningsnivån som standard, vilket Anthropic hävdar erbjuder den bästa balansen mellan kvalitet och användarupplevelse.
  • Mensagens API:Mensagens API accepterar systemindata i meddelandematrisen, vilket gör att utvecklare kan uppdatera Claude-instruktioner under utförandet av uppgiften.

Disponibilidade och framtida utvecklingar

Claude Opus 4.8 är nu tillgänglig i alla regioner, med priset för regelbunden användning oförändrat jämfört med den tidigare versionen, Opus 4.7. Företaget garanterar att övergången till den nya modellen blir flytande för befintliga användare.

Anthropic fortsätter sitt arbete med att utveckla modeller med samma möjligheter som Opus 4.8, men till en lägre kostnad. Além Dessutom är företaget fokuserat på en ny klass av modeller som kommer att vara ännu smartare än Opus. Medidas säkerhetsmodeller för Claude Mythos-modellen utvecklas och testas med ett litet antal organisationer. Förväntningen är att modeller i klassen Mythos kommer att göras tillgängliga för alla kunder under de kommande veckorna.