Anthropic lança Claude Opus 4.8: ganhos expressivos em IA, codificação autônoma e maior honestidade do sistema
A Anthropic anunciou o lançamento de seu mais recente modelo de inteligência artificial, o Claude Opus 4.8, marcando um avanço significativo na capacidade de sistemas autônomos. A empresa destaca melhorias cruciais em diversas áreas, transformando o modelo em um colaborador mais eficaz e confiável para tarefas complexas. Esta atualização visa otimizar a interação dos usuários com a IA, expandindo seu potencial em cenários profissionais e técnicos.
O novo modelo incorpora inovações em codificação autônoma, raciocínio multidisciplinar e uso autônomo de computadores, além de aprimorar o trabalho intelectual e a análise financeira autônoma. Essas características posicionam o Claude Opus 4.8 como uma ferramenta robusta para enfrentar desafios que exigem alta precisão e capacidade de processamento de informações. A chegada do Opus 4.8 reflete um esforço contínuo para refinar a performance e a integridade da inteligência artificial.
Aprimoramentos em desempenho e confiabilidade
Avaliações realizadas por especialistas revelaram que o Claude Opus 4.8 demonstra ser um modelo mais confiável e preciso em seus julgamentos ao executar tarefas de ação. A Anthropic enfatiza que as melhorias em honestidade foram substanciais. Usuários iniciais reportaram que o Opus 4.8 tem maior propensão a sinalizar incertezas sobre seu próprio funcionamento, evitando fazer afirmações sem fundamento. Este comportamento eleva o padrão de transparência e segurança na interação com a IA.
As avaliações internas da empresa confirmam esta percepção, indicando que o Opus 4.8 tem aproximadamente quatro vezes menos probabilidade de permitir que falhas em seu código passem despercebidas, comparado ao seu predecessor. Essa capacidade de autodetecção de erros representa um salto na robustez e na confiabilidade do sistema. O modelo, portanto, é projetado para operar com maior autonomia e menor risco de propagar informações imprecisas ou incorretas.
Avaliações de alinhamento e características pró-sociais
Os resultados das avaliações de alinhamento sugerem que o Claude Opus 4.8 alcança novos patamares em medidas de características pró-sociais. Isso inclui um maior apoio à autonomia do usuário e uma atuação consistente no melhor interesse do utilizador. A arquitetura do modelo foi projetada para promover uma interação mais ética e centrada no ser humano, garantindo que suas operações estejam alinhadas com os objetivos do usuário.
As taxas de comportamento desalinhado, como o engano, foram significativamente reduzidas no Opus 4.8, apresentando níveis menores do que no Opus 4.7. Esses números são semelhantes aos da versão prévia do Claude Mythos. Essa consistência no alinhamento demonstra o compromisso da Anthropic com o desenvolvimento de modelos de IA que sejam não apenas potentes, mas também responsáveis e seguros em suas interações.
Benchmarks e otimização de velocidade
Os benchmarks divulgados pela Anthropic indicam o desempenho superior do Claude Opus 4.8 em testes de codificação. O modelo obteve 69,2% no SWE-Bench Pro, um índice que o coloca acima de concorrentes como GPT-5.5 e Gemini 3.1 Pro nesse e em vários outros benchmarks. Embora o GPT-5.5 mantenha a liderança no benchmark de codificação de terminal, o desempenho geral do Opus 4.8 é notável.
O modo rápido do Claude Opus 4.8 também foi aprimorado para operar com uma velocidade 2,5 vezes maior. Adicionalmente, este modo agora custa três vezes menos do que os modelos anteriores. Essa otimização de velocidade e custo-benefício amplia o acesso a recursos avançados de IA para um número maior de desenvolvedores e empresas. A Anthropic busca balancear alta performance com eficiência operacional.
Novas funcionalidades para desenvolvedores
A Anthropic está adicionando novos recursos importantes à sua linha de produtos, complementando o lançamento do Claude Opus 4.8. Essas funcionalidades visam oferecer maior flexibilidade e controle aos desenvolvedores que utilizam a plataforma.
- Fluxos de trabalho dinâmicos (prévia da pesquisa): O Claude agora consegue concluir tarefas maiores dentro do Claude Code. Ele pode planejar o trabalho e executar centenas de subagentes em paralelo em uma única sessão. É possível realizar migrações em escala de código-fonte, abrangendo centenas de milhares de linhas de código. O recurso está disponível para os planos Claude Code Enterprise, Team e Max.
- Controle de esforço: No Claude.ai e no Cowork, os usuários podem escolher o nível de esforço que o Claude dedica a uma resposta. Com uma configuração mais baixa, o Claude responderá mais rapidamente e consumirá os limites de taxa mais lentamente. O Opus 4.8 utiliza, por padrão, o nível de esforço elevado, que a Anthropic afirma oferecer o melhor equilíbrio entre qualidade e experiência do usuário.
- API de Mensagens: A API de Mensagens aceita entradas do sistema dentro da matriz de mensagens, permitindo que os desenvolvedores atualizem as instruções de Claude durante a execução da tarefa.
Disponibilidade e futuros desenvolvimentos
O Claude Opus 4.8 já está disponível em todas as regiões, com o preço para uso regular mantendo-se inalterado em comparação com a versão anterior, o Opus 4.7. A empresa garante que a transição para o novo modelo será fluida para os usuários existentes.
A Anthropic continua seu trabalho no desenvolvimento de modelos com as mesmas capacidades do Opus 4.8, mas a um custo menor. Além disso, a empresa está focada em uma nova classe de modelos que serão ainda mais inteligentes que o Opus. Medidas de segurança para o modelo Claude Mythos estão sendo desenvolvidas e testadas com um pequeno número de organizações. A expectativa é de que modelos da classe Mythos sejam disponibilizados para todos os clientes nas próximas semanas.
Veja Tambem em Tecnologia
Nintendo eShop brasileira anuncia campanha de ofertas com descontos de até 75% em Jogos Indie para Switch 2 e Switch
Promoção traz Nintendo Switch 2 com jogo Pokémon por menos de R$ 4 mil no varejo
Marca Vertu, usada por Virgínia Fonseca, tem ficha técnica questionável e AI confusa
Galaxy Z Fold 8: novo vazamento de modelo 3D revela design mais largo do dobrável Samsung
Strauss Zelnick afirma que rivais de GTA 6 falham mesmo com ex-funcionários da Rockstar
Ragnarok Origin Classic chega às Américas com beta fechado em 4 de junho de 2026
Vírus BTMOB Rat assume controle total de celulares Android no Brasil, alerta ESET
Novidades PlayStation: State of Play de 2 junho de 2026 revela Wolverine, God of War e Intergalactic
Como escolher smart ring ideal para rastrear saúde e bem-estar diário
Cemig lança validador de conta de luz no app e clientes identificam boleto falso em segundos
Ubisoft confirma lançamento de Rayman Legends Retold em 1 de outubro com revelação na próxima semana