Son Haberler (TR)

Anthropic, Claude Opus 4.8’i piyasaya sürdü: AI, otonom kodlama ve daha fazla sistem dürüstlüğünde önemli kazanımlar

Anthropic, Claude
Foto: Anthropic, Claude - gguy / Shutterstock.com

Anthropic, otonom sistem kapasitesinde önemli bir ilerlemeye işaret eden en son yapay zeka modeli Claude Opus 4.8’in piyasaya sürüldüğünü duyurdu. Şirket, modeli karmaşık görevler için daha etkili ve güvenilir bir işbirlikçiye dönüştürerek çeşitli alanlardaki önemli iyileştirmeleri öne çıkarıyor. Esta güncellemesi, profesyonel ve teknik senaryolardaki potansiyelini genişleterek kullanıcıların yapay zeka ile etkileşimini optimize etmeyi amaçlıyor.

Yeni model, entelektüel çalışmayı ve otonom finansal analizi geliştirmenin yanı sıra, otonom kodlama, çok disiplinli akıl yürütme ve otonom bilgisayar kullanımındaki yenilikleri de içeriyor. Essas özellikleri, Claude Opus 4.8’i yüksek doğruluk ve bilgi işleme kapasitesi gerektiren zorlukların üstesinden gelmek için güçlü bir araç olarak konumlandırır. Opus 4.8’in gelişi, yapay zekanın performansını ve bütünlüğünü iyileştirmeye yönelik devam eden çabayı yansıtıyor.

Performans ve güvenilirlikte Aprimoramentos

Uzmanlar tarafından gerçekleştirilen Avaliações, Claude Opus 4.8’in eylem görevlerini gerçekleştirirken kararlarında daha güvenilir ve doğru bir model olduğunu kanıtladığını ortaya koydu. Anthropic, dürüstlük konusundaki ilerlemelerin önemli olduğunu vurguluyor. Usuários başlangıçta Opus 4.8’in, asılsız beyanlarda bulunmaktan kaçınarak kendi işleyişi hakkındaki belirsizlikleri işaret etme eğiliminin daha yüksek olduğunu bildirdi. Este davranışı, yapay zeka ile etkileşimde bulunurken şeffaflık ve güvenlik çıtasını yükseltir.

Şirketin dahili değerlendirmeleri bu algıyı doğruluyor ve Opus 4.8’in önceki sürüme kıyasla kodundaki kusurların fark edilmemesine izin verme olasılığının yaklaşık dört kat daha az olduğunu gösteriyor. Essa’nin hatayı kendi kendine algılama yeteneği, sistem sağlamlığı ve güvenilirliğinde bir sıçramayı temsil eder. Bu nedenle model, daha fazla özerklikle ve daha az yanlış veya hatalı bilgi yayma riskiyle çalışacak şekilde tasarlanmıştır.

Avaliações Uyumluluk ve Olumlu Sosyal Özellikler

Uyum değerlendirmelerinden elde edilen sonuçlar, Claude Opus 4.8’in olumlu sosyal özelliklerin ölçümlerinde yeni boyutlara ulaştığını göstermektedir. Isso, kullanıcı özerkliği ve kullanıcının çıkarına en uygun tutarlı eylem için daha fazla destek içerir. Modelin mimarisi, daha etik ve insan merkezli etkileşimi teşvik edecek ve işlemlerinin kullanıcının hedefleriyle uyumlu olmasını sağlayacak şekilde tasarlandı.

Aldatma gibi yanlış hizalanmış davranış oranları, Opus 4.8’de önemli ölçüde azaltıldı ve Opus 4.7’den daha düşük seviyeler görüldü. Esses numaraları, Claude Mythos’nin önizleme sürümüne benzer. Essa’nin hizalamadaki tutarlılığı, Anthropic’nin yalnızca güçlü değil, aynı zamanda etkileşimlerinde sorumlu ve güvenli olan yapay zeka modelleri geliştirmeye olan bağlılığını gösterir.

Benchmarks ve hız optimizasyonu

Anthropic tarafından yayınlanan kıyaslamalar, Claude Opus 4.8’in kodlama testlerinde üstün performansını göstermektedir. Model, SWE-Bench Pro’de %69,2 elde etti; bu endeks, onu bu ve diğer bazı kıyaslamalarda GPT-5.5 ve Gemini 3.1 Pro gibi rakiplerin üstüne yerleştirdi. Embora o GPT-5.5, terminal kodlama kıyaslamasında liderliğini koruyor; Opus 4.8’in genel performansı dikkat çekici.

Claude Opus 4.8’in hızlı modu da 2,5 kat daha hızlı çalışacak şekilde geliştirildi. Adicionalmente, bu modun maliyeti artık önceki modellere göre üç kat daha düşük. Essa hız ve maliyet etkinliği optimizasyonu, gelişmiş yapay zeka özelliklerine erişimi daha fazla sayıda geliştirici ve kuruluşa genişletir. Anthropic, yüksek performansı operasyonel verimlilikle dengelemeyi amaçlamaktadır.

Geliştiriciler için Novas özellikleri

Anthropic, Claude Opus 4.8’in piyasaya sürülmesini tamamlayarak ürün serisine önemli yeni özellikler ekliyor. Essas özellikleri, platformu kullanan geliştiricilere daha fazla esneklik ve kontrol sunmayı amaçlamaktadır.

  • Dinamik İş Fluxos (Arama Önizlemesi):Claude artık Claude Code içindeki daha büyük görevleri tamamlayabiliyor. Ele, işi planlayabilir ve tek bir oturumda yüzlerce alt aracıyı paralel olarak çalıştırabilir. Yüzbinlerce kod satırına yayılan kaynak kodu ölçeğinde geçişler gerçekleştirmek mümkündür. Bu özellik Claude Code Enterprise, Team ve Max planları için kullanılabilir.
  • Controle çaba:No Claude.ai ve Cowork’de kullanıcılar, Claude’nin yanıt için harcadığı çabanın düzeyini seçebilir. Daha düşük bir ayarla Claude daha hızlı yanıt verir ve hız sınırlarını daha yavaş tüketir. Opus 4.8, varsayılan olarak yüksek efor düzeyini kullanır; Anthropic, kalite ile kullanıcı deneyimi arasında en iyi dengeyi sunduğunu iddia eder.
  • Mensagens API’si:Mensagens API, mesaj matrisi içindeki sistem girişlerini kabul ederek geliştiricilerin görev yürütme sırasında Claude talimatlarını güncellemesine olanak tanır.

Disponibilidade ve gelecekteki gelişmeler

Claude Opus 4.8 artık tüm bölgelerde mevcut ve normal kullanım fiyatı önceki sürüm olan Opus 4.7 ile karşılaştırıldığında değişmedi. Şirket, mevcut kullanıcılar için yeni modele geçişin akıcı olacağını garanti ediyor.

Anthropic, Opus 4.8 ile aynı yeteneklere sahip ancak daha düşük maliyetli modeller geliştirme çalışmalarına devam ediyor. Além Ayrıca şirket, Opus’den bile daha akıllı olacak yeni bir model sınıfına odaklanmış durumda. Claude Mythos modeli için Medidas güvenlik modelleri geliştirilmekte ve az sayıda kuruluşla test edilmektedir. Beklenti, Mythos sınıfındaki modellerin önümüzdeki haftalarda tüm müşterilerin kullanımına sunulması yönünde.