Anthropic, Claude Opus 4.8’i piyasaya sürdü: AI, otonom kodlama ve daha fazla sistem dürüstlüğünde önemli kazanımlar
Anthropic, otonom sistem kapasitesinde önemli bir ilerlemeye işaret eden en son yapay zeka modeli Claude Opus 4.8’in piyasaya sürüldüğünü duyurdu. Şirket, modeli karmaşık görevler için daha etkili ve güvenilir bir işbirlikçiye dönüştürerek çeşitli alanlardaki önemli iyileştirmeleri öne çıkarıyor. Esta güncellemesi, profesyonel ve teknik senaryolardaki potansiyelini genişleterek kullanıcıların yapay zeka ile etkileşimini optimize etmeyi amaçlıyor.
Yeni model, entelektüel çalışmayı ve otonom finansal analizi geliştirmenin yanı sıra, otonom kodlama, çok disiplinli akıl yürütme ve otonom bilgisayar kullanımındaki yenilikleri de içeriyor. Essas özellikleri, Claude Opus 4.8’i yüksek doğruluk ve bilgi işleme kapasitesi gerektiren zorlukların üstesinden gelmek için güçlü bir araç olarak konumlandırır. Opus 4.8’in gelişi, yapay zekanın performansını ve bütünlüğünü iyileştirmeye yönelik devam eden çabayı yansıtıyor.
Performans ve güvenilirlikte Aprimoramentos
Uzmanlar tarafından gerçekleştirilen Avaliações, Claude Opus 4.8’in eylem görevlerini gerçekleştirirken kararlarında daha güvenilir ve doğru bir model olduğunu kanıtladığını ortaya koydu. Anthropic, dürüstlük konusundaki ilerlemelerin önemli olduğunu vurguluyor. Usuários başlangıçta Opus 4.8’in, asılsız beyanlarda bulunmaktan kaçınarak kendi işleyişi hakkındaki belirsizlikleri işaret etme eğiliminin daha yüksek olduğunu bildirdi. Este davranışı, yapay zeka ile etkileşimde bulunurken şeffaflık ve güvenlik çıtasını yükseltir.
Şirketin dahili değerlendirmeleri bu algıyı doğruluyor ve Opus 4.8’in önceki sürüme kıyasla kodundaki kusurların fark edilmemesine izin verme olasılığının yaklaşık dört kat daha az olduğunu gösteriyor. Essa’nin hatayı kendi kendine algılama yeteneği, sistem sağlamlığı ve güvenilirliğinde bir sıçramayı temsil eder. Bu nedenle model, daha fazla özerklikle ve daha az yanlış veya hatalı bilgi yayma riskiyle çalışacak şekilde tasarlanmıştır.
Avaliações Uyumluluk ve Olumlu Sosyal Özellikler
Uyum değerlendirmelerinden elde edilen sonuçlar, Claude Opus 4.8’in olumlu sosyal özelliklerin ölçümlerinde yeni boyutlara ulaştığını göstermektedir. Isso, kullanıcı özerkliği ve kullanıcının çıkarına en uygun tutarlı eylem için daha fazla destek içerir. Modelin mimarisi, daha etik ve insan merkezli etkileşimi teşvik edecek ve işlemlerinin kullanıcının hedefleriyle uyumlu olmasını sağlayacak şekilde tasarlandı.
Aldatma gibi yanlış hizalanmış davranış oranları, Opus 4.8’de önemli ölçüde azaltıldı ve Opus 4.7’den daha düşük seviyeler görüldü. Esses numaraları, Claude Mythos’nin önizleme sürümüne benzer. Essa’nin hizalamadaki tutarlılığı, Anthropic’nin yalnızca güçlü değil, aynı zamanda etkileşimlerinde sorumlu ve güvenli olan yapay zeka modelleri geliştirmeye olan bağlılığını gösterir.
Benchmarks ve hız optimizasyonu
Anthropic tarafından yayınlanan kıyaslamalar, Claude Opus 4.8’in kodlama testlerinde üstün performansını göstermektedir. Model, SWE-Bench Pro’de %69,2 elde etti; bu endeks, onu bu ve diğer bazı kıyaslamalarda GPT-5.5 ve Gemini 3.1 Pro gibi rakiplerin üstüne yerleştirdi. Embora o GPT-5.5, terminal kodlama kıyaslamasında liderliğini koruyor; Opus 4.8’in genel performansı dikkat çekici.
Claude Opus 4.8’in hızlı modu da 2,5 kat daha hızlı çalışacak şekilde geliştirildi. Adicionalmente, bu modun maliyeti artık önceki modellere göre üç kat daha düşük. Essa hız ve maliyet etkinliği optimizasyonu, gelişmiş yapay zeka özelliklerine erişimi daha fazla sayıda geliştirici ve kuruluşa genişletir. Anthropic, yüksek performansı operasyonel verimlilikle dengelemeyi amaçlamaktadır.
Geliştiriciler için Novas özellikleri
Anthropic, Claude Opus 4.8’in piyasaya sürülmesini tamamlayarak ürün serisine önemli yeni özellikler ekliyor. Essas özellikleri, platformu kullanan geliştiricilere daha fazla esneklik ve kontrol sunmayı amaçlamaktadır.
- Dinamik İş Fluxos (Arama Önizlemesi):Claude artık Claude Code içindeki daha büyük görevleri tamamlayabiliyor. Ele, işi planlayabilir ve tek bir oturumda yüzlerce alt aracıyı paralel olarak çalıştırabilir. Yüzbinlerce kod satırına yayılan kaynak kodu ölçeğinde geçişler gerçekleştirmek mümkündür. Bu özellik Claude Code Enterprise, Team ve Max planları için kullanılabilir.
- Controle çaba:No Claude.ai ve Cowork’de kullanıcılar, Claude’nin yanıt için harcadığı çabanın düzeyini seçebilir. Daha düşük bir ayarla Claude daha hızlı yanıt verir ve hız sınırlarını daha yavaş tüketir. Opus 4.8, varsayılan olarak yüksek efor düzeyini kullanır; Anthropic, kalite ile kullanıcı deneyimi arasında en iyi dengeyi sunduğunu iddia eder.
- Mensagens API’si:Mensagens API, mesaj matrisi içindeki sistem girişlerini kabul ederek geliştiricilerin görev yürütme sırasında Claude talimatlarını güncellemesine olanak tanır.
Disponibilidade ve gelecekteki gelişmeler
Claude Opus 4.8 artık tüm bölgelerde mevcut ve normal kullanım fiyatı önceki sürüm olan Opus 4.7 ile karşılaştırıldığında değişmedi. Şirket, mevcut kullanıcılar için yeni modele geçişin akıcı olacağını garanti ediyor.
Anthropic, Opus 4.8 ile aynı yeteneklere sahip ancak daha düşük maliyetli modeller geliştirme çalışmalarına devam ediyor. Além Ayrıca şirket, Opus’den bile daha akıllı olacak yeni bir model sınıfına odaklanmış durumda. Claude Mythos modeli için Medidas güvenlik modelleri geliştirilmekte ve az sayıda kuruluşla test edilmektedir. Beklenti, Mythos sınıfındaki modellerin önümüzdeki haftalarda tüm müşterilerin kullanımına sunulması yönünde.
Veja Tambem em Son Haberler (TR)
Apple, sıvı cam ekranlı ve rekor kalınlıkta ultra ince akıllı telefonunu piyasaya duyurdu
Sony, yüksek bütçeli üç oyunu PlayStation 5 sahiplerine abonelik gerektirmeden ücretsiz olarak sunuyor
Apple’ın yeni iddiası, 5,5 milimetre kalınlığa ve benzeri görülmemiş bir A19 çipine sahip iPhone 17 Air’i sunuyor
Motorola Edge 60 cihazı pazardaki değerin düştüğünü gösteriyor ve askeri sertifikasyonun altını çiziyor
Apple, 5,5 milimetre kalınlığa ve yeni sıvı cam ekran teknolojisine sahip iPhone 17 Air’i piyasaya sürdü
IPhone 17 Air’in piyasaya sürülmesi, 5,5 milimetre kalınlık ve gelişmiş güvenliği pazara getiriyor
Motorola Edge 60 akıllı telefon, POLED ekranı ve askeri direnciyle fiyat düşüşü kaydetti
Nintendo, yeni nesil konsolu tanıtıyor ve lansman sırasında Zelda Ocarina of Time’ın yeniden yapımını doğruluyor
Türkiye, Uluslararası Hazırlık Maçı’nın ilk yarısında Orkun Kökçü’nün Kuzey Makedonya’ya attığı golle öne geçti.
Amanda Kimberlly, Neymar’ın kızı Helena için 3 Temmuz’da sade bir parti yapma seçeneğini ayrıntılarıyla anlatıyor
Gökbilimciler, devasa haleyle Sombrero Galaksisi’nin en ayrıntılı görüntüsünü yakaladı