Последни Новини (BG)

Anthropic пуска Claude Opus 4.8: значителни подобрения в AI, автономно кодиране и по-голяма честност на системата

Anthropic, Claude
Foto: Anthropic, Claude - gguy / Shutterstock.com

Anthropic обяви пускането на своя най-нов модел с изкуствен интелект, Claude Opus 4.8, отбелязвайки значителен напредък във възможностите на автономните системи. Компанията подчертава важни подобрения в няколко области, превръщайки модела в по-ефективен и надежден сътрудник за сложни задачи. Актуализацията на Esta има за цел да оптимизира взаимодействието на потребителите с AI, разширявайки неговия потенциал в професионални и технически сценарии.

Новият модел включва иновации в автономното кодиране, мултидисциплинарното мислене и автономното използване на компютъра, в допълнение към подобряването на интелектуалната работа и автономния финансов анализ. Характеристиките на Essas позиционират Claude Opus 4.8 като стабилен инструмент за справяне с предизвикателства, които изискват висока точност и капацитет за обработка на информация. Появата на Opus 4.8 отразява продължаващите усилия за усъвършенстване на производителността и целостта на изкуствения интелект.

Aprimoramentos в производителност и надеждност

Avaliações, извършен от експерти, разкри, че Claude Opus 4.8 се оказва по-надежден и точен модел в своите преценки при изпълнение на екшън задачи. Anthropic подчертава, че подобренията в честността са били значителни. Usuários първоначално съобщи, че Opus 4.8 има по-голяма склонност да сигнализира за несигурност относно собственото си функциониране, като избягва да прави необосновани изявления. Поведението на Este вдига летвата за прозрачност и сигурност при взаимодействие с AI.

Вътрешните оценки на компанията потвърждават това схващане, като показват, че Opus 4.8 е приблизително четири пъти по-малко вероятно да позволи пропуски в кода да останат незабелязани, в сравнение с предшественика си. Възможността за самооткриване на грешки на Essa представлява скок в устойчивостта и надеждността на системата. Следователно моделът е проектиран да работи с по-голяма автономност и по-малък риск от разпространяване на неточна или неправилна информация.

Avaliações Изравняване и просоциални черти

Резултатите от оценките на съответствието предполагат, че Claude Opus 4.8 достига нови висоти в мерките за просоциални черти. Isso включва по-голяма поддръжка за потребителска автономия и последователни действия в най-добрия интерес на потребителя. Архитектурата на модела е проектирана да насърчава по-етично и ориентирано към човека взаимодействие, като гарантира, че неговите операции са в съответствие с целите на потребителя.

Процентите на неправилно подравнено поведение като измама са значително намалени в Opus 4.8, показвайки по-ниски нива, отколкото в Opus 4.7. Номерата на Esses са подобни на предварителната версия на Claude Mythos. Последователността на Essa в подравняването демонстрира ангажимента на Anthropic към разработването на AI модели, които са не само мощни, но също така отговорни и безопасни в техните взаимодействия.

Benchmarks и оптимизация на скоростта

Бенчмарковете, публикувани от Anthropic, показват превъзходната производителност на Claude Opus 4.8 при тестове за кодиране. Моделът получи 69,2% в SWE-Bench Pro, индекс, който го поставя над конкуренти като GPT-5.5 и Gemini 3.1 Pro в този и няколко други показатели. Embora o GPT-5.5 запазва водещата роля в теста за терминално кодиране, цялостната производителност на Opus 4.8 е забележителна.

Бързият режим на Claude Opus 4.8 също е подобрен, за да работи с 2,5 пъти по-висока скорост. Adicionalmente, този режим сега струва три пъти по-малко от предишните модели. Оптимизацията на скоростта и ефективността на Essa разширява достъпа до разширени възможности на AI до по-голям брой разработчици и предприятия. Anthropic се стреми да балансира висока производителност с оперативна ефективност.

Novas функции за разработчици

Anthropic добавя важни нови функции към своята продуктова линия, допълвайки изданието на Claude Opus 4.8. Функциите на Essas имат за цел да предложат по-голяма гъвкавост и контрол на разработчиците, използващи платформата.

  • Динамично задание Fluxos (Преглед при търсене):Claude вече може да изпълнява по-големи задачи в Claude Code. Ele може да планира работа и да изпълнява стотици подагенти паралелно в една сесия. Възможно е да се извършват миграции в мащаб на изходния код, обхващащи стотици хиляди редове код. Функцията е налична за планове Claude Code Enterprise, Team и Max.
  • Controle на усилията:No Claude.ai и Cowork, потребителите могат да избират нивото на усилие, което Claude влага в отговор. С по-ниска настройка Claude ще реагира по-бързо и ще изразходва ограниченията на скоростта по-бавно. Opus 4.8 използва високото ниво на усилие по подразбиране, за което Anthropic твърди, че предлага най-добрия баланс между качество и потребителско изживяване.
  • Mensagens API:Mensagens API приема системни входове в рамките на матрицата на съобщенията, позволявайки на разработчиците да актуализират инструкциите на Claude по време на изпълнение на задачата.

Disponibilidade и бъдещи разработки

Claude Opus 4.8 вече е наличен във всички региони, като цената за редовна употреба остава непроменена в сравнение с предишната версия, Opus 4.7. Компанията гарантира, че преходът към новия модел ще бъде плавен за съществуващите потребители.

Anthropic продължава работата си по разработването на модели със същите възможности като Opus 4.8, но на по-ниска цена. Além В допълнение, компанията се фокусира върху нов клас модели, които ще бъдат дори по-умни от Opus. Моделите за сигурност Medidas за модела Claude Mythos се разработват и тестват с малък брой организации. Очакванията са моделите от клас Mythos да бъдат предоставени на всички клиенти през следващите седмици.

Veja Tambem em Последни Новини (BG)

Проучване предлага нова планетарна формация: повечето субнептуни нямат ядро ​​или мантия като Земята

Проучване предлага нова планетарна формация: повечето субнептуни нямат ядро ​​или мантия като Земята

Oura Ring 4 предлага подробен мониторинг на здравето в дискретен формат за потребителите на технологии

Oura Ring 4 предлага подробен мониторинг на здравето в дискретен формат за потребителите на технологии

Южнокорейският производител напредва в тестването на интерфейса One UI 8.5 и разширява достъпа за нови мобилни телефони

Южнокорейският производител напредва в тестването на интерфейса One UI 8.5 и разширява достъпа за нови мобилни телефони

Apple пуска watchOS 26.4 и macOS Tahoe 26.4 с вградена поддръжка за AirPods Max 2

Apple пуска watchOS 26.4 и macOS Tahoe 26.4 с вградена поддръжка за AirPods Max 2

Версията за начално ниво на Caoa Chery Tiggo 5X Sport върви срещу пазара и увеличава стойността си в таблицата на Fipe

Версията за начално ниво на Caoa Chery Tiggo 5X Sport върви срещу пазара и увеличава стойността си в таблицата на Fipe

Детайлите на OnePlus Ace 6 Ultra показват 8500mAh батерия и 165Hz екран за тежки игри

Детайлите на OnePlus Ace 6 Ultra показват 8500mAh батерия и 165Hz екран за тежки игри

INSS изпраща сигнал за доказателство за живот чрез WhatsApp до бенефициенти с висящи проблеми

INSS изпраща сигнал за доказателство за живот чрез WhatsApp до бенефициенти с висящи проблеми

War Robots, екшън игра от 2014 г., е пусната изненадващо безплатно за PS4 и PS5

War Robots, екшън игра от 2014 г., е пусната изненадващо безплатно за PS4 и PS5

Samsung Galaxy A57 пристига по-тънък с IP68; проверете сравнението на цените и техническия лист с A56

Samsung Galaxy A57 пристига по-тънък с IP68; проверете сравнението на цените и техническия лист с A56

Търговската платформа Shopee предлага Apple iPad 11 със специална отстъпка и безлихвени вноски

Търговската платформа Shopee предлага Apple iPad 11 със специална отстъпка и безлихвени вноски

Електрическият хетч Dolphin Mini изпреварва автомобилите с вътрешно горене и води продажбите на дребно през февруари

Електрическият хетч Dolphin Mini изпреварва автомобилите с вътрешно горене и води продажбите на дребно през февруари

Take-Two сигнализира, че стандартното издание на Grand Theft Auto VI ще струва до  на пазара

Take-Two сигнализира, че стандартното издание на Grand Theft Auto VI ще струва до $80 на пазара