Останні Новини (UA)

Anthropic запускає Claude Opus 4.8: значні переваги в ШІ, автономному кодуванні та більшій чесності системи

Anthropic, Claude
Foto: Anthropic, Claude - gguy / Shutterstock.com

Anthropic оголосила про випуск своєї останньої моделі штучного інтелекту Claude Opus 4.8, що відзначає значний прогрес у можливостях автономних систем. Компанія підкреслює важливі вдосконалення в кількох сферах, перетворюючи модель на більш ефективного та надійного партнера для вирішення складних завдань. Оновлення Esta спрямоване на оптимізацію взаємодії користувачів із ШІ, розширюючи його потенціал у професійних і технічних сценаріях.

Нова модель включає в себе інновації в автономному кодуванні, міждисциплінарному міркуванні та автономному використанні комп’ютера, на додаток до вдосконалення інтелектуальної роботи та автономного фінансового аналізу. Функції Essas позиціонують Claude Opus 4.8 як надійний інструмент для вирішення завдань, які вимагають високої точності та потужності обробки інформації. Поява Opus 4.8 відображає постійні зусилля щодо вдосконалення продуктивності та цілісності штучного інтелекту.

Aprimoramentos у продуктивності та надійності

Avaliações, проведений експертами, показав, що Claude Opus 4.8 виявляється більш надійною та точною моделлю у своїх оцінках під час виконання завдань дії. Anthropic підкреслює, що покращення чесності були суттєвими. Спочатку Usuários повідомляв, що Opus 4.8 має більшу схильність подавати сигнали про невизначеність щодо власного функціонування, уникаючи необґрунтованих заяв. Поведінка Este піднімає планку прозорості та безпеки під час взаємодії зі ШІ.

Внутрішні оцінки компанії підтверджують це уявлення, вказуючи на те, що Opus 4.8 має приблизно в чотири рази менше шансів залишити недоліки в коді непоміченими порівняно з його попередником. Можливість самовиявлення помилок Essa являє собою стрибок у міцності та надійності системи. Таким чином, модель розроблена для роботи з більшою автономністю та меншим ризиком розповсюдження неточної або неправильної інформації.

Avaliações Вирівнювання та просоціальні риси

Результати оцінки вирівнювання показують, що Claude Opus 4.8 досягає нових висот у показниках просоціальних рис. Isso включає більшу підтримку автономії користувача та послідовні дії в інтересах користувача. Архітектура моделі була розроблена для сприяння більш етичній та орієнтованій на людину взаємодії, гарантуючи, що її операції узгоджуються з цілями користувача.

У Opus 4.8 рівень неправильної поведінки, як-от обману, значно зменшено, показуючи нижчі рівні, ніж у Opus 4.7. Номери Esses подібні до попередньої версії Claude Mythos. Послідовність Essa у вирівнюванні демонструє відданість Anthropic розробці моделей ШІ, які є не тільки потужними, але й відповідальними та безпечними у своїй взаємодії.

Benchmarks і оптимізація швидкості

Тести, опубліковані Anthropic, вказують на високу продуктивність Claude Opus 4.8 у тестах кодування. Модель отримала 69,2% у SWE-Bench Pro, індекс, який ставить її вище конкурентів, таких як GPT-5.5 і Gemini 3.1 Pro у цьому та кількох інших тестах. Embora o GPT-5.5 зберігає лідерство в тесті термінального кодування, загальна продуктивність Opus 4.8 чудова.

Швидкий режим Claude Opus 4.8 також покращено для роботи з 2,5-кратною швидкістю. Adicionalmente, цей режим тепер коштує втричі дешевше, ніж попередні моделі. Оптимізація швидкості та економічності Essa розширює доступ до розширених можливостей ШІ для більшої кількості розробників і підприємств. Anthropic прагне збалансувати високу продуктивність і ефективність роботи.

Функції Novas для розробників

Anthropic додає важливі нові функції до своєї лінійки продуктів, доповнюючи випуск Claude Opus 4.8. Функції Essas спрямовані на надання більшої гнучкості та контролю розробникам, які використовують платформу.

  • Динамічне завдання Fluxos (попередній перегляд пошуку):Claude тепер може виконувати більші завдання в Claude Code. Ele може планувати роботу та запускати сотні субагентів паралельно в одному сеансі. Можна виконувати масштабні міграції вихідного коду, охоплюючи сотні тисяч рядків коду. Ця функція доступна для планів Claude Code Enterprise, Team і Max.
  • Controle зусиль:No Claude.ai та Cowork, користувачі можуть вибрати рівень зусиль, які Claude докладає для відповіді. З нижчим налаштуванням Claude реагуватиме швидше та споживатиме обмеження швидкості повільніше. Opus 4.8 за замовчуванням використовує високий рівень зусиль, який, як стверджує Anthropic, забезпечує найкращий баланс між якістю та досвідом користувача.
  • Mensagens API:API Mensagens приймає системні дані в матриці повідомлень, дозволяючи розробникам оновлювати інструкції Claude під час виконання завдання.

Disponibilidade і майбутні розробки

Claude Opus 4.8 тепер доступний у всіх регіонах, а ціна за регулярне використання залишилася незмінною порівняно з попередньою версією Opus 4.7. Компанія гарантує, що перехід на нову модель буде плавним для існуючих користувачів.

Anthropic продовжує свою роботу над розробкою моделей з такими ж можливостями, як Opus 4.8, але за нижчою ціною. Além Крім того, компанія зосереджена на новому класі моделей, які будуть ще розумнішими за Opus. Моделі безпеки Medidas для моделі Claude Mythos розробляються та тестуються з невеликою кількістю організацій. Очікується, що моделі класу Mythos стануть доступними для всіх клієнтів найближчими тижнями.

Veja Tambem em Останні Новини (UA)

Дослідження пропонує нове планетарне утворення: більшість субнептунів не мають ядра чи мантії, як Земля

Дослідження пропонує нове планетарне утворення: більшість субнептунів не мають ядра чи мантії, як Земля

Oura Ring 4 пропонує детальний моніторинг стану здоров’я в стриманому форматі для користувачів технологій

Oura Ring 4 пропонує детальний моніторинг стану здоров’я в стриманому форматі для користувачів технологій

Версія початкового рівня Caoa Chery Tiggo 5X Sport йде проти ринку і зростає в ціні в таблиці Fipe

Версія початкового рівня Caoa Chery Tiggo 5X Sport йде проти ринку і зростає в ціні в таблиці Fipe

Apple випускає watchOS 26.4 і macOS Tahoe 26.4 із вбудованою підтримкою AirPods Max 2

Apple випускає watchOS 26.4 і macOS Tahoe 26.4 із вбудованою підтримкою AirPods Max 2

Південнокорейський виробник продовжує тестування інтерфейсу One UI 8.5 і розширює доступ для нових мобільних телефонів

Південнокорейський виробник продовжує тестування інтерфейсу One UI 8.5 і розширює доступ для нових мобільних телефонів

Деталі OnePlus Ace 6 Ultra вказують на акумулятор ємністю 8500 мАг і екран 165 Гц для важких ігор

Деталі OnePlus Ace 6 Ultra вказують на акумулятор ємністю 8500 мАг і екран 165 Гц для важких ігор

INSS надсилає сповіщення про підтвердження життя через WhatsApp бенефіціарам із невирішеними проблемами

INSS надсилає сповіщення про підтвердження життя через WhatsApp бенефіціарам із невирішеними проблемами

War Robots, бойовик 2014 року, несподівано випущений безкоштовно на PS4 та PS5

War Robots, бойовик 2014 року, несподівано випущений безкоштовно на PS4 та PS5

Samsung Galaxy A57 став тоншим із захистом IP68; перевірити порівняння цін і технічний паспорт з A56

Samsung Galaxy A57 став тоншим із захистом IP68; перевірити порівняння цін і технічний паспорт з A56

Роздрібна платформа Shopee пропонує Apple iPad 11 зі спеціальною знижкою та безвідсотковою розстрочкою

Роздрібна платформа Shopee пропонує Apple iPad 11 зі спеціальною знижкою та безвідсотковою розстрочкою

Електричний хетч Dolphin Mini перевершує автомобілі з двигуном внутрішнього згоряння та лідирує в роздрібних продажах у лютому

Електричний хетч Dolphin Mini перевершує автомобілі з двигуном внутрішнього згоряння та лідирує в роздрібних продажах у лютому

Take-Two сигналізує, що стандартне видання Grand Theft Auto VI коштуватиме на ринку до 80 доларів

Take-Two сигналізує, що стандартне видання Grand Theft Auto VI коштуватиме на ринку до 80 доларів