Anthropic เปิดตัว Claude Opus 4.8: ประโยชน์ที่เพิ่มขึ้นอย่างมากในด้าน AI, การเขียนโค้ดอัตโนมัติ และความซื่อสัตย์ของระบบที่ดียิ่งขึ้น

Anthropic, Claude

Anthropic, Claude - gguy / Shutterstock.com

Anthropic ประกาศเปิดตัวโมเดลปัญญาประดิษฐ์ล่าสุด Claude Opus 4.8 ซึ่งถือเป็นความก้าวหน้าครั้งสำคัญในด้านขีดความสามารถของระบบอัตโนมัติ บริษัทเน้นย้ำถึงการปรับปรุงที่สำคัญในหลายด้าน โดยเปลี่ยนโมเดลเป็นผู้ทำงานร่วมกันที่มีประสิทธิภาพและเชื่อถือได้มากขึ้นสำหรับงานที่ซับซ้อน การอัปเดตนี้มีจุดมุ่งหมายเพื่อเพิ่มประสิทธิภาพการโต้ตอบของผู้ใช้กับ AI โดยขยายศักยภาพในสถานการณ์ระดับมืออาชีพและทางเทคนิค

โมเดลใหม่ผสมผสานนวัตกรรมในการเขียนโค้ดอัตโนมัติ การใช้เหตุผลแบบสหสาขาวิชาชีพ และการใช้คอมพิวเตอร์แบบอิสระ นอกเหนือจากการปรับปรุงงานทางปัญญาและการวิเคราะห์ทางการเงินแบบอัตโนมัติ คุณสมบัติเหล่านี้ทำให้ Claude Opus 4.8 เป็นเครื่องมือที่แข็งแกร่งในการเผชิญกับความท้าทายที่ต้องใช้ความแม่นยำสูงและความสามารถในการประมวลผลข้อมูล การมาถึงของ Opus 4.8 สะท้อนให้เห็นถึงความพยายามอย่างต่อเนื่องในการปรับปรุงประสิทธิภาพและความสมบูรณ์ของปัญญาประดิษฐ์

การปรับปรุงประสิทธิภาพและความน่าเชื่อถือ

การประเมินที่ดำเนินการโดยผู้เชี่ยวชาญเปิดเผยว่า Claude Opus 4.8 พิสูจน์แล้วว่าเป็นแบบจำลองที่เชื่อถือได้และแม่นยำยิ่งขึ้นในการตัดสินเมื่อปฏิบัติงาน Anthropic เน้นย้ำว่าการปรับปรุงความซื่อสัตย์มีความสำคัญอย่างมาก ผู้ใช้ในช่วงแรกรายงานว่า Opus 4.8 มีแนวโน้มที่จะส่งสัญญาณความไม่แน่นอนเกี่ยวกับการทำงานของตัวมันเองมากกว่า โดยหลีกเลี่ยงการกล่าวอ้างที่ไม่มีหลักฐาน พฤติกรรมนี้ยกระดับมาตรฐานของความโปร่งใสและความปลอดภัยเมื่อโต้ตอบกับ AI

การประเมินภายในของบริษัทยืนยันการรับรู้นี้ โดยระบุว่า Opus 4.8 มีโอกาสน้อยกว่าประมาณสี่เท่าที่จะปล่อยให้ข้อบกพร่องในโค้ดไม่มีใครสังเกตเห็น เมื่อเทียบกับรุ่นก่อน ความสามารถในการตรวจจับข้อผิดพลาดด้วยตนเองนี้แสดงถึงความแข็งแกร่งและความน่าเชื่อถือของระบบแบบก้าวกระโดด แบบจำลองนี้จึงได้รับการออกแบบให้ทำงานด้วยความเป็นอิสระมากขึ้นและมีความเสี่ยงน้อยลงในการเผยแพร่ข้อมูลที่ไม่ถูกต้องหรือไม่ถูกต้อง

การประเมินการจัดตำแหน่งและลักษณะทางสังคม

ผลลัพธ์จากการประเมินการจัดตำแหน่งชี้ให้เห็นว่า Claude Opus 4.8 ไปถึงระดับใหม่ในการวัดลักษณะเฉพาะทางสังคม ซึ่งรวมถึงการสนับสนุนที่มากขึ้นสำหรับความเป็นอิสระของผู้ใช้และการดำเนินการเพื่อผลประโยชน์สูงสุดของผู้ใช้อย่างต่อเนื่อง สถาปัตยกรรมของโมเดลได้รับการออกแบบมาเพื่อส่งเสริมการมีปฏิสัมพันธ์ที่มีจริยธรรมและคำนึงถึงมนุษย์เป็นศูนย์กลางมากขึ้น เพื่อให้มั่นใจว่าการดำเนินงานจะสอดคล้องกับเป้าหมายของผู้ใช้

อัตราของพฤติกรรมที่ไม่ตรงแนว เช่น การหลอกลวง ลดลงอย่างมากใน Opus 4.8 ซึ่งแสดงระดับที่ต่ำกว่าใน Opus 4.7 ตัวเลขเหล่านี้คล้ายกับ Claude Mythos เวอร์ชันก่อนหน้า ความสอดคล้องในการจัดตำแหน่งนี้แสดงให้เห็นถึงความมุ่งมั่นของ Anthropic ในการพัฒนาโมเดล AI ที่ไม่เพียงแต่ทรงพลังเท่านั้น แต่ยังมีความรับผิดชอบและปลอดภัยในการโต้ตอบอีกด้วย

ดูเพิ่มเติม

เกณฑ์มาตรฐานและการเพิ่มประสิทธิภาพความเร็ว

เกณฑ์มาตรฐานที่ออกโดย Anthropic บ่งชี้ถึงประสิทธิภาพที่เหนือกว่าของ Claude Opus 4.8 ในการทดสอบการเข้ารหัส โมเดลดังกล่าวได้รับคะแนน SWE-Bench Pro 69.2% ซึ่งเป็นดัชนีที่อยู่เหนือคู่แข่ง เช่น GPT-5.5 และ Gemini 3.1 Pro ในเกณฑ์มาตรฐานนี้และเกณฑ์มาตรฐานอื่นๆ อีกหลายประการ แม้ว่า GPT-5.5 จะรักษาความเป็นผู้นำในเกณฑ์มาตรฐานการเข้ารหัสเทอร์มินัล แต่ประสิทธิภาพโดยรวมของ Opus 4.8 ก็โดดเด่น

โหมดรวดเร็วของ Claude Opus 4.8 ได้รับการปรับปรุงให้ทำงานเร็วขึ้น 2.5 เท่า นอกจากนี้ โหมดนี้ยังมีราคาถูกกว่ารุ่นก่อนๆ ถึงสามเท่าอีกด้วย การเพิ่มประสิทธิภาพความเร็วและความคุ้มค่านี้ขยายการเข้าถึงความสามารถ AI ขั้นสูงให้กับนักพัฒนาและบริษัทจำนวนมากขึ้น Anthropic พยายามสร้างสมดุลระหว่างประสิทธิภาพสูงกับประสิทธิภาพในการดำเนินงาน

คุณสมบัติใหม่สำหรับนักพัฒนา

Anthropic กำลังเพิ่มฟีเจอร์ใหม่ที่สำคัญให้กับกลุ่มผลิตภัณฑ์ โดยเป็นการเสริมการเปิดตัว Claude Opus 4.8 คุณสมบัติเหล่านี้มีจุดมุ่งหมายเพื่อให้ความยืดหยุ่นและการควบคุมแก่นักพัฒนาที่ใช้แพลตฟอร์มมากขึ้น

  • เวิร์กโฟลว์แบบไดนามิก (ดูตัวอย่างการค้นหา):ตอนนี้ Claude สามารถทำงานที่ใหญ่กว่าให้สำเร็จได้ภายใน Claude Code สามารถกำหนดเวลาการทำงานและเรียกใช้ตัวแทนย่อยหลายร้อยรายการพร้อมกันในเซสชันเดียว เป็นไปได้ที่จะดำเนินการย้ายซอร์สโค้ดในระดับมาตราส่วน โดยครอบคลุมโค้ดหลายแสนบรรทัด คุณลักษณะนี้พร้อมใช้งานสำหรับแผน Claude Code Enterprise, Team และ Max
  • การควบคุมความพยายาม:บน Claude.ai และ Cowork ผู้ใช้สามารถเลือกระดับความพยายามที่ Claude ใช้ในการตอบกลับได้ ด้วยการตั้งค่าที่ต่ำกว่า Claude จะตอบสนองเร็วขึ้นและใช้ขีดจำกัดอัตราช้าลง Opus 4.8 มีค่าเริ่มต้นเป็นความพยายามสูง ซึ่ง Anthropic กล่าวว่าให้ความสมดุลที่ดีที่สุดระหว่างคุณภาพและประสบการณ์ผู้ใช้
  • API การส่งข้อความ:Messages API ยอมรับอินพุตจากระบบภายในเมทริกซ์ข้อความ ช่วยให้นักพัฒนาอัปเดตคำสั่งของ Claude ในระหว่างการดำเนินงานได้

ความพร้อมใช้งานและการพัฒนาในอนาคต

Claude Opus 4.8 วางจำหน่ายแล้วในทุกภูมิภาค โดยราคาสำหรับการใช้งานปกติยังคงไม่เปลี่ยนแปลงเมื่อเทียบกับ Opus 4.7 เวอร์ชันก่อนหน้า บริษัทรับประกันว่าการเปลี่ยนไปใช้โมเดลใหม่จะเป็นไปอย่างราบรื่นสำหรับผู้ใช้ปัจจุบัน

Anthropic ยังคงเดินหน้าพัฒนาโมเดลที่มีความสามารถเช่นเดียวกับ Opus 4.8 แต่มีต้นทุนที่ต่ำกว่า นอกจากนี้ บริษัทยังมุ่งเน้นไปที่โมเดลคลาสใหม่ที่จะฉลาดกว่า Opus อีกด้วย มาตรการรักษาความปลอดภัยสำหรับแบบจำลอง Claude Mythos กำลังได้รับการพัฒนาและทดสอบกับองค์กรจำนวนไม่มาก ความคาดหวังก็คือโมเดลคลาส Mythos จะพร้อมให้บริการแก่ลูกค้าทุกคนในอีกไม่กี่สัปดาห์ข้างหน้า

ดูเพิ่มเติม