Kimi K2.6 จากสตาร์ทอัพจีน Moonshot AI มีประสิทธิภาพเหนือกว่าคู่แข่งในด้านการวัดประสิทธิภาพโค้ดและเอเจนต์

Kimi

Kimi - site www.kimi.com

Kimi K2.6 ของ Moonshot AI เปิดตัวเมื่อวันที่ 21 เมษายน 2569 ระบบนี้มีสถาปัตยกรรมการผสมที่เชี่ยวชาญพร้อมพารามิเตอร์ทั้งหมด 1 ล้านล้านพารามิเตอร์ และเปิดใช้งานประมาณ 32 พันล้านรายการต่อคำขอ โดยจะประมวลผลบริบทจากโทเค็นประมาณ 260,000 รายการ และมีความสามารถหลายรูปแบบสำหรับรูปภาพและวิดีโอ

การเปิดตัวครั้งนี้ตอกย้ำถึงประสิทธิภาพในการทดสอบภาคปฏิบัติ บริษัทรายงาน SWE-Bench Pro 58.6% ซึ่งเป็นตัวชี้วัดที่ประเมินการแก้ไขโค้ดจริง ผลลัพธ์อื่นๆ ได้แก่ 83.2% ใน BrowserComp ซึ่งเป็นงานที่เกี่ยวข้องกับการท่องเว็บ Moonshot AI เปรียบเทียบตัวเลขเหล่านี้กับรุ่นต่างๆ เช่น GPT-5.4 ของ OpenAI และ Claude Opus 4.6 ของ Anthropic

Kimi K2.6 ได้รับการเผยแพร่เป็นโอเพ่นซอร์ส ตุ้มน้ำหนักมีให้บริการบนแพลตฟอร์มเช่น Hugging Face มีการสนับสนุนที่พร้อมใช้งานทันทีในกลไกการอนุมาน เช่น vLLM และ OpenRouter

โมเดลมุ่งเน้นไปที่การดำเนินงานแบบอัตโนมัติ

ไฮไลท์ที่ยิ่งใหญ่ที่สุดมีมากกว่าเกณฑ์มาตรฐาน แบบจำลองดำเนินการตามลำดับการกระทำที่ยาวนานโดยไม่มีการแทรกแซงอย่างต่อเนื่อง รายงานของบริษัทอ้างถึงการเรียกใช้เครื่องมือมากกว่า 4,000 ครั้งและการทำงานต่อเนื่องนานกว่า 12 ชั่วโมง กรณีหนึ่งที่กล่าวถึงเกี่ยวข้องกับการจัดการโครงสร้างพื้นฐานแบบอัตโนมัติเป็นเวลาห้าวัน

OpenAI ChatGPT – รูปภาพ: ศิลปินหนึ่งคน / Shutterstock.com

ในการดำเนินการนี้ ระบบตรวจพบ ระบุ แก้ไข และตรวจสอบความล้มเหลวของเซิร์ฟเวอร์และคลาวด์ โดยปกติกระบวนการนี้ต้องใช้ทีมงานมนุษย์ที่ทำงานตลอด 24 ชั่วโมงเป็นเวลาเจ็ดวัน ที่นี่ Kimi K2.6 ทำหน้าที่เพียงลำพัง

การออกแบบนี้ช่วยให้ตัวแทนย่อยสามารถทำงานแบบขนานได้มากถึง 300 รายการ โครงสร้างนี้ช่วยในการแบ่งย่อยงานที่ซับซ้อนออกเป็นส่วนเล็กๆ ที่ทำงานในเวลาเดียวกัน Moonshot AI เรียกสิ่งนี้ว่าวิศวกรรมบูรณาการ โดยที่โฟกัสจะย้ายออกจากโมเดลที่แยกออกไปและไปยังระบบที่รวมเอเจนต์หลายตัวเข้าด้วยกัน

สตาร์ทอัพในปักกิ่งมีพื้นฐานด้านเทคนิค

Moonshot AI ก่อตั้งขึ้นในเดือนมีนาคม 2023 ในกรุงปักกิ่ง ชื่อในภาษาจีนมาจากอัลบั้ม The Dark Side of the Moon ของวง Pink Floyd ผู้ก่อตั้งและซีอีโอ หยาง จื้อหลิน เลือกวันก่อตั้งให้ตรงกับวันครบรอบ 50 ปีของการบันทึก

Yang Zhilin สำเร็จการศึกษาระดับปริญญาสาขาวิทยาการคอมพิวเตอร์จากมหาวิทยาลัย Tsinghua เขาสำเร็จการศึกษาระดับปริญญาเอกที่มหาวิทยาลัย Carnegie Mellon ในเวลาไม่ถึงสี่ปี ในระหว่างการศึกษา เขาได้ฝึกงานที่ Google Brain และเป็นผู้ร่วมเขียนผลงาน เช่น Transformer-XL และ XLNet ซึ่งมีอิทธิพลต่อโมเดลภาษาในปัจจุบัน

ผู้ร่วมก่อตั้ง ได้แก่ อดีตสมาชิกของวงดนตรีร็อคซึ่งมี Yang เป็นมือกลอง บริษัทดูแลห้องประชุมที่ตั้งชื่อตามวงดนตรีตะวันตก

ก่อน Kimi K2.6 นั้น Moonshot เปิดตัวตระกูล Kimi เวอร์ชันก่อนหน้า สิ่งเหล่านี้รวมถึงการมุ่งเน้นไปที่บริบทที่ยาวและฟังก์ชันตัวแทนอัตโนมัติ ในเดือนมีนาคม 2026 นักพัฒนาสังเกตเห็นว่าเครื่องมือการเขียนโปรแกรมของอเมริกาชื่อ Cursor ใช้ Kimi เวอร์ชันก่อนหน้าเป็นพื้นฐานสำหรับฟังก์ชันหลัก เคอร์เซอร์มีผู้ใช้งานมากกว่า 1 ล้านคนต่อวันและมีรายได้ต่อปีเป็นพันล้านดอลลาร์

ดูเพิ่มเติม

การเปิดตัวตอกย้ำการถกเถียงเกี่ยวกับระบบนิเวศ AI

กรณีเคอร์เซอร์ดึงดูดความสนใจเนื่องจากแสดงให้เห็นการนำแบบจำลองภาษาจีนไปใช้ในทางปฏิบัติในเครื่องมือที่พัฒนาขึ้นในสหรัฐอเมริกา การค้นพบนี้เกิดขึ้นโดยเคอร์เซอร์ไม่ได้เปิดเผยข้อมูลเบื้องต้น หลังจากนั้นผู้บริหารได้ยืนยันการใช้ฐานเปิดพร้อมการปรับเปลี่ยนเพิ่มเติม

สิ่งนี้เกิดขึ้นระหว่างการหารือเกี่ยวกับการแยกที่เป็นไปได้ระหว่างระบบนิเวศ AI ของอเมริกาและจีน ข้อโต้แย้งอ้างถึงความแตกต่างของกฎระเบียบ ความปลอดภัย และคุณค่า ในทางปฏิบัติ วิศวกรให้ความสำคัญกับประสิทธิภาพและต้นทุนเมื่อมีโมเดลแบบเปิดและแบบแข่งขันปรากฏขึ้น

Kimi K2.6 มาพร้อมกับการรองรับภาษาการเขียนโปรแกรมหลายภาษา เช่น Python, Rust และ Go สร้างอินเทอร์เฟซผู้ใช้จากคำอธิบายในภาษาธรรมชาติ รวมถึงภาพเคลื่อนไหวและเอฟเฟ็กต์ภาพ ความหลากหลายช่วยให้คุณสามารถประมวลผลรูปภาพและวิดีโอได้โดยตรงในโมเดลหลัก

รายละเอียดทางเทคนิค Kimi K2.6

  • สถาปัตยกรรม: การผสมผสานของผู้เชี่ยวชาญ (MoE) พร้อมพารามิเตอร์ทั้งหมด 1 ล้านล้านพารามิเตอร์
  • พารามิเตอร์ที่ใช้งานอยู่ต่อคำขอ: ประมาณ 32 พันล้าน
  • หน้าต่างบริบท: ประมาณ 260,000 โทเค็น
  • ความสามารถ: มัลติโมดัล (ข้อความ รูปภาพ วิดีโอ) การสร้างโค้ด การทำงานของตัวแทน
  • ความพร้อมใช้งาน: Open Weight ใน Hugging Face, บูรณาการกับ vLLM และ OpenRouter
  • เกณฑ์มาตรฐานที่โดดเด่น: 58.6% บน SWE-Bench Pro, 83.2% บน BrowserComp

Moonshot AI วางตำแหน่งโมเดลสำหรับสถานการณ์ระยะยาว ตัวอย่าง ได้แก่ การเพิ่มประสิทธิภาพโค้ดในพื้นที่เก็บข้อมูลขนาดใหญ่ การสร้างเว็บไซต์ที่สมบูรณ์ และการทำให้เวิร์กโฟลว์เป็นอัตโนมัติที่ต้องใช้ขั้นตอนหลายสิบหรือหลายร้อยขั้นตอน

การเปิดตัวเกิดขึ้นเมื่อวันที่ 21 เมษายน 2026 ขณะนี้โมเดลนี้สามารถเข้าถึงได้บนเว็บไซต์ Kimi ในแอป และผ่าน API ตัวแปรต่างๆ รวมถึงโหมดสำหรับการแชท การใช้เหตุผล และการดำเนินการในฐานะตัวแทน

ชุมชนทดสอบกรณีการใช้งานจริง

นักพัฒนารายงานการทดสอบเบื้องต้นหลังจากเปิดตัวไม่นาน บางคนกล่าวถึงงานโครงสร้างพื้นฐานที่กำลังรันอยู่โดยไม่มีการแทรกแซงเป็นระยะเวลานาน คนอื่นๆ เน้นถึงความสามารถในการสร้างส่วนหน้าที่ซับซ้อนด้วยองค์ประกอบภาพจากการแจ้งเตือนง่ายๆ

การเปิดตัวเป็นโอเพ่นซอร์สช่วยอำนวยความสะดวกในการทดลองในสภาพแวดล้อมที่แตกต่างกัน บริษัทและนักวิจัยสามารถปรับโมเดลหรือรวมเข้ากับไปป์ไลน์ของตนเองได้ สิ่งนี้แตกต่างกับแนวทางปิดของห้องปฏิบัติการบางแห่งในอเมริกา

การมุ่งเน้นไปที่ตัวแทนอัตโนมัติสะท้อนให้เห็นถึงแนวโน้มที่ใหญ่กว่าในพื้นที่ แทนที่จะแยกคำตอบสำหรับคำถาม ตอนนี้ระบบพยายามที่จะบรรลุวัตถุประสงค์ให้สำเร็จด้วยการวางแผน การดำเนินการ และการแก้ไขข้อผิดพลาดเมื่อเวลาผ่านไป

Moonshot AI บ่งชี้ว่า Kimi K2.6 แสดงถึงความก้าวหน้าในด้านความสามารถในการรักษาการทำงานที่เป็นประโยชน์เป็นเวลาหลายชั่วโมงหรือหลายวัน คุณสมบัตินี้สามารถลดความจำเป็นในการควบคุมดูแลโดยมนุษย์ในงานวิศวกรรมซอฟต์แวร์ที่ซ้ำซ้อนหรือซับซ้อน

ดูเพิ่มเติม