คอมพิวเตอร์พกพาระดับเริ่มต้นที่เพิ่งเปิดตัวใหม่ของ Apple ขับเคลื่อนโดยโปรเซสเซอร์ A19 Pro และไดรฟ์จัดเก็บข้อมูลขนาด 512GB มอบการวัดประสิทธิภาพที่ไม่คาดคิดในระหว่างการประเมินปริมาณงานฐานข้อมูล Gábor Szárnyas ผู้เชี่ยวชาญด้านระบบข้อมูล ซึ่งเป็นตัวแทนของ DuckDB ได้จัดโครงสร้างการทดสอบที่เข้มงวดเพื่อเปรียบเทียบเครื่องในพื้นที่กับโครงสร้างพื้นฐานระยะไกลความจุสูง วัตถุประสงค์หลักของการวิเคราะห์คือการจัดทำแผนที่พฤติกรรมของฮาร์ดแวร์ผู้บริโภคปลายทางเมื่ออยู่ภายใต้งานที่ออกแบบมาสำหรับศูนย์ข้อมูลที่ปรับขนาดได้
การวัดใช้เทคโนโลยีมาตรฐานอุตสาหกรรมเพื่อให้มั่นใจในความถูกต้องของข้อมูลที่รวบรวมระหว่างการดำเนินการ จุดเน้นอยู่ที่ความสามารถของอุปกรณ์ในการจัดการข้อมูลปริมาณมากโดยไม่ประสบกับความล้มเหลวของระบบที่สำคัญหรือปัญหาคอขวดในการประมวลผลในทันที ผลลัพธ์เบื้องต้นแสดงให้เห็นว่าสถาปัตยกรรมซิลิคอนที่พัฒนาโดยผู้ผลิตสามารถรักษาอัตราการปฏิบัติงานที่แข่งขันได้ในสถานการณ์ความเครียดในการคำนวณที่เฉพาะเจาะจง
การประเมินทางเทคนิคพิจารณาตัวแปรสภาพแวดล้อมที่แตกต่างกัน รวมถึงอุณหภูมิในการทำงานและความพร้อมใช้งานของหน่วยความจำเข้าถึงโดยสุ่มในระหว่างการสอบถาม การสำรวจบันทึกความแตกต่างของเวลาตอบสนองระหว่างการประมวลผลที่ดำเนินการโดยตรงบนเมนบอร์ดของคอมพิวเตอร์และคำขอที่ส่งผ่านเครือข่ายอินเทอร์เน็ตไปยังเซิร์ฟเวอร์ที่อยู่ในคลาวด์ ข้อมูลที่แยกออกมานำเสนอภาพรวมโดยละเอียดเกี่ยวกับวิวัฒนาการของโปรเซสเซอร์ตามสถาปัตยกรรม ARM
ประสิทธิภาพฮาร์ดแวร์ภายในกับโครงสร้างพื้นฐานระยะไกล
เพื่อสร้างการเปรียบเทียบที่ยุติธรรม การทดสอบใช้เครื่องมือ ClickBench และ TPC-DS ซึ่งทั้งสองเครื่องมือได้รับการยอมรับอย่างกว้างขวางในภาคธุรกิจสำหรับการวัดประสิทธิภาพในฐานข้อมูล ClickBench ได้รับการกำหนดค่าให้ดำเนินการกรองและการรวมกลุ่มในตารางที่มีแถวบันทึก 100 ล้านแถว โปรโตคอล TPC-DS ใช้ชุดแบบสอบถามที่ซับซ้อน 99 ชุด ซึ่งออกแบบมาเพื่อความต้องการความจุหน่วยความจำสูงสุดและแกนประมวลผลของเครื่องที่ได้รับการประเมิน
สภาพแวดล้อมการทดสอบประกอบด้วยการกำหนดค่าคอมพิวเตอร์ระดับเริ่มต้นของ Apple ซึ่งทำงานโดยใช้ไดรฟ์โซลิดสเทต NVMe ที่บัดกรีเข้ากับบอร์ดโดยตรง บนฝั่งเซิร์ฟเวอร์คลาวด์ อินสแตนซ์แรกที่เลือกสำหรับการปะทะคือ c6a.4xlarge ซึ่งเป็นเครื่องเสมือนที่ติดตั้งแกนประมวลผล 16 vCPU และ RAM ขนาด 32 GB ตัวเลือกนี้แสดงถึงเซิร์ฟเวอร์ขนาดกลางที่บริษัทต่างๆ มักใช้เพื่อโฮสต์แอปพลิเคชันเชิงพาณิชย์
อินสแตนซ์คลาวด์ตัวที่สองที่ทดสอบได้ยกระดับการเปรียบเทียบ โดยใช้ฮาร์ดแวร์ c8g.metal-48xl เซิร์ฟเวอร์ขนาดใหญ่นี้มีแกนประมวลผล 192 คอร์ที่น่าประทับใจและหน่วยความจำ 384 GB ซึ่งแสดงถึงระดับแนวหน้าในโครงสร้างพื้นฐานระยะไกลเชิงพาณิชย์ ความแตกต่างในข้อกำหนดทางเทคนิคมีไว้เพื่อทดสอบขีดจำกัดสัมบูรณ์ของโปรเซสเซอร์ A19 Pro ในสภาวะที่มีข้อเสียเปรียบทางทฤษฎีอย่างมาก
วิธีการของ DuckDB แบ่งการประเมินออกเป็นสองประเภทหลักๆ เพื่อให้มั่นใจถึงความสมบูรณ์ของผลลัพธ์ ระยะแรกประกอบด้วยการประมวลผลแบบเย็น โดยที่ระบบไม่มีข้อมูลที่แคชไว้ก่อนหน้านี้ บังคับให้อ่านโดยตรงจากดิสก์ ขั้นตอนที่สองเกี่ยวข้องกับการดำเนินการแบบ hot ซึ่งในเวลานี้ข้อมูลได้ถูกโหลดล่วงหน้าลงในหน่วยความจำที่รวดเร็วของระบบแล้ว ซึ่งเป็นการจำลองสภาพแวดล้อมของการสืบค้นซ้ำ ๆ
ความเร็วในการอ่านการดำเนินการโดยไม่ต้องใช้แคช
ในระหว่างขั้นตอน Cold Run ของเกณฑ์มาตรฐาน ClickBench คอมพิวเตอร์พกพาทำงานได้ดีกว่าอินสแตนซ์ระยะไกลอย่างมาก อุปกรณ์ดังกล่าวดำเนินการค้นหาตามกำหนดการทั้งหมดได้ในเวลาไม่ถึงหนึ่งนาที ซึ่งเร็วกว่าเซิร์ฟเวอร์คลาวด์ที่ทดสอบภายใต้เงื่อนไขเดียวกันถึง 2.8 เท่า วิศวกรซอฟต์แวร์ชี้ให้เห็นว่าข้อได้เปรียบเบื้องต้นนี้เกิดจากสถาปัตยกรรมแบบครบวงจรของ Apple ซึ่งลดระยะห่างทางกายภาพและตรรกะระหว่างโปรเซสเซอร์และหน่วยจัดเก็บข้อมูลให้เหลือน้อยที่สุด ทำให้การถ่ายโอนแพ็กเก็ตข้อมูลหลักเร็วขึ้น
ความเหนือกว่าในการเข้าถึงครั้งแรกจะเชื่อมโยงโดยตรงกับการใช้ NVMe SSD ภายใน ซึ่งช่วยลดความจำเป็นในการรับส่งข้อมูลเครือข่ายในการดึงข้อมูล เนื่องจากลักษณะการกระจายของเซิร์ฟเวอร์คลาวด์ จึงขึ้นอยู่กับดิสก์เสมือนที่เชื่อมต่อผ่านสวิตช์และเราเตอร์ภายในศูนย์ข้อมูล ซึ่งมักนำเวลาแฝงของเครือข่ายเข้าสู่เวลาตอบสนองอย่างสม่ำเสมอ แม้ว่า SSD ของอุปกรณ์ที่ทดสอบจะไม่ใช่ส่วนประกอบที่เร็วที่สุดในตลาดฮาร์ดแวร์ทั่วโลก แต่การไม่มีตัวกลางในการสื่อสารภายในรับประกันการอ่านแทบจะในทันที ซึ่งเหนือกว่าโครงสร้างพื้นฐานคลาวด์ในงานที่ร้องขอครั้งแรก
ลักษณะการทำงานของระบบในระหว่างการสืบค้นที่มีความซับซ้อนสูง
การเปลี่ยนไปใช้การทดสอบ TPC-DS ต้องใช้ความซับซ้อนมากขึ้นในการจัดการทรัพยากรในส่วนของโปรเซสเซอร์ A19 Pro ในระดับการประมวลผลข้อมูลที่เล็กลง อุปกรณ์จะรักษาเวลาในการสืบค้นโดยเฉลี่ยไว้ที่ 1.63 วินาที ซึ่งแสดงให้เห็นถึงความคล่องตัวในการแก้ไขการคำนวณทางคณิตศาสตร์ขั้นสูง ระบบปฏิบัติการจัดการงานต่างๆ ได้อย่างราบรื่น ทำให้รอบการทดสอบเบื้องต้นเสร็จสิ้นภายในเวลาประมาณ 15.5 นาทีของการทำงานต่อเนื่อง
ประสิทธิภาพที่บันทึกไว้ในขั้นตอนนี้เน้นย้ำถึงความสามารถของชิปในการจัดการคำสั่งหลายคำสั่งพร้อมกันโดยไม่ทำให้เกิดปัญหาคอขวดที่ปิดกั้นอินเทอร์เฟซผู้ใช้ สถาปัตยกรรมโปรเซสเซอร์สามารถกระจายภาระงานได้อย่างมีประสิทธิภาพระหว่างคอร์ประสิทธิภาพสูงและคอร์ประหยัดพลังงาน การกระจายแบบไดนามิกนี้ช่วยป้องกันการควบคุมปริมาณความร้อนก่อนเวลาอันควรระหว่างการดำเนินการฐานข้อมูลตามปกติ
ความเสถียรที่คงไว้ในระหว่างการสืบค้นที่ซับซ้อนจะตรวจสอบการใช้อุปกรณ์สำหรับงานวิเคราะห์ข้อมูลในระยะแรกของการพัฒนา ผู้เชี่ยวชาญด้านวิทยาศาสตร์ข้อมูลมักต้องการเครื่องที่สามารถรันสคริปต์จำนวนมากในเครื่องได้ก่อนที่จะส่งโค้ดสุดท้ายไปยังเซิร์ฟเวอร์ที่ใช้งานจริง ลักษณะการทำงานของฮาร์ดแวร์เป็นไปตามข้อกำหนดทางเทคนิคขั้นพื้นฐานเหล่านี้โดยคำนึงถึงความปลอดภัย
การจัดการหน่วยความจำเสมือนในสถานการณ์ความเครียด
เมื่อปริมาณงานเพิ่มขึ้นถึงระดับความเครียดสูงสุด ข้อจำกัดทางกายภาพที่กำหนดโดยจำนวนหน่วยความจำ RAM ที่จำกัดของอุปกรณ์ก็ปรากฏชัดเจน เพื่อหลีกเลี่ยงการล่มสลายของระบบในระหว่างการประมวลผลจำนวนมาก ซอฟต์แวร์จึงต้องใช้เทคนิคการรั่วไหล โดยใช้พื้นที่สูงสุด 80 GB บนโซลิดสเตตดิสก์เป็นหน่วยความจำเสมือนชั่วคราว การแลกเปลี่ยนข้อมูลอย่างเข้มข้นระหว่าง RAM และ SSD นี้ชดเชยการขาดพื้นที่ว่างสำหรับการจัดสรรข้อมูล
แม้ว่าจะมีการโอเวอร์โหลดบนบัสจัดเก็บข้อมูล แต่การบูรณาการระหว่างฮาร์ดแวร์และระบบปฏิบัติการทำให้งานเสร็จสมบูรณ์ได้โดยไม่มีการหยุดชะงักที่สำคัญ กระบวนการจัดการหน่วยความจำขยายเวลารวมของการดำเนินการที่หนักที่สุดเป็น 79 นาที ซึ่งสะท้อนโดยตรงของเวลาแฝงที่เกิดจากการเขียนและอ่านลงดิสก์อย่างต่อเนื่อง อย่างไรก็ตาม ความสามารถในการยุติกิจวัตรความเครียดขนาดนี้พิสูจน์ให้เห็นถึงความยืดหยุ่นของสถาปัตยกรรมเมื่อต้องเผชิญกับสถานการณ์ที่ปกติจะทำให้คอมพิวเตอร์ที่เข้ามาขัดข้อง
ประสิทธิภาพเชิงความร้อนของโปรเซสเซอร์ในการทำงานอย่างต่อเนื่อง
การออกแบบระบบระบายความร้อนของชิป A19 Pro แสดงให้เห็นถึงวิวัฒนาการที่สำคัญเมื่อเทียบกับเซมิคอนดักเตอร์รุ่นก่อนหน้าของแบรนด์ ในการทดสอบในห้องปฏิบัติการครั้งก่อนๆ ที่ดำเนินการบนสมาร์ทโฟน ส่วนประกอบเดียวกันนี้จำเป็นต้องใช้วิธีการทำความเย็นแบบสุดขั้ว เช่น การใช้น้ำแข็งแห้ง เพื่อรักษาความถี่สัญญาณนาฬิกาให้สูงภายใต้ภาระสูงสุด ในแชสซีโน้ตบุ๊ก ระบบการกระจายแบบพาสซีฟและแอคทีฟได้รับการพิสูจน์แล้วว่าเพียงพอที่จะรักษาประสิทธิภาพที่สม่ำเสมอในระยะเวลานาน โดยขจัดความจำเป็นในการแทรกแซงจากภายนอกเพื่อการควบคุมอุณหภูมิ
การปรับการใช้พลังงานให้เหมาะสมทำให้อุปกรณ์สามารถส่งมอบประสิทธิภาพสูงโดยมีค่าใช้จ่ายไฟฟ้าน้อยกว่าศูนย์ข้อมูลอย่างมาก เมื่อเปรียบเทียบกับเซิร์ฟเวอร์ c6a.4xlarge อุปกรณ์ภายในมีเวลาดำเนินการโดยรวมของงานหนักช้าลงเพียง 13% แม้จะทำงานโดยใช้หน่วยความจำ RAM เพียงเล็กน้อยบนอินสแตนซ์ระยะไกลก็ตาม อัตราส่วนประสิทธิภาพต่อคอร์นี้เสริมความสามารถทางเทคนิคของโปรเซสเซอร์ ARM สำหรับการใช้งานทางวิทยาศาสตร์และองค์กรที่ต้องการการประมวลผลอย่างต่อเนื่อง
ข้อได้เปรียบทางการเงินในการนำการประมวลผลในท้องถิ่นมาใช้
พลวัตของผลลัพธ์ได้รับการเปลี่ยนแปลงครั้งใหญ่เมื่อการทดสอบก้าวไปสู่ขั้นตอนการดำเนินการแบบเร่งด่วน ซึ่งเป็นสถานการณ์ที่เซิร์ฟเวอร์คลาวด์แสดงให้เห็นถึงพลังดิบของข้อกำหนดทางเทคนิค อินสแตนซ์ c8g.metal-48xl ซึ่งใช้ RAM ขนาด 384 GB ทำงานที่แคชไว้เสร็จภายในเวลาเพียง 4.35 วินาที ในขณะที่คอมพิวเตอร์ในระบบต้องใช้เวลา 54.27 วินาทีในการดำเนินการเดียวกัน เนื่องจากมีความจุต่ำกว่าในการเก็บรักษาข้อมูลที่ใช้งานอยู่ อย่างไรก็ตาม การวิเคราะห์ตลาดเทคโนโลยีบ่งชี้ว่าความสามารถของอุปกรณ์ระดับเริ่มต้นในการแข่งขันบนตัววัดแบบแยกด้วยเซิร์ฟเวอร์ที่ติดตั้งโปรเซสเซอร์ 16-core AMD EPYC เปลี่ยนการรับรู้ถึงความคุ้มค่าต่อต้นทุนสำหรับแผนกไอที ความสามารถในการวิเคราะห์ Big Data ที่ซับซ้อนในพื้นที่ช่วยลดการพึ่งพาอินสแตนซ์คลาวด์ที่เรียกเก็บเงินต่อชั่วโมงการใช้งานได้อย่างมาก การลงทุนในฮาร์ดแวร์ในท้องถิ่นด้วยชิป A19 Pro ถือเป็นทางเลือกที่ประหยัดสำหรับนักพัฒนาอิสระและทีมวิศวกรรมข้อมูลขนาดเล็ก ทำให้เข้าถึงเครื่องมือประสิทธิภาพสูงได้อย่างเท่าเทียมกัน ซึ่งก่อนหน้านี้ต้องใช้งบประมาณที่แข็งแกร่งสำหรับการเช่าโครงสร้างพื้นฐานระยะไกล
เสถียรภาพของระบบนิเวศซอฟต์แวร์สำหรับนักพัฒนา
ความสมบูรณ์ทางกายภาพและเชิงตรรกะของอุปกรณ์ภายใต้ภาระสูงสุดอย่างต่อเนื่องจะรวมตำแหน่งเป็นเครื่องมือทำงานที่เชื่อถือได้สำหรับการไหลอย่างต่อเนื่อง การไม่มีการลดประสิทธิภาพลงอย่างรุนแรงหลังจากใช้เวลานานกว่าหนึ่งชั่วโมงของการประมวลผลที่ขีดจำกัดความร้อน เน้นให้เห็นถึงความสมบูรณ์ของระบบนิเวศของซอฟต์แวร์ที่ทำงานโดยกำเนิดบนสถาปัตยกรรมซิลิคอนในปัจจุบัน ประสิทธิภาพที่ได้รับการพิสูจน์ในการทดสอบกับแพลตฟอร์ม DuckDB เป็นเครื่องพิสูจน์ว่าเครื่องรองรับการคอมไพล์โค้ดและการวิเคราะห์หน่วยเมตริกที่เข้มข้น โดยไม่กระทบต่อความทนทานของส่วนประกอบภายใน

