แอพ Snapchat ผสานรวมปัญญาประดิษฐ์ที่ไม่เคยมีมาก่อนเพื่อแปลงรูปภาพเป็นวิดีโอสั้น ๆ

Snapchat

Snapchat - Matthew Nichols1/ Shutterstock.com

แอพส่งข้อความและมัลติมีเดีย Snapchat ประกาศการรวมฟังก์ชันการทำงานที่ใช้ปัญญาประดิษฐ์ใหม่สำหรับฐานผู้ใช้ทั่วโลก เครื่องมือนี้เรียกว่า AI Clips มีวัตถุประสงค์เพื่อเปลี่ยนวิธีที่บุคคลโต้ตอบกับไฟล์สื่อคงที่ภายในสภาพแวดล้อมเสมือนจริง

เทคโนโลยีนี้ช่วยให้ภาพถ่ายทั่วไปที่จัดเก็บไว้ในอุปกรณ์เคลื่อนที่สามารถแปลงเป็นผลงานภาพและเสียงแบบไดนามิกได้ภายในเวลาไม่กี่วินาที ระบบนี้ไม่จำเป็นต้องมีความรู้ด้านเทคนิคมาก่อนเกี่ยวกับซอฟต์แวร์ตัดต่อระดับมืออาชีพจากผู้ใช้ปลายทาง

การเปิดตัวเกิดขึ้นในช่วงเวลาที่มีการแข่งขันสูงในภาคเทคโนโลยี ซึ่งบริษัทต่างๆ พยายามรักษาความสนใจของสาธารณชนผ่านนวัตกรรมอัตโนมัติ ขณะนี้การอัปเดตกำลังทยอยเผยแพร่ไปยังระบบปฏิบัติการที่เข้ากันได้ในตลาดที่บริษัทดำเนินการอยู่

เทคโนโลยีภาพใหม่ทำงานอย่างไร

ระบบทำงานโดยใช้อัลกอริธึมการเรียนรู้ของเครื่องที่ทำการสแกนพิกเซลของภาพที่เลือกอย่างสมบูรณ์ ในระหว่างกระบวนการวิเคราะห์โครงสร้างนี้ ปัญญาประดิษฐ์จะระบุองค์ประกอบหลัก เช่น ใบหน้าของมนุษย์ วัตถุที่เน้นสี ทิวทัศน์พื้นหลัง และแม้แต่ชุดสีที่โดดเด่นในการจับภาพต้นฉบับ

จากการถอดรหัสข้อมูลภาพนี้ ซอฟต์แวร์จะสร้างไทม์ไลน์เชิงตรรกะสำหรับการแสดงวัสดุ แทนที่จะวางซ้อนรูปภาพเหมือนในสไลด์โชว์แบบดั้งเดิม เครื่องมือนี้ใช้การเคลื่อนไหวของกล้องเสมือนจริง การเปลี่ยนผ่านความทึบ และการครอบตัดอัตโนมัติที่สร้างความรู้สึกลื่นไหลของภาพยนตร์

การทำให้เป็นประชาธิปไตยในการเข้าถึงสิ่งพิมพ์ดิจิทัลขั้นสูง

ในอดีต การสร้างสื่อภาพและเสียงที่เสร็จสมบูรณ์อย่างมืออาชีพจำเป็นต้องมีการลงทุนทางการเงินในโปรแกรมคอมพิวเตอร์เฉพาะและการฝึกอบรมด้านเทคนิคที่ยาวนานหลายชั่วโมง ผู้เชี่ยวชาญด้านการออกแบบและตัดต่อเชี่ยวชาญเทคนิคการตัด การซิงโครไนซ์เสียง และการใช้เอฟเฟกต์การเปลี่ยนแปลง

การเปิดตัว AI Clips ช่วยขจัดอุปสรรคในการดำเนินงานเหล่านี้สำหรับผู้ใช้สมาร์ทโฟนโดยเฉลี่ยเท่านั้น อินเทอร์เฟซของแอปพลิเคชันได้รับการออกแบบมาให้ต้องมีการสัมผัสหน้าจอเป็นอย่างน้อย เพื่อถ่ายโอนภาระการประมวลผลที่ซับซ้อนทั้งหมดไปยังเซิร์ฟเวอร์คลาวด์ของบริษัทและกลไกปัญญาประดิษฐ์

ด้วยวิธีนี้ ผู้สร้างเนื้อหาอิสระ ผู้ประกอบการรายย่อย และผู้ใช้ทั่วไปจะสามารถเข้าถึงทรัพยากรที่มีมูลค่าเพิ่มสูงโดยไม่มีค่าใช้จ่ายโดยตรงเพิ่มเติม ความสะดวกในการใช้งานส่งเสริมให้มีการตีพิมพ์สื่อบ่อยครั้งซึ่งก่อนหน้านี้ถูกจำกัดไว้เฉพาะในแกลเลอรีส่วนตัวของโทรศัพท์มือถือ

การปรับแต่งเพลงประกอบและฟิลเตอร์ภาพ

แม้ว่าระบบจะส่งเสริมระบบอัตโนมัติในระดับสูง แต่สถาปัตยกรรมซอฟต์แวร์ยังคงรักษาขั้นตอนการแทรกแซงด้วยตนเองเพื่อรับประกันการประพันธ์เนื้อหา หลังจากที่วิดีโอเวอร์ชันแรกถูกสร้างขึ้นโดยปัญญาประดิษฐ์ ผู้ใช้จะถูกส่งไปยังแผงควบคุมเพื่อทำการปรับแต่งอย่างละเอียด

ในพื้นที่แก้ไขรองนี้ สามารถเปลี่ยนลำดับเวลาของรูปภาพที่จัดเรียงโดยอัลกอริทึมได้ ระบบอนุญาตให้ลบเฟรมเฉพาะหรือเพิ่มรูปถ่ายใหม่ในนาทีสุดท้าย บังคับให้ปัญญาประดิษฐ์คำนวณการเปลี่ยนภาพใหม่ทันที

คุณสมบัติบูรณาการอีกประการหนึ่งคือการซิงโครไนซ์เพลงอัตโนมัติกับไลบรารีเสียงที่ได้รับลิขสิทธิ์ของแพลตฟอร์ม ผู้ใช้สามารถเลือกแนวดนตรีหรือแทร็กที่ต้องการได้ และอัลกอริธึมจะปรับการตัดภาพเพื่อให้ตรงกับจังหวะที่หนักแน่นที่สุดของเพลงที่เลือก

สามารถแทรกฟิลเตอร์สี สติกเกอร์ดิจิทัล และข้อความซ้อนทับก่อนเผยแพร่ขั้นสุดท้ายได้ การปรับเปลี่ยนในแบบของคุณในระดับนี้ช่วยให้แน่ใจว่าผลลัพธ์ที่ได้จะไม่เป็นแบบทั่วไป โดยคงเอกลักษณ์ทางภาพที่แต่ละคนต้องการฉายในโปรไฟล์สาธารณะหรือส่วนตัวของตน

การเพิ่มเวลาหน้าจอในหมู่ผู้ใช้ทั่วโลก

กลยุทธ์ทางธุรกิจที่อยู่เบื้องหลังการเปิดตัวมุ่งเน้นไปที่การมีส่วนร่วมของผู้ชมและการวัดการรักษาผู้ใช้ภายในระบบนิเวศของแอปโดยตรง การศึกษาตลาดระบุว่าเนื้อหาในรูปแบบวิดีโอมีอัตราการดู การแชร์ และการโต้ตอบที่สูงกว่าอย่างมากเมื่อเปรียบเทียบกับสื่อสิ่งพิมพ์แบบคงที่ ด้วยการอำนวยความสะดวกในการผลิตสื่อประเภทนี้เป็นจำนวนมาก บริษัทคาดการณ์ว่าปริมาณการโพสต์ในแต่ละวันจะเพิ่มขึ้น ซึ่งส่งผลให้ผู้ใช้ใช้เวลาในการดูฟีดอัปเดตเพิ่มมากขึ้น

การเติบโตของคลังวิดีโอที่มีอยู่บนแพลตฟอร์มยังส่งผลโดยตรงต่อรูปแบบการสร้างรายได้ของบริษัทอีกด้วย เนื่องจากผู้ใช้ใช้เวลาในแต่ละวันมากขึ้นในการดูคลิปไดนามิก บริษัทจึงขยายพื้นที่ว่างสำหรับการแทรกโฆษณาที่ตรงเป้าหมาย ในทางกลับกัน ผู้ลงโฆษณามีแนวโน้มที่จะลงทุนมากขึ้นในแพลตฟอร์มที่นำเสนอรูปแบบภาพและเสียงที่สมจริง และฐานผู้ใช้ที่มีความกระตือรือร้นสูงและมีส่วนร่วมในการผลิตเนื้อหาต้นฉบับ

ความเป็นส่วนตัวของข้อมูลและความปลอดภัยทางไซเบอร์บนเครือข่าย

การใช้เครื่องมือที่ต้องอาศัยการสแกนภาพเชิงลึกทำให้เกิดข้อถกเถียงทางเทคนิคและกฎหมายเกี่ยวกับการปกป้องข้อมูลส่วนบุคคลในระดับโลก เพื่อให้ปัญญาประดิษฐ์สามารถระบุใบหน้าและสภาพแวดล้อมได้ จำเป็นต้องประมวลผลข้อมูลไบโอเมตริกซ์และบริบทที่ถือว่ามีความละเอียดอ่อนตามกฎหมายความเป็นส่วนตัวสมัยใหม่ บริษัทที่กำลังพัฒนาจำเป็นต้องตรวจสอบให้แน่ใจว่าการประมวลผลภาพเหล่านี้เกิดขึ้นในสภาพแวดล้อมที่เข้ารหัส และข้อมูลที่แยกออกมาเพื่อฝึกอัลกอริทึมจะไม่ถูกจัดเก็บในลักษณะที่เกี่ยวข้องกับตัวตนที่แท้จริงของผู้ใช้โดยไม่ได้รับความยินยอมอย่างชัดแจ้ง ผู้เชี่ยวชาญด้านความปลอดภัยของข้อมูลชี้ให้เห็นว่าการรั่วไหลของฐานข้อมูลที่มีการแมปใบหน้าแสดงถึงความเสี่ยงร้ายแรง ซึ่งต้องมีการตรวจสอบเซิร์ฟเวอร์คลาวด์อย่างต่อเนื่อง ความโปร่งใสในแง่ของการใช้งานกลายเป็นปัจจัยกำหนดในการรักษาความไว้วางใจของสาธารณะ ทำให้แพลตฟอร์มต้องระบุรายละเอียดอย่างชัดเจนว่าข้อมูลเมตาของภาพถ่ายจะยังคงอยู่ในระบบขององค์กรนานแค่ไหนหลังจากสร้างวิดีโอขั้นสุดท้าย

การบรรเทาอคติในอัลกอริทึมการประมวลผล

นอกเหนือจากการรักษาความปลอดภัยเชิงโครงสร้างแล้ว ทีมวิศวกรรมซอฟต์แวร์ยังเผชิญกับความท้าทายในการปรับเทียบปัญญาประดิษฐ์เพื่อป้องกันพฤติกรรมที่เลือกปฏิบัติ ระบบที่ได้รับการฝึกด้วยฐานข้อมูลที่ไม่สมดุลอาจล้มเหลวเมื่อประมวลผลโทนสีผิวเข้มหรือเมื่อระบุองค์ประกอบทางวัฒนธรรมที่เฉพาะเจาะจง ซึ่งจำเป็นต้องมีการอัปเดตซอร์สโค้ดอย่างต่อเนื่องเพื่อให้มั่นใจถึงความเป็นธรรมในการจัดการกับภาพในทุกโปรไฟล์ประชากร

การเปลี่ยนแปลงรูปแบบการเล่าเรื่องบนแพลตฟอร์ม

การใช้ตัวแปลงสื่อจำนวนมากเปลี่ยนแปลงมาตรฐานความสวยงามของการสื่อสารดิจิทัลร่วมสมัย รายงานประจำวัน ความครอบคลุมของกิจกรรมส่วนตัว และแฟ้มผลงานระดับมืออาชีพ ในปัจจุบันจำเป็นต้องมีการนำเสนอตามการเคลื่อนไหวและเสียงเพื่อดึงดูดความสนใจของผู้ชมที่กระจัดกระจายมากขึ้น

การเปลี่ยนผ่านจากแบบคงที่ไปเป็นแบบไดนามิกนี้ส่งผลให้บริษัทอื่นๆ ในภาคเทคโนโลยีต้องเร่งดำเนินการห้องปฏิบัติการวิจัยและพัฒนาของตนเอง ความคาดหวังของผู้บริโภคปลายทางได้รับการปรับให้สูงขึ้น ทำให้ระบบภาพและเสียงอัตโนมัติเป็นข้อกำหนดพื้นฐานสำหรับแอปพลิเคชันใดๆ ที่นำเสนอบริการโฮสต์รูปภาพ

ความเหมาะสมทางเทคนิคสำหรับอุปกรณ์มือถือต่างๆ

เพื่อให้แน่ใจว่าฟีเจอร์ใหม่นี้จะเข้าถึงผู้คนได้มากที่สุดเท่าที่จะเป็นไปได้ สถาปัตยกรรมของทรัพยากรจึงได้รับการปรับให้ทำงานบนอุปกรณ์ที่มีความสามารถในการประมวลผลที่แตกต่างกัน การเรนเดอร์วิดีโอเกิดขึ้นในลักษณะไฮบริด โดยใช้ทั้งฮาร์ดแวร์ของโทรศัพท์มือถือและการสนับสนุนจากเซิร์ฟเวอร์ระยะไกลของบริษัท

การเพิ่มประสิทธิภาพนี้ช่วยป้องกันสมาร์ทโฟนรุ่นเก่าไม่ให้เกิดปัญหาหรือความร้อนสูงเกินไประหว่างการสร้างวัสดุ วิศวกรรมที่อยู่เบื้องหลังระบบมุ่งเน้นไปที่การส่งไฟล์สุดท้ายที่ถูกบีบอัด ซึ่งใช้ข้อมูลมือถือน้อยลงเมื่ออัพโหลดไปยังเครือข่าย อำนวยความสะดวกในการใช้งานในภูมิภาคที่มีโครงสร้างพื้นฐานอินเทอร์เน็ตที่จำกัด

การขยายเครื่องมือสำหรับภาคองค์กร

แม้ว่าการมุ่งเน้นในเบื้องต้นจะอยู่ที่ผู้ใช้ปลายทาง แต่เทคโนโลยีนี้ก็ยังมีศักยภาพในการประยุกต์ใช้กับบัญชีธุรกิจและเครื่องหมายการค้าจดทะเบียน แผนกการตลาดสามารถใช้ระบบเพื่อแปลงแคตตาล็อกผลิตภัณฑ์แบบคงที่ให้เป็นแคมเปญโฆษณาแบบไดนามิกที่มีต้นทุนการผลิตต่ำและมีความเร็วในการดำเนินการสูง

ความคล่องตัวในการสร้างสื่อส่งเสริมการขายช่วยให้บริษัทต่างๆ ตอบสนองต่อแนวโน้มของตลาดหรือเหตุการณ์ต่างๆ ได้อย่างรวดเร็วแบบเรียลไทม์ เครื่องมือนี้ถูกรวมไว้เป็นยูทิลิตี้มัลติฟังก์ชั่น ตอบสนองทุกสิ่งตั้งแต่ความต้องการความบันเทิงส่วนบุคคลไปจนถึงความต้องการการสื่อสารองค์กรในสภาพแวดล้อมดิจิทัล