เครื่องมือ Google Gemini เปลี่ยนภาพถ่ายส่วนตัวให้เป็นฉากหลังวันอีดที่สมจริง

gemini

gemini - Stock all/Shutterstock.com

ระบบปัญญาประดิษฐ์ของยักษ์ใหญ่ด้านเทคโนโลยีในอเมริกาเหนือได้รับการอัปเดตที่สำคัญซึ่งมุ่งเป้าไปที่การแก้ไขและสร้างภาพที่สมจริง ฟังก์ชันการทำงานใหม่ที่รวมเข้ากับแพลตฟอร์มหลัก ช่วยให้ผู้ใช้สามารถปรับเปลี่ยนรูปถ่ายส่วนตัวเพื่อแทรกลงในบริบทเทศกาลที่เฉพาะเจาะจงได้ จุดมุ่งหมายเบื้องต้นของการเปิดตัวครั้งนี้เป็นไปตามข้อเรียกร้องของการเฉลิมฉลองการสิ้นสุดช่วงถือศีลอดของศาสนาอิสลาม ซึ่งกำหนดไว้ในวันที่ 21 มีนาคมในอินเดียและในภูมิภาคอื่นๆ หลายแห่งของโลก เทคโนโลยีจะประมวลผลไฟล์ที่ส่งและใช้องค์ประกอบภาพแบบดั้งเดิมของวันที่ด้วยความเที่ยงตรงของกราฟิกสูง การเปลี่ยนแปลงสถานการณ์และการแต่งกายตามคำแนะนำที่ผู้ใช้ให้ไว้

อินเทอร์เฟซได้รับการออกแบบให้ต้องการความรู้ทางเทคนิคขั้นสูงในการออกแบบกราฟิกหรือการจัดการซอฟต์แวร์ตัดต่อระดับมืออาชีพ ใครก็ตามที่มีอินเทอร์เน็ตสามารถใช้คำสั่งข้อความธรรมดาเพื่อเปลี่ยนแสงของภาพถ่ายต้นฉบับ เพิ่มวัตถุตกแต่ง และแก้ไขสภาพแวดล้อมพื้นหลังได้ การประมวลผลเกิดขึ้นบนเซิร์ฟเวอร์ความจุสูง ทำให้มั่นใจได้ว่าการเรนเดอร์ภาพจะเสร็จสิ้นอย่างรวดเร็วและมีประสิทธิภาพ

ผลลัพธ์สุดท้ายจะรักษาลักษณะใบหน้าและสัดส่วนร่างกายของบุคคลที่แสดงไว้ ขณะเดียวกันก็เปลี่ยนบรรยากาศของภาพไปโดยสิ้นเชิง การอัปเดตนี้มีจุดมุ่งหมายเพื่ออำนวยความสะดวกในการสร้างเนื้อหาภาพสำหรับการแชร์บนโซเชียลเน็ตเวิร์กในช่วงเทศกาล โดยเสนอทางเลือกที่เหมาะสมสำหรับการผลิตบันทึกภาพถ่ายตามธีมโดยไม่ต้องใช้อุปกรณ์พิเศษหรือฉากจริง

การทำงานทางเทคนิคของระบบแก้ไขภาพใหม่

การเข้าถึงเครื่องมือต้องใช้อุปกรณ์ที่เชื่อมต่อกับเครือข่ายเท่านั้น ไม่ว่าจะเป็นคอมพิวเตอร์เดสก์ท็อป แท็บเล็ต หรือสมาร์ทโฟน ผู้ใช้จะต้องเข้าสู่อินเทอร์เฟซหลักของผู้ช่วยเสมือน และเลือกแท็บสำหรับการสร้างสื่อภาพโดยเฉพาะ ระบบขอส่งไฟล์ฐานซึ่งจะทำหน้าที่เป็นเทมเพลตสำหรับการเปลี่ยนแปลงทางดิจิทัล

หลังจากโหลดไฟล์แล้ว แพลตฟอร์มจะเปิดช่องข้อความสำหรับแทรกคำสั่งเชิงอธิบาย เมื่อถึงจุดนี้ปัญญาประดิษฐ์จะวิเคราะห์องค์ประกอบดั้งเดิมของภาพถ่าย การทำแผนที่ใบหน้า ท่าทาง และความชัดลึกที่มีอยู่ ความแม่นยำของการทำแผนที่นี้ถือเป็นสิ่งสำคัญเพื่อหลีกเลี่ยงการบิดเบือนทางกายวิภาคในระหว่างการใช้องค์ประกอบภาพใหม่

สถาปัตยกรรมซอฟต์แวร์ใช้โครงข่ายประสาทเทียมที่ได้รับการฝึกด้วยฐานข้อมูลขนาดใหญ่ที่มีภาพความละเอียดสูง ซึ่งช่วยให้การเรนเดอร์เข้าใจแนวคิดที่ซับซ้อนเกี่ยวกับแสงธรรมชาติ เงาทอด และพื้นผิวผ้า อัลกอริธึมจะปรับจานสีโดยอัตโนมัติเพื่อให้ตรงกับบรรยากาศที่ร้องขอในข้อความคำสั่ง

นักพัฒนาได้ใช้ตัวกรองความปลอดภัยที่เข้มงวดเพื่อป้องกันการสร้างเนื้อหาที่ไม่เหมาะสมหรือการจัดการใบหน้าของบุคคลที่สามในทางที่เป็นอันตราย แนวทางหลักของแพลตฟอร์มจำกัดการใช้เครื่องมือเพื่อวัตถุประสงค์ในความบันเทิงส่วนบุคคลและการเฉลิมฉลองทางวัฒนธรรม โดยบล็อกคำขอที่ละเมิดข้อกำหนดในการให้บริการที่บริษัทกำหนด

คำสั่งเชิงพรรณนาสำหรับการแต่งเพลงที่คุ้นเคย

การสร้างภาพกลุ่มต้องมีคำอธิบายโดยละเอียดเพื่อนำทาง AI ได้อย่างถูกต้อง คำสั่งที่มีประสิทธิภาพต้องระบุจำนวนคน การจัดการในสภาพแวดล้อม และองค์ประกอบตกแต่งที่ต้องการ คำแนะนำที่กล่าวถึงเสื้อผ้าแบบดั้งเดิมที่มีชีวิตชีวาและโต๊ะที่เต็มไปด้วยขนมหวานทั่วไปจะให้ผลลัพธ์ที่แม่นยำยิ่งขึ้นซึ่งสอดคล้องกับวัฒนธรรมของการเฉลิมฉลอง

ระบบสามารถตีความปฏิสัมพันธ์ระหว่างสมาชิกของภาพถ่าย เช่น การแลกเปลี่ยนของขวัญ หรือการรับประทานอาหารร่วมกัน ซอฟต์แวร์จะเน้นการแสดงออกทางสีหน้าและเบลอพื้นหลังเล็กน้อยโดยขอแสงแบบภาพยนตร์และซอฟต์โฟกัส จำลองเอฟเฟกต์ของเลนส์ถ่ายภาพระดับมืออาชีพที่ใช้ในสตูดิโอ

การปรับแต่งภาพบุคคลและภาพเซลฟี่ส่วนบุคคล

ภาพถ่ายที่ถ่ายในรูปแบบภาพเหมือนตนเองจะได้รับการดูแลเป็นพิเศษจากอัลกอริธึมการประมวลผลภาพ ผู้ใช้สามารถขอเปลี่ยนเสื้อผ้าทั้งหมด เปลี่ยนเสื้อผ้าลำลองเป็นชุดเทศกาลที่ประณีต โดยไม่สูญเสียสัดส่วนร่างกายเดิม พื้นหลังของภาพยังสามารถแทนที่ด้วยการตกแต่งตามธีมหรือทิวทัศน์ทางสถาปัตยกรรมที่สอดคล้องกับวันที่

สุนทรียภาพที่สร้างขึ้นตรงตามมาตรฐานการเผยแพร่บนแพลตฟอร์มดิจิทัล โดยจัดลำดับความสำคัญของสีที่สดใสและคอนทราสต์ที่ชัดเจน ความเร็วในการส่งไฟล์สุดท้ายทำให้ผู้ใช้สามารถทำการทดสอบหลายครั้งด้วยคำสั่งที่แตกต่างกัน จนกระทั่งพบองค์ประกอบภาพที่แน่นอน

การปรับเปลี่ยนอย่างละเอียดที่มีอยู่บนแพลตฟอร์มทำให้มั่นใจได้ว่าผลลัพธ์จะไม่ดูปลอม การผสมผสานระหว่างภาพถ่ายจริงที่ส่งไปและองค์ประกอบที่สร้างด้วยคอมพิวเตอร์นั้นทำได้อย่างลื่นไหล โดยคำนึงถึงทิศทางของแสงและเงาตามธรรมชาติของใบหน้าของผู้ใช้

องค์ประกอบทางวัฒนธรรมที่บูรณาการเข้ากับการสร้างกราฟิก

ความถูกต้องแม่นยำในการแสดงรายการแบบดั้งเดิมถือเป็นจุดศูนย์กลางประการหนึ่งของการอัปเดตซอฟต์แวร์ ฐานข้อมูลมีการอ้างอิงภาพโคมไฟประดับ ผ้าม่าน และอาหารเฉพาะสำหรับวันหยุดอิสลาม การดูแลจัดการข้อมูลนี้จะหลีกเลี่ยงการนำเสนอการเฉลิมฉลองแบบทั่วไปหรือแบบเหมารวม เพื่อให้มั่นใจว่ามีการเคารพประเพณี ปัญญาประดิษฐ์จดจำคำศัพท์ประจำภูมิภาคและชื่ออาหารแบบดั้งเดิมที่ป้อนลงในคำสั่งข้อความ แสดงผลอาหารด้วยพื้นผิวที่สมจริงและรายละเอียดปลีกย่อย

การตั้งค่าทางสถาปัตยกรรมยังสามารถปรับเปลี่ยนเพื่อสะท้อนถึงรูปแบบที่อยู่อาศัยหรือพื้นที่อยู่อาศัยที่แตกต่างกันได้ ตั้งแต่ลานกลางแจ้งที่มีแสงแดดส่องถึงไปจนถึงห้องนั่งเล่นแสนสบายที่มีแสงประดิษฐ์อันนุ่มนวล อัลกอริธึมจะปรับภาพถ่ายต้นฉบับให้เข้ากับสภาพแวดล้อมใหม่ที่นำเสนอได้อย่างสมบูรณ์แบบ ระบบเข้าใจถึงความสำคัญของบรรยากาศครอบครัวในวันที่เหล่านี้ และปรับสีทั่วไปของภาพเพื่อถ่ายทอดความรู้สึกของการต้อนรับและการเฉลิมฉลอง ซึ่งเป็นองค์ประกอบสำคัญในการนำเสนอกิจกรรมทางวัฒนธรรมที่ถูกต้อง

การประมวลผลภาพเด็กและไดนามิกของการเคลื่อนไหว

การดัดแปลงภาพถ่ายที่มีเด็กทำให้เกิดความท้าทายทางเทคนิค เนื่องจากจำเป็นต้องจับภาพความเป็นธรรมชาติและการเคลื่อนไหวของกลุ่มอายุนี้ ระบบได้รับการปรับเทียบเพื่อตีความคำสั่งที่เกี่ยวข้องกับเกม การโต้ตอบกับวัตถุในเทศกาล และการแสดงออกถึงความกระตือรือร้น เมื่อประมวลผลคำขอเหล่านี้ ปัญญาประดิษฐ์จะใช้เทคนิคภาพเบลอจากการเคลื่อนไหวที่คำนวณเพื่อจำลองการกระทำ ขณะเดียวกันก็รักษาความคมชัดของใบหน้าเพื่อให้แน่ใจว่าสามารถจดจำบุคคลที่ปรากฎได้ การรักษาสัดส่วนทางกายวิภาคของเด็กระหว่างการเปลี่ยนเสื้อผ้าดิจิทัลรับประกันโดยโมดูลการจดจำร่างกายโดยเฉพาะ ต่างจากการแก้ไขโดยมือสมัครเล่นที่มักส่งผลให้เกิดความล้มเหลวที่ทับซ้อนกัน เทคโนโลยีจะปรับความพอดีของผ้าเสมือนจริงตามท่าทางของเด็กในภาพถ่ายต้นฉบับ ผู้ใช้สามารถระบุสไตล์ของเสื้อผ้า สีเด่น และอุปกรณ์เสริมเสริม โดยรับภาพสุดท้ายที่ดูเหมือนว่าจะถ่ายโดยช่างภาพมืออาชีพในช่วงเทศกาลเป็นการแลกเปลี่ยน

การทำให้เป็นประชาธิปไตยในการเข้าถึงการแก้ไขภาพ

ความพร้อมใช้งานของเครื่องมือแก้ไขภาพเสมือนจริงตามคำสั่งข้อความจะเปลี่ยนไดนามิกของการผลิตเนื้อหาภาพสำหรับประชาชนทั่วไป ก่อนหน้านี้ การสร้างภาพตัดต่อที่ซับซ้อนจำเป็นต้องจ้างผู้เชี่ยวชาญเฉพาะทางหรือซื้อลิขสิทธิ์ซอฟต์แวร์ตัดต่อราคาแพง

โครงสร้างข้อความเพื่อเพิ่มประสิทธิภาพผลลัพธ์

เพื่อดึงศักยภาพสูงสุดออกจากเครื่องมือ ผู้ใช้จะใช้รูปแบบเฉพาะในการกำหนดคำสั่งข้อความที่ส่งไปยังระบบ

– คำอธิบายเบื้องต้นเน้นไปที่ตัวแบบหลักและการกระทำของเขาในฉาก

– รายละเอียดของเสื้อผ้า รวมถึงสี ผ้า และการตัดเย็บแบบดั้งเดิม

– ข้อกำหนดของสภาพแวดล้อมพื้นหลัง กล่าวถึงเฟอร์นิเจอร์และของตกแต่ง

– การกำหนดรูปแบบการจัดแสง เช่น แสงธรรมชาติยามเช้าหรือไฟภายในห้องโทนอุ่น