Το Google έχει αρχίσει να απελευθερώνει πρόσβαση στο Project Genie, ένα πειραματικό εργαλείο που μετατρέπει μηνύματα κειμένου ή εικόνας σε διαδραστικά τρισδιάστατα εικονικά περιβάλλοντα. Η πλατφόρμα είναι αρχικά διαθέσιμη μόνο σε συνδρομητές του προγράμματος Google AI Ultra στο Estados Unidos. Το πιστοποιημένο Usuários μπορεί να δημιουργήσει ποικίλα σενάρια και να τα περιηγηθεί σε πραγματικό χρόνο χρησιμοποιώντας βασικά στοιχεία ελέγχου.
Το σύστημα χρησιμοποιεί το μοντέλο Genie 3, που αναπτύχθηκε από την Google DeepMind, για τη διατήρηση της οπτικής και φυσικής συνέπειας κατά την εξερεύνηση. Το εργαλείο δημιουργεί νέα στοιχεία του περιβάλλοντος καθώς ο χρήστης κινείται, προσφέροντας εμπειρίες που διαρκούν αρκετά λεπτά χωρίς σημαντικές διακοπές. Ο έλεγχος πραγματοποιείται μέσω των πλήκτρων βέλους του πληκτρολογίου ή των εντολών άμεσης κίνησης.
Το Project Genie αντιπροσωπεύει μια πρόοδο στα παγκόσμια μοντέλα παραγωγής της εταιρείας. Το Ele εξαλείφει την ανάγκη για προηγμένες δεξιότητες προγραμματισμού για τη δημιουργία καθηλωτικών πρωτοτύπων. Η πρωτοβουλία ανοίγει δυνατότητες σε τομείς όπως η ανάπτυξη παιχνιδιών και οι εκπαιδευτικές προσομοιώσεις.
Εξέλιξη μοντέλων τζίνι
Η σειρά Genie ξεκίνησε το 2024 με ένα μοντέλο ικανό να δημιουργεί περιβάλλοντα 2D με δυνατότητα αναπαραγωγής από βίντεο χωρίς ετικέτα από το διαδίκτυο. Η αρχική έκδοση Essa κατέδειξε τη σκοπιμότητα δημιουργίας δυναμικών κόσμων χωρίς άμεση επίβλεψη ενεργειών. Η εστίαση ήταν στην εκμάθηση λανθάνουσας αναπαράστασης της κίνησης και της αλληλεπίδρασης.
Το Genie 2, που παρουσιάστηκε τον Δεκέμβριο του 2024, επέκτεινε τις δυνατότητες για πιο λεπτομερή τρισδιάστατα σενάρια. Ο Ele άρχισε να δέχεται εννοιολογικές εικόνες και σχέδια ως είσοδο, δημιουργώντας ρεαλιστικές παραλλαγές των περιβαλλόντων. Η βελτίωση στη γενίκευση επέτρεψε μεγαλύτερη ποικιλομορφία των αποτελεσμάτων.
Η τρέχουσα έκδοση, Genie 3, εισήγαγε διαδραστικότητα σε πραγματικό χρόνο με ρυθμό 20 έως 24 καρέ ανά δευτερόλεπτο. Το μοντέλο ενσωματώνει μνήμη από προηγούμενες αλληλεπιδράσεις για να διατηρήσει παρατεταμένη συνοχή. Η τεχνική βάση Essa υποστηρίζει το πρωτότυπο που κυκλοφόρησε στο Google Labs.
Τεχνική λειτουργία του εργαλείου
Η διαδικασία ξεκινάει εισάγοντας μια προτροπή κειμένου που περιγράφει το επιθυμητό περιβάλλον ή ανεβάζοντας μια εικόνα αναφοράς. Το σύστημα δημιουργεί ένα αρχικό τρισδιάστατο σκίτσο που χρησιμεύει ως σημείο εκκίνησης. Τα στοιχεία ελέγχου Opções περιλαμβάνουν προβολή πρώτου ή τρίτου προσώπου.
Καθώς ο χρήστης πλοηγείται, το μοντέλο προβλέπει και δημιουργεί νέα τμήματα του κόσμου με αυτοπαλινδρομικό τρόπο. Το Ele επεξεργάζεται ενέργειες σε πραγματικό χρόνο και προσαρμόζει οπτικά στοιχεία για να διατηρεί τη συνέχεια. Τα Refinamentos είναι δυνατά μέσω πρόσθετων μηνυμάτων κατά τη διάρκεια της συνεδρίας.
Το εργαλείο σάς επιτρέπει να αναμιγνύετε προηγούμενες δημιουργίες, συνδυάζοντας χαρακτηριστικά από διαφορετικούς κόσμους. Το Usuários μπορεί να αλλάξει συγκεκριμένες πτυχές, όπως ο φωτισμός ή τα παρόντα αντικείμενα. Το τελικό αποτέλεσμα μπορεί να εξαχθεί ως βίντεο επίδειξης.
- Περιγραφικό κείμενο ζητά να ορίσετε το αρχικό θέμα.
- Εικόνες ή σκίτσα ως οπτική βάση.
- Εντολές για προσαρμογή της φυσικής ή της κλίμακας.
- Ενσωμάτωση συγκεκριμένων καλλιτεχνικών στυλ.

Πρακτικά παραδείγματα δημιουργίας
Οι χρήστες έχουν δημιουργήσει σενάρια που κυμαίνονται από φυσικά τοπία έως φανταστικά περιβάλλοντα. Το Exemplos περιλαμβάνει πλανήτες με ορατούς δακτυλίους και ακανόνιστο έδαφος που εξερευνούνται από οχήματα. Το Outros περιλαμβάνει αδύνατες αρχιτεκτονικές κατασκευές, όπως κρεμαστά κάστρα ή νησιά με ανεστραμμένους καταρράκτες.
Το εργαλείο αναπαράγει διαφορετικά οπτικά στυλ όταν ζητηθεί στην προτροπή. Mundos υποβρύχια περιβάλλοντα με λεπτομερή πανίδα εμφανίζονται με ακριβείς περιγραφές. Cidades Τα φουτουριστικά φώτα νέον και τα ιπτάμενα οχήματα είναι επίσης κοινά μεταξύ των πρώιμων δοκιμών.
Οι μεταβάσεις μεταξύ των περιοχών διατηρούν την οπτική ρευστότητα κατά την πλοήγηση. Elementos καθώς ο φωτισμός και οι σκιές παραμένουν συνεπείς. Το παρατεταμένο Sessões δείχνει την ικανότητα του περιβάλλοντος για άπειρη επέκταση.
Εφαρμογές σε διάφορους τομείς
Οι προγραμματιστές παιχνιδιών χρησιμοποιούν το Project Genie για γρήγορη δημιουργία πρωτοτύπων επιπέδων και μηχανικών. Η δημιουργία περιβαλλόντων δοκιμής επιταχύνει τη διαδικασία χωρίς την ανάγκη παραδοσιακής χειροκίνητης μοντελοποίησης. Το Equipes επικυρώνει τις αφηγηματικές έννοιες πριν επενδύσει σε πλήρη παραγωγή.
Στον εκπαιδευτικό τομέα, οι δάσκαλοι προσομοιώνουν ιστορικούς χώρους ή επιστημονικά φαινόμενα για καθηλωτικά μαθήματα. Estudantes εξερευνήστε αρχαίους πολιτισμούς ή πολύπλοκα οικοσυστήματα διαδραστικά. Το προσαρμοσμένο Ajustes προσαρμόζει το περιεχόμενο στο συγκεκριμένο πρόγραμμα σπουδών.
Η εκπαίδευση πρακτόρων τεχνητής νοημοσύνης επωφελείται από τους άπειρους κόσμους που δημιουργούνται. Το Algoritmos λαμβάνει ποικίλα δεδομένα για να μάθει πλοήγηση σε άγνωστα περιβάλλοντα. Το Isso συμβάλλει στην πρόοδο στη ρομποτική και στα αυτόνομα συστήματα.
Τομείς όπως η αρχιτεκτονική και η εσωτερική διακόσμηση εξερευνούν επίσης το εργαλείο για προκαταρκτικές απεικονίσεις. Clientes πλοηγηθείτε σε προτάσεις χώρου πριν από τη φυσική κατασκευή. Η διαδραστικότητα διευκολύνει τις προσαρμογές σε πραγματικό χρόνο κατά τη διάρκεια των παρουσιάσεων.
Περιορισμοί που παρατηρήθηκαν στο πρωτότυπο
Η τρέχουσα πρόσβαση περιορίζεται στους συνδρομητές του προγράμματος Google AI Ultra σε Estados Unidos. Οι Usuários από άλλες περιοχές αναμένουν σταδιακή επέκταση διάθεσης. Maiores 18 ετών με ενεργή συνδρομή έχει δικαίωμα συμμετοχής.
Οι συνεδρίες έχουν περιορισμένη διάρκεια για να διατηρηθεί η οπτική ποιότητα και συνέπεια. Το Ambientes με πολλούς διαδραστικούς πράκτορες εξακολουθεί να αντιμετωπίζει τεχνικούς περιορισμούς. Η εστίαση παραμένει στις εμπειρίες ενός παίκτη.
Η ακριβής αναπαραγωγή του ευανάγνωστου κειμένου εξαρτάται από τις ρητές προδιαγραφές στο μήνυμα. Τα πραγματικά δεδομένα Locais από τον φυσικό κόσμο ποικίλλουν σε πιστότητα ανάλογα με τα δεδομένα προπόνησης που χρησιμοποιούνται.
Διαθέσιμες δυνατότητες προσαρμογής
Οι χρήστες ορίζουν την προοπτική της κάμερας στην αρχή της δημιουργίας και μπορούν να την αλλάξουν κατά την εξερεύνηση. Το Modo σε πρώτο πρόσωπο αυξάνει την αίσθηση της ολικής βύθισης. Το Visão σε τρίτο πρόσωπο διευκολύνει την επισκόπηση μεγάλων περιοχών.
Οι χαρακτήρες λαμβάνουν λεπτομερείς προσαρμογές μέσω γραπτών μηνυμάτων. Το Opções περιλαμβάνει οχήματα, ζώα ή ανθρώπινες μορφές με συγκεκριμένα χαρακτηριστικά. Το Movimentos προσαρμόζεται αυτόματα στον επιλεγμένο τύπο.
Το Element Remix σάς επιτρέπει να συνδυάσετε μέρη προηγούμενων κόσμων σε νέες δημιουργίες. Usuários επιλέξτε αγαπημένα στοιχεία για γρήγορη ενσωμάτωση. Το Isso επιταχύνει τις διαδοχικές επαναλήψεις σχεδίασης.
Η εξαγωγή των βίντεο που έχουν εγγραφεί κατά την περιήγηση είναι διαθέσιμη για κοινή χρήση. Το Demonstrations βοηθά στη συλλογή σχολίων ή επαγγελματικών παρουσιάσεων. Η λειτουργία καταγράφει πλήρεις συνεδρίες με υψηλή ποιότητα.
- Μεταβαλλόμενες κλιματικές συνθήκες.
- Προσθήκη συγκεκριμένων αντικειμένων.
- Προσαρμογή παγκόσμιας κλίμακας.
- Συνδυασμός πολλαπλών οπτικών στυλ.
Απαιτήσεις και διαδικασία πρόσβασης
Το εργαλείο ενσωματώνεται απευθείας στο περιβάλλον Google Labs. Πιστοποιημένη πρόσβαση Assinantes μέσω τυπικού προγράμματος περιήγησης με σταθερή σύνδεση στο διαδίκτυο. Não υπάρχει απαίτηση για εξειδικευμένο υλικό εκτός από τα βασικά.
Η διάθεση ξεκίνησε τον Ιανουάριο του 2026 για χρήστες στο Estados Unidos. Οι οδηγοί Instruções βοηθούν στην πρώτη δημιουργία του κόσμου. Το Participantes παρέχει σχόλια που κατευθύνουν μελλοντικές ενημερώσεις.
Η Google σχεδιάζει σταδιακές επεκτάσεις σε άλλες περιοχές και σχέδια συνδρομής. Η συλλογή δεδομένων χρήσης συμβάλλει σε τεχνικές βελτιώσεις. Το Project Genie ενοποιεί τις προόδους σε παραγωγικά παγκόσμια μοντέλα προσβάσιμα σε επιλεγμένα κοινά.