Το τμήμα Google DeepMind επισήμανε αυτήν την Πέμπτη (19) την άφιξη μιας νέας επανάληψης για την κύρια οικογένεια μοντέλων τεχνητής νοημοσύνης. Η ενημέρωση, που ονομάζεται Gemini 3.1 Pro, αναπτύχθηκε με προτεραιότητα στην επέκταση των σύνθετων δυνατοτήτων συλλογιστικής, υποσχόμενη να ξεπεράσει τους περιορισμούς των προηγούμενων εκδόσεων σε εργασίες που απαιτούν σύνθεση δεδομένων και προηγμένη λογική.
Το λανσάρισμα πραγματοποιείται σε μια στρατηγική στιγμή για τον τομέα της τεχνολογίας, όπου η παραγωγή απλού κειμένου δίνει τη θέση της στη ζήτηση για πράκτορες ικανούς να εκτελούν πλήρεις ροές εργασίας. Το νέο εργαλείο είναι πλέον διαθέσιμο σε φάση προεπισκόπησης για προγραμματιστές και συνδρομητές προηγμένων προγραμμάτων, εισάγοντας σημαντικές βελτιώσεις στην πολυτροπική επεξεργασία που κυμαίνεται από κωδικούς προγραμματισμού έως ερμηνεία βίντεο και ήχου.

Especialistas apontam que o diferencial desta versão reside na sua arquitetura otimizada para resolver problemas inéditos, afastando-se da dependência exclusiva de padrões memorizados durante o treinamento. A tecnologia foi desenhada para atender tanto usuários finais, através do aplicativo proprietário da empresa, quanto ambientes corporativos que necessitam de automação robusta via API.
Οι εσωτερικές δοκιμές επικύρωσης έδειξαν ότι το μοντέλο μπορεί να διατηρήσει τη συνοχή σε μακριές αλυσίδες σκέψης, ένα βασικό χαρακτηριστικό για την ανάπτυξη λειτουργικών αυτόνομων παραγόντων. Η άμεση διαθεσιμότητα στοχεύει στην επιτάχυνση της ενσωμάτωσης αυτών των δυνατοτήτων σε προϊόντα τρίτων και στις πλατφόρμες cloud της εταιρείας.
Άλμα απόδοσης σε λογικά τεστ
Η πιο σημαντική μέτρηση που παρουσιάστηκε κατά τη διάρκεια της ανακοίνωσης αναφέρεται στην απόδοση στο σημείο αναφοράς ARC-AGI-2, μια αυστηρή δοκιμή που έχει σχεδιαστεί για να αξιολογήσει την ικανότητα ενός AI να λύνει λογικά μοτίβα που δεν είχαν δει προηγουμένως. Το Gemini 3.1 Pro κατέγραψε βαθμολογία 77,1% από αυτή την άποψη, αποτέλεσμα που αντιπροσωπεύει υπερδιπλάσια απόδοση από τον προκάτοχό του, το
Εκτός από την εξέλιξη στην αφηρημένη λογική, το μοντέλο υποβλήθηκε σε άμεσες συγκριτικές αξιολογήσεις με άλλες τεχνολογίες αιχμής που διατίθενται στην αγορά. Στη δοκιμή γνωστή ως “Humanity’s Last Exam”, η νέα έκδοση πέτυχε 44,4% επιτυχία, ξεπερνώντας τις ανταγωνιστικές λύσεις που αναπτύχθηκαν από
Αυτή η συνέπεια στη λογική συλλογιστική επιτρέπει στο εργαλείο να εφαρμοστεί σε καταστάσεις όπου η απλή ανάκτηση πληροφοριών δεν είναι αρκετή. Το επίκεντρο της ενημέρωσης είναι να διασφαλίσει ότι το σύστημα μπορεί να πλοηγηθεί σε πολύπλευρα προβλήματα χωρίς να χάσει το πλαίσιο ή τις παραισθήσεις, αυξάνοντας τον πήχη της αξιοπιστίας για επαγγελματική και ακαδημαϊκή χρήση.
Αυτονομία στην πλοήγηση και τους εικονικούς πράκτορες
Η δυνατότητα λειτουργίας ως αυτόνομος πράκτορας έχει επεκταθεί σημαντικά σε αυτήν την ενημέρωση, με εντυπωσιακά αποτελέσματα σε δείκτες αναφοράς που προσομοιώνουν πραγματικές επαγγελματικές δραστηριότητες. Στη δοκιμή APEX-Agents, η οποία μετρά την αποτελεσματικότητα σε εργασίες μεγάλου ορίζοντα, το μοντέλο έφτασε το 33,5%, υποδεικνύοντας μια ανώτερη ικανότητα για τη διαχείριση στόχων που απαιτούν την ολοκλήρωση πολλών βημάτων.
Ένα άλλο χαρακτηριστικό ήταν η απόδοση στο BrowseComp, μια αξιολόγηση που επικεντρώθηκε στην αναζήτηση μέσω Διαδικτύου σε συνδυασμό με τη χρήση εργαλείων προγραμματισμού όπως το Python. Gemini 3.1 Το Pro πέτυχε 85,9% αποτελεσματικότητα, επιδεικνύοντας την ικανότητα αναζήτησης, φιλτραρίσματος και εξαγωγής σχετικών πληροφοριών από τον ιστό αυτόνομα, ενσωματώνοντας αυτά τα δεδομένα απευθείας στις ροές εργασίας.
Για να καταδείξει τις βελτιωμένες δυνατότητες του νέου συστήματος, η εταιρεία τόνισε τρεις βασικούς πυλώνες που υποστηρίζουν τη λειτουργία των πρακτόρων σε αυτήν την έκδοση:
- Ικανότητα διατήρησης της εστίασης σε σύνθετους στόχους κατά τη διάρκεια εκτεταμένων εκτελέσεων, χωρίς απόκλιση από τον σκοπό.
- Ομαλή ενοποίηση μεταξύ αναζήτησης ιστού και εκτέλεσης κώδικα για επικύρωση δεδομένων σε πραγματικό χρόνο.
- Προτεραιοποίηση των ροών εργασίας που απαιτούν τη συντονισμένη χρήση πολλαπλών ψηφιακών εργαλείων ταυτόχρονα.
Δημιουργία οπτικών συστημάτων και κωδικοποίηση
Η ευελιξία του μοντέλου επεκτείνεται στη σύνθεση πολύπλοκων οπτικών συστημάτων από απλές εντολές κειμένου. Durante τεχνικές επιδείξεις, η τεχνητή νοημοσύνη μπόρεσε να δημιουργήσει κινούμενα σχέδια σε μορφή SVG που είναι κλιμακούμενα και ελαφριά, προσφέροντας μια αποτελεσματική εναλλακτική λύση στις παραδοσιακές μορφές βίντεο για διεπαφές ιστού και εφαρμογές για κινητές συσκευές.
Ένα από τα πρακτικά παραδείγματα που παρουσιάζονται αφορούσε τη δημιουργία ενός πίνακα εργαλείων τηλεμετρίας σε πραγματικό χρόνο. Το μοντέλο επεξεργάστηκε δημόσια API και ακατέργαστα δεδομένα για να δημιουργήσει, από την αρχή, μια λειτουργική διεπαφή που απεικονίζει την τροχιά του Estação Espacial Internacional. Η διαδικασία περιλάμβανε τα πάντα, από την ερμηνεία των δεδομένων εισόδου έως την κωδικοποίηση της τελικής γραφικής διεπαφής.
Στον τομέα της δημιουργικής ερμηνείας, το σύστημα μετέτρεψε τις κλασικές λογοτεχνικές περιγραφές σε σύγχρονα ψηφιακά προϊόντα. Επεξεργάζοντας αποσπάσματα από το “The Morro of the Ventos Uivantes”, το AI αποτύπωσε την αφηγηματική ατμόσφαιρα του βιβλίου και σχεδίασε έναν σύγχρονο ιστότοπο χαρτοφυλακίου, μεταφράζοντας αφηρημένες και καλλιτεχνικές έννοιες σε εκτελέσιμο κώδικα και λειτουργικό σχεδιασμό.
Το εργαλείο επέδειξε επίσης ικανότητα στη δημιουργία διαδραστικών εμπειριών σε τρεις διαστάσεις. Ο Foi παρουσίασε μια προσομοίωση όπου ένα σμήνος εικονικών πουλιών ανταποκρίθηκε δυναμικά στην παρακολούθηση των χεριών του χρήστη, αποδεικνύοντας την ικανότητα του μοντέλου να ενσωματώνει την όραση υπολογιστή με πολύπλοκη λογική κινούμενης εικόνας.
Λεπτομέρειες σχετικά με την εταιρική πρόσβαση και ενσωμάτωση
Η διανομή του Gemini 3.1 Pro ακολουθεί ένα κλιμακωτό μοντέλο, δίνοντας προτεραιότητα σε προγραμματιστές και εταιρικούς πελάτες σε αυτό το πρώτο στάδιο. Η έκδοση είναι προσβάσιμη μέσω πλατφορμών όπως το AI Studio και το Vertex AI, επιτρέποντας στις εταιρείες να δοκιμάσουν την τεχνολογία στα δικά τους περιβάλλοντα και να προσαρμόσουν τα προϊόντα τους ώστε να χρησιμοποιούν τη νέα μηχανή συλλογιστικής.
Για μεμονωμένους χρήστες, απελευθερώθηκε η πρόσβαση στους συνδρομητές των προγραμμάτων Google AI Pro και Ultra, τα οποία έχουν αυξημένα όρια χρήσης. Το εργαλείο ενσωματώθηκε επίσης με το NotebookLM, ενισχύοντας τις λειτουργίες σύνθεσης εγγράφων και δημιουργίας πληροφοριών για χρήστες που πληρώνουν και χρησιμοποιούν την πλατφόρμα για έρευνα και μελέτες.
Ένα σχετικό τεχνικό σημείο είναι η συντήρηση του παραθύρου περιβάλλοντος 1 εκατομμυρίου token, ένα χαρακτηριστικό που κληρονομήθηκε από προηγούμενες γενιές της σειράς 3.