Την Τρίτη, το OpenAI κυκλοφόρησε το ChatGPT Images 2.0, μια ενημέρωση για το μοντέλο δημιουργίας εικόνας που είναι ενσωματωμένο στο chatbot. Το σύστημα, που ονομάζεται gpt-image-2, φέρνει βελτιώσεις στην απόδοση κειμένου, υποστήριξη για πολλές γλώσσες και τη δυνατότητα δημιουργίας πιο περίπλοκων συνθέσεων. Το Usuários όλων των προγραμμάτων ChatGPT έχει πλέον πρόσβαση στην τυπική έκδοση.
Η κυκλοφορία πραγματοποιήθηκε στις 21 Απριλίου 2026. Η εταιρεία τόνισε τη συμπερίληψη μιας λειτουργίας “σκέψης” που επιτρέπει στο μοντέλο να κάνει αναζήτηση στον ιστό, να ελέγχει λεπτομέρειες και να δημιουργεί έως και οκτώ εικόνες από ένα μόνο μήνυμα. Το Isso διευκολύνει την παραγωγή storyboards, infographics και υλικών με δομημένη διάταξη. Η ανάλυση φτάνει τα 2K σε ορισμένες περιπτώσεις.
Το OpenAI υπογραμμίζει τη λογική και την πιστότητα στα νέα χαρακτηριστικά
Το μοντέλο ακολουθεί πλέον με μεγαλύτερη ακρίβεια τις οδηγίες και διατηρεί τα ζητούμενα στοιχεία όπως εικονίδια, διεπαφές και μικρό κείμενο. Το OpenAI ανέφερε παραδείγματα επιστημονικών αφισών, καρτών συνταγών και διαφανειών παρουσίασης ως τομείς κέρδους. Η υποστήριξη για κείμενα Ιαπωνικά, Κορεατικά, Χίντι και Μπενγκάλι έχει επίσης βελτιωθεί.
Το Desenvolvedores αποκτά πρόσβαση μέσω API, με τιμές που βασίζονται στην ποιότητα και την ανάλυση. Το Usuários επί πληρωμή έχει μεγαλύτερη χωρητικότητα σε προηγμένη λειτουργία. Η ενημέρωση έρχεται μήνες μετά από προηγούμενες βελτιώσεις στο σύστημα απεικόνισης.
- Geração πολλαπλών αλληλένδετων εικόνων
- Modo σκέψη με αναζήτηση στο διαδίκτυο
- Melhor απόδοση κειμένου σε πολλές γλώσσες
- Suporte σε ποικίλες αναλογίες, από 3:1 έως 1:3
- Resolução έως 2K σε επιλεγμένες εξόδους
https://twitter.com/OpenAI/status/2046670978890276918?ref_src=twsrc%5Etfw
Το Crítico επισημαίνει ελαττώματα στη λειτουργική κατανόηση
Ο Gary Marcus, ένας ερευνητής γνωστός για την αμφισβήτηση των τρεχουσών δυνατοτήτων τεχνητής νοημοσύνης, δοκίμασε το νέο σύστημα με διαγράμματα ποδηλάτων. Σε μια αυτόματη ετικέτα, το μοντέλο μπέρδεψε το πίσω φρένο με το σωλήνα καθίσματος και το γρανάζι με το φρένο. Μια ετικέτα δείχνει στον κενό χώρο.
Σε ένα πιο δύσκολο τεστ, το Marcus ζήτησε ένα διπλό ποδήλατο ψηλότερο από το μέσο όρο, με σχάρα αποσκευών και σακούλες. Η εικόνα που δημιουργήθηκε παρουσίαζε προβλήματα όπως ένα πίσω ντεραγιέ που μπήκε στον τροχό, μια κακώς τοποθετημένη μανέτα του φρένου και ένα πίσω τιμόνι σε σχήμα σέλας. Ο Marcus παρατήρησε ότι το σύστημα ταιριάζει με οπτικά μοτίβα χωρίς να κατανοεί την πραγματική λειτουργία των εξαρτημάτων.
Especialistas σύγκριση με τους ανθρώπινους περιορισμούς
Ο Marcus αναγνώρισε ότι ο μέσος άνθρωπος θα είχε επίσης δυσκολία να σχεδιάσει με ακρίβεια τη σειρά. Ωστόσο, οι μηχανικοί, οι έμπειροι ποδηλάτες ή οι σχεδιαστές θα εντόπιζαν γρήγορα τα λάθη. Το παράδειγμα χρησιμεύει για να συζητηθεί ο βαθμός στον οποίο το μοντέλο κατανοεί τον φυσικό κόσμο.
Η συζήτηση λαμβάνει χώρα καθώς ο κλάδος γιορτάζει τα άλματα στην επαγγελματική απεικόνιση. Το ανεξάρτητο Testes επιβεβαίωσε κέρδη σε ευανάγνωστο κείμενο και πυκνές διατάξεις, αλλά συγκεκριμένες περιπτώσεις εξακολουθούν να εκθέτουν κενά στην αιτιώδη συλλογιστική.
Ficha ChatGPT Τεχνική Images 2.0
- Βάση Modelo: gpt-image-2
- Disponibilidade: όλοι οι χρήστες ChatGPT
- Modo Advanced: Συνδρομητές επί πληρωμή
- Recursos κύριο: συλλογισμός, πολλαπλές εξόδους, πολύγλωσσο κείμενο
- Resolução: έως 2K
- API: κυκλοφορεί με μεταβλητή τιμολόγηση
Το OpenAI δεν έχει σχολιάσει δημόσια τη δοκιμή Marcus αυτή τη στιγμή. Το σύστημα συνεχίζει να εξελίσσεται, με τακτικές ενημερώσεις που βασίζονται στα σχόλια των χρηστών.

