Η νέα εποχή της ΤΝ: World Models με προοπτικές 100 τρισ. δολαρίων

Παρασκευή, 00:01 - 03/10/2025

Οι ηγέτιδες εταιρείες στον χώρο της τεχνητής νοημοσύνης στρέφουν ολοένα και περισσότερο το ενδιαφέρον τους στα λεγόμενα world models – μοντέλα που επιχειρούν να κατανοήσουν και να αλληλεπιδράσουν με τον πραγματικό κόσμο. Πρόκειται για την επόμενη φάση στην πορεία προς την ανάπτυξη συστημάτων που θα πλησιάζουν τα χαρακτηριστικά μιας «υπερνοημοσύνης».

Η Google DeepMind, η Meta και η Nvidia βρίσκονται στην πρώτη γραμμή αυτής της τεχνολογικής μετάβασης, δουλεύοντας σε αλγορίθμους που μαθαίνουν όχι μόνο από δεδομένα κειμένου, αλλά από βίντεο και πειράματα ρομποτικής. Αυτή η στροφή συμβαίνει σε μια στιγμή που τα μεγάλα γλωσσικά μοντέλα (LLMs), όπως το ChatGPT της OpenAI, δείχνουν να φτάνουν σε σημείο κορεσμού, με τις βελτιώσεις στις νέες εκδόσεις τους να μειώνονται σε σχέση με τα προηγούμενα χρόνια, παρά τις τεράστιες επενδύσεις.

Σύμφωνα με τον Rev Lebaredian, αντιπρόεδρο της Nvidia για το Omniverse, η αγορά των world models έχει τη δυνατότητα να αγγίξει τα 100 τρισ. δολάρια, εφόσον αυτά τα συστήματα καταφέρουν να κατανοήσουν και να δρουν αποτελεσματικά σε πραγματικά περιβάλλοντα, από τη βιομηχανία έως την υγεία.

Τα μοντέλα αυτά εκπαιδεύονται με τεράστιες ροές δεδομένων από φυσικά και προσομοιωμένα περιβάλλοντα. Μπορούν να αποτελέσουν το κλειδί για πρόοδο σε τομείς όπως τα αυτόνομα οχήματα, η ρομποτική και οι «ψηφιακοί πράκτορες» (AI agents). Ωστόσο, η ανάπτυξή τους απαιτεί πρωτοφανή υπολογιστική ισχύ και τεράστιο όγκο δεδομένων, κάτι που τα καθιστά ακόμη τεχνικά δύσκολα υλοποιήσιμα.

Η Google DeepMind παρουσίασε πρόσφατα το Genie 3, ένα μοντέλο βιντεοπαραγωγής που δημιουργεί εικόνα-προς-εικόνα, λαμβάνοντας υπόψη το ιστορικό αλληλεπιδράσεων, προσφέροντας έτσι πιο ρεαλιστική εξέλιξη των σκηνών. Η Meta, μέσω του εργαστηρίου FAIR και υπό την καθοδήγηση του Yann LeCun, αναπτύσσει τα V-JEPA models, εμπνευσμένα από τον τρόπο με τον οποίο τα παιδιά μαθαίνουν παρατηρώντας τον κόσμο γύρω τους. Ο LeCun, που θεωρείται από τις κορυφαίες φυσιογνωμίες της ΤΝ, προειδοποιεί ότι τα LLMs δεν μπορούν να φτάσουν σε πραγματικές ικανότητες λογικής και σχεδιασμού.

Παράλληλα, ο Μαρκ Ζάκερμπεργκ ενισχύει τις επενδύσεις της Meta σε νέες ερευνητικές ομάδες και προσέλαβε τον Alexandr Wang, ιδρυτή της Scale AI, για να ηγηθεί της στρατηγικής στον τομέα της ΤΝ.

Πέρα από την έρευνα, υπάρχουν και άμεσες εμπορικές εφαρμογές. Η World Labs της Fei-Fei Li εργάζεται πάνω σε μοντέλα που δημιουργούν τρισδιάστατα περιβάλλοντα από μία εικόνα, ενώ η Runway έχει ήδη παρουσιάσει προϊόντα που δημιουργούν σκηνικά βιντεοπαιχνιδιών και ιστορίες σε πραγματικό χρόνο για στούντιο του Χόλιγουντ.

Η συλλογή δεδομένων είναι κρίσιμη. Η Niantic, γνωστή από το Pokémon Go, έχει χαρτογραφήσει πάνω από 10 εκατομμύρια τοποθεσίες, χρησιμοποιώντας εκατομμύρια παίκτες για να εμπλουτίσει την ανάπτυξη world models. Από την πλευρά της, η Nvidia αξιοποιεί την πλατφόρμα Omniverse για να δημιουργεί προσομοιώσεις που προσεγγίζουν τον πραγματικό κόσμο, με τον Jensen Huang να υπογραμμίζει ότι η «φυσική ΤΝ» θα είναι η επόμενη μεγάλη κινητήρια δύναμη της εταιρείας.

Αν και πολλοί επιστήμονες, όπως ο LeCun, θεωρούν ότι μπορεί να χρειαστούν ακόμη και δέκα χρόνια για να φτάσουν αυτά τα συστήματα στο επίπεδο ανθρώπινης ευφυΐας, η δυναμική που δημιουργείται είναι τεράστια. Όπως σημειώνει ο Lebaredian, τα world models μπορούν να αλλάξουν ριζικά όχι μόνο την ΤΝ, αλλά και ολόκληρους κλάδους της οικονομίας, όπως ακριβώς οι υπολογιστές μεταμόρφωσαν τη διανοητική εργασία τον 20ό αιώνα.

Greek Finance Forum Team

Σχόλια Αναγνωστών

Αποποίηση Ευθύνης....