|
Σύμφωνα
με τον Rev Lebaredian,
αντιπρόεδρο της Nvidia
για το Omniverse, η
αγορά των world models
έχει τη δυνατότητα να
αγγίξει τα
100 τρισ. δολάρια,
εφόσον αυτά τα συστήματα
καταφέρουν να
κατανοήσουν και να δρουν
αποτελεσματικά σε
πραγματικά περιβάλλοντα,
από τη βιομηχανία έως
την υγεία.
Τα
μοντέλα αυτά
εκπαιδεύονται με
τεράστιες ροές δεδομένων
από φυσικά και
προσομοιωμένα
περιβάλλοντα. Μπορούν να
αποτελέσουν το κλειδί
για πρόοδο σε τομείς
όπως τα αυτόνομα
οχήματα, η ρομποτική και
οι «ψηφιακοί πράκτορες»
(AI agents). Ωστόσο, η
ανάπτυξή τους απαιτεί
πρωτοφανή υπολογιστική
ισχύ και τεράστιο όγκο
δεδομένων, κάτι που τα
καθιστά ακόμη τεχνικά
δύσκολα υλοποιήσιμα.
Η Google
DeepMind παρουσίασε
πρόσφατα το
Genie 3, ένα
μοντέλο βιντεοπαραγωγής
που δημιουργεί
εικόνα-προς-εικόνα,
λαμβάνοντας υπόψη το
ιστορικό
αλληλεπιδράσεων,
προσφέροντας έτσι πιο
ρεαλιστική εξέλιξη των
σκηνών. Η Meta, μέσω του
εργαστηρίου FAIR και υπό
την καθοδήγηση του Yann
LeCun, αναπτύσσει τα
V-JEPA models,
εμπνευσμένα από τον
τρόπο με τον οποίο τα
παιδιά μαθαίνουν
παρατηρώντας τον κόσμο
γύρω τους. Ο LeCun, που
θεωρείται από τις
κορυφαίες φυσιογνωμίες
της ΤΝ, προειδοποιεί ότι
τα LLMs δεν μπορούν να
φτάσουν σε πραγματικές
ικανότητες λογικής και
σχεδιασμού.
Παράλληλα, ο Μαρκ
Ζάκερμπεργκ ενισχύει τις
επενδύσεις της Meta σε
νέες ερευνητικές ομάδες
και προσέλαβε τον
Alexandr Wang, ιδρυτή
της Scale AI, για να
ηγηθεί της στρατηγικής
στον τομέα της ΤΝ.
Πέρα από
την έρευνα, υπάρχουν και
άμεσες εμπορικές
εφαρμογές. Η
World Labs της
Fei-Fei Li εργάζεται
πάνω σε μοντέλα που
δημιουργούν τρισδιάστατα
περιβάλλοντα από μία
εικόνα, ενώ η
Runway έχει ήδη
παρουσιάσει προϊόντα που
δημιουργούν σκηνικά
βιντεοπαιχνιδιών και
ιστορίες σε πραγματικό
χρόνο για στούντιο του
Χόλιγουντ.
Η
συλλογή δεδομένων είναι
κρίσιμη. Η
Niantic, γνωστή
από το Pokémon Go, έχει
χαρτογραφήσει πάνω από
10 εκατομμύρια
τοποθεσίες,
χρησιμοποιώντας
εκατομμύρια παίκτες για
να εμπλουτίσει την
ανάπτυξη world models.
Από την πλευρά της, η
Nvidia
αξιοποιεί την πλατφόρμα
Omniverse για
να δημιουργεί
προσομοιώσεις που
προσεγγίζουν τον
πραγματικό κόσμο, με τον
Jensen Huang να
υπογραμμίζει ότι η
«φυσική ΤΝ» θα είναι η
επόμενη μεγάλη κινητήρια
δύναμη της εταιρείας.
Αν και
πολλοί επιστήμονες, όπως
ο LeCun, θεωρούν ότι
μπορεί να χρειαστούν
ακόμη και δέκα χρόνια
για να φτάσουν αυτά τα
συστήματα στο επίπεδο
ανθρώπινης ευφυΐας, η
δυναμική που
δημιουργείται είναι
τεράστια. Όπως σημειώνει
ο Lebaredian, τα world
models μπορούν να
αλλάξουν ριζικά όχι μόνο
την ΤΝ, αλλά και
ολόκληρους κλάδους της
οικονομίας, όπως ακριβώς
οι υπολογιστές
μεταμόρφωσαν τη
διανοητική εργασία τον
20ό αιώνα.
|