Νευρωνικά δίκτυα ΑΙ μιμούνται τον ανθρώπινο εγκέφαλο ακόμα και χωρίς εκπαίδευση

Συστήματα ΑΙ των οποίων ο σχεδιασμός μιμείται την αρχιτεκτονική του ανθρώπινου εγκεφάλου διαπρέπουν στην αναγνώριση εικόνων πριν καν εκπαιδευτούν με νέα δεδομένα, αναφέρουν ερευνητές του Πανεπιστημίου «Τζονς Χόπκινς».
Η μελέτη που δημοσιεύεται στο Nature Machine Intelligence θέτει υπό αμφισβήτηση την ισχύουσα προσέγγιση στον σχεδιασμό συστημάτων τεχνητής νοημοσύνης, καθώς δίνει προτεραιότητα στην αρχιτεκτονική του συστήματος έναντι της διαδικασίας εκπαίδευσης -μια διαδικασία που διαρκεί μήνες, καταναλώνει τεράστιες ποσότητες ενέργειας και κοστίζει εκατοντάδες εκατομμύρια δολάρια.
«Αυτό που κάνει σήμερα ο κλάδος τεχνητής νοημοσύνης είναι να ρίχνει τεράστιες ποσότητες δεδομένων στα μοντέλα και να χτίζει υπολογιστικούς πόρους με την κατανάλωση μιας μικρής πόλης. Την ίδια στιγμή, όμως, οι άνθρωποι μαθαίνουν να βλέπουν χρησιμοποιώντας ελάχιστα δεδομένα», δήλωσε ο Μικ Μπόνερ, επίκουρος καθηγητής γνωσιακής επιστήμης και πρώτος συγγραφέας της μελέτης.
«Η εξέλιξη ίσως είχε λόγο να καταλήξει σε αυτόν τον σχεδιασμό. Η μελέτη μας υποδηλώνει ότι οι αρχιτεκτονικοί σχεδιασμοί που μοιάζουν περισσότερο με τον ανθρώπινο εγκέφαλο προσφέρουν στα συστήματα ΑΙ ένα πολύ σημείο εκκίνησης» πρόσθεσε.
Τρία είδη δικτύων
Ο Μπόνερ και οι συνεργάτες του εξέτασαν τρία είδη νευρωνικών δικτύων που χρησιμοποιούνται συχνά σε συστήματα ΑΙ: τους μετασχηματιστές (που χρησιμοποιούνται στα μεγάλα γλωσσικά μοντέλα), τα πλήρως συνδεδεμένα δίκτυα και τα συνελικτικά νευρωνικά δίκτυα.
Οι ερευνητές τροποποίησαν τα τρία σχέδια και δημιούργησαν δεκάδες νέα νευρωνικά δίκτυα, τα οποία στη συνέχεια κλήθηκαν να ερμηνεύσουν εικόνες αντικειμένων, ανθρώπων και ζώων. Οι αποκρίσεις των μοντέλων συγκρίθηκαν με τα μοτίβα εγκεφαλικής δραστηριότητας ανθρώπων και πιθήκων που εκτέθηκαν στις ίδιες εικόνες.
Στην περίπτωση των μετασχηματιστών και των πλήρως συνδεδεμένων δικτύων δεν καταγράφηκαν σημαντικές αλλαγές. Αντίθετα, η τροποποίηση των συνελικτικών δικτύων οδήγησε στη δημιουργία νευρωνικών δικτύων που προσομοιώνουν καλύτερα τη δραστηριότητα του ανθρώπινου εγκεφάλου.
Τα μη εκπαιδευμένα συνελικτικά συστήματα παρουσίασαν μάλιστα παρόμοιες επιδόσεις με συμβατικά συστήματα ΑΙ που έχουν εκπαιδευτεί με δισεκατομμύρια εικόνες.
Και αυτό οδηγεί στο συμπέρασμα ότι η αρχιτεκτονική του συστήματος παίζει μεγαλύτερο ρόλο από ό,τι φαντάζονταν πολλοί ειδικοί της ΑΙ, οι οποίοι πιστεύουν ότι ο όγκος των δεδομένων της εκπαίδευσης παίζει μεγαλύτερη σημασία από την αρχιτεκτονική του μοντέλου.
«Αν η εκπαίδευση σε τεράστιους όγκους δεδομένων είναι πράγματι ο καθοριστικός παράγοντας, τότε δεν θα έπρεπε να υπάρχει κανένας τρόπος να φτάσουμε σε συστήματα ΑΙ που μοιάζουν με τον εγκέφαλο μόνο μέσω αρχιτεκτονικών τροποποιήσεων» είπε ο Μπόνερ.
«Αυτό σημαίνει ότι, ξεκινώντας με το σωστό σχέδιο μπορεί να καταφέρουμε να επιταχύνουμε θεαματικά τη μάθηση στα συστήματα ΑΙ» επισήμανε.
Η ερευνητική ομάδα εργάζεται τώρα για την ανάπτυξη απλών αλγορίθμων μάθησης που αντλούν έμπνευση από τη βιολογία, οι οποίοι θα μπορούσαν να αποτελέσουν τη βάση για ένα νέο πλαίσιο βαθιάς μηχανικής μάθησης.