Τεχνική επεξήγηση της όρασης μέσω τεχνητής νοημοσύνης στα αυτόνομα drones

Αδιαμφισβήτητα μια ταινία επιστημονικής φαντασίας που έχει διακρατήσει την επιστημονική αξία της ως ακόμη και σήμερα είναι το Terminator II: Judgement Day. Ειδικότερα σήμερα είναι γενικότερα γνωστό ότι το ρομπότ που τότε προστάτευε τον Τζων Κόννορ χρησιμοποιούσε την επιστήμη της τεχνητής νοημοσύνης για να υποστηρίξει την κατανόηση, τις αποφάσεις και τις δράσεις του. Για παράδειγμα σε αρκετές στιγμές της ταινίας βλέπουμε με μάτια του ρομπότ τα αποτελέσματα των μαθηματικών πράξεων του νευρωνικού δικτύου του σχετικά με την αναγνώριση προσώπων και αντικειμένων.

Γράφει ο Δρ Θεόδωρος Γ. Κωστής

Εικόνα 1. Με τα μάτια του Terminator Model 101 της Cyberdyne Systems

Επιπροσθέτως η ταινία του Terminator ΙΙ έδινε μεγάλη σημασία σε ένα ειδικό τύπο επεξεργαστή που χρησιμοποιούσε νευρωνικά δίκτυα (Neural Net CPU) για να επιτύχει «αυτογνωσία ή self-awareness» σε οποιοδήποτε περιβάλλον δηλαδή, όπως θα δούμε παρακάτω σε αυτό το άρθρο, την πιο προηγμένη μορφή της τεχνητής νοημοσύνης.

Συνήθως μια γρήγορη αναζήτηση στο διαδίκτυο για νευρωνικά δίκτυα δίνει μια αίσθηση όπως στην Εικόνα 2 που ή επιεικώς αποθαρρύνει μια περαιτέρω ανάγνωση χωρίς τη βοήθεια κάποιου καθηγητή σε αυτόν τον τομέα ή προετοιμάζει για πολλές ώρες εντατικής ιδιωτικής μελέτης.

Εικόνα 2. Μια αναπαράσταση ενός γενικού νευρωνικού δικτύου

Όμως ας προσπαθήσουμε σε αυτό το κείμενο να εξηγήσουμε τα βασικά στοιχεία των παραπάνω νευρωνικών δικτύων έτσι ώστε κάθε περαιτέρω ενασχόληση με αυτό τον τομέα να είναι αρκετά πιο βατή.

1.1: Νευρώνες και Νευρωνικά Δίκτυα

Ένας νευρώνας (neuron) είναι στην ουσία ένας αλγόριθμος (ή ένα σύστημα) που δέχεται μια είσοδο και την πολλαπλασιάζει με μια παράμετρο που ονομάζεται βάρος (weight), όπως φαίνεται στην Εικόνα 3. Έπειτα χρησιμοποιεί μια συνάρτηση, που στην σχετική ορολογία ονομάζεται activation function (συνάρτηση ενεργοποίησης) όπως η Rectified Linear Unit (ReLU), για να περιορίζει τις τιμές που υπολογίζει σε κάποιο προκαθορισμένο αριθμητικό διάστημα.

Με την έννοια του περιορισμού νοείται για παράδειγμα η τοποθέτηση των τιμών της εξόδου που είναι μεγαλύτερες από το 1 ως ένα και οι τιμές που είναι μικρότερες από το 0 να γίνονται μηδέν. Στην ουσία ο περιορισμός είναι το ανάλογο ενός απλού ανορθωτή στα ηλεκτρονικά που αφήνει μόνο τις θετικές τιμές της τάσης να περάσουν αλλά μηδενίζει όλες τις αρνητικές ή του διπλού ανορθωτή που τώρα περιορίζει τις τιμές του πολλαπλασιασμού μεταξύ της εισόδου και του βάρους στο διάστημα -1 ως +1.

Εικόνα 3. Ένας νευρώνας.

Τώρα σε ένα νευρωνικό δίκτυο χρησιμοποιούνται πολλοί νευρώνες για να επιτελέσουν μια εργασία, όπως για παράδειγμα την αναγνώριση εικόνων από ένα αισθητήρα, όπως φαίνεται στην Εικόνα 4. Αναλυτικότερα για κάθε είσοδο του νευρωνικού συστήματος χρησιμοποιούνται και οι αντίστοιχοι νευρώνες που στο τέλος προστίθενται για να δώσουν μια ένδειξη κατηγοριοποίησης της εισόδου.

Επεξηγώντας καλύτερα την Εικόνα 2 βλέπουμε με την Εικόνα 4 ότι ένα γενικό νευρωνικό δίκτυο χωρίζεται σε τρία βασικά σημεία, την είσοδο, τις μονάδες επεξεργασίας που στην σχετική ορολογία ονομάζονται κρυμμένα επίπεδα (hidden layers) και την έξοδο. Άρα ένα νευρωνικό δίκτυο δεν διαφέρει από τον γενικότερο ορισμό του συστήματος, που έχει μια είσοδο, μια μονάδα επεξεργασίας ή αλλιώς συνάρτηση μεταφοράς (transfer function) και μια έξοδο. 

Συγκεκριμένα η Εικόνα 4 είναι ακόμη μια tabula rasa, μια άγραφη ταμπλέτα, που είναι έτοιμη να δεχθεί μια γνώση σχετικά με μια δράση μέσω της εμπειρίας και αντίληψης των νευρώνων. Αναλυτικά η προαναφερόμενη γνώση (εμπειρία και αντίληψη) είναι ο ορισμός των κατάλληλων τιμών στα βάρη από το w11 έως το wb4 που θα υποστηρίζουν την σωστή κατηγοριοποίηση της εισόδου.

Μετέπειτα, όπως θα δούμε αναλυτικότερα πιο κάτω, ορισμένοι είσοδοι θα πολλαπλασιαστούν με μια ορισμένη τιμή βάρους για να δώσουν το σωστό αποτέλεσμα της κατηγοριοποίησης του νευρωνικού δικτύου. 

Εικόνα 4. Ένα νευρωνικό δίκτυο χωρίς να έχει υποστεί εκπαίδευση, δηλαδή χωρίς να έχει εκπαιδευτεί να συντελεί κάποια ορισμένη εργασία, όπως αναγνώριση συγκεκριμένων αντικειμένων σε αντίστοιχες κατηγορίες. 

Δηλαδή η ιδιαιτερότητα του νευρωνικού δικτύου είναι στο ότι μπορεί να προσαρμόσει την συνάρτηση μεταφοράς του, δηλαδή τα hidden layers του, ανάλογα με την περίσταση που καλείται να επιλύσει έτσι ώστε η είσοδος, όσο παραλλαγμένη και να είναι, να αντιστοιχεί πάντα στην σωστή έξοδο. 

Με την παράλλαξη της εισόδου εννοούμε ότι όταν για παράδειγμα το νευρωνικό δίκτυο θα δέχεται ως είσοδο μια εικόνα από μια οποιαδήποτε πινακίδα STOP τότε στην έξοδο θα πρέπει να δίνει την σωστή απάντηση, δηλαδή ότι στην είσοδο του βλέπει κάτι που ανήκει στην κατηγορία του πινακίδας του STOP.

Εικόνα 5. Είσοδοι σε ένα νευρωνικό σύστημα. Το αντικείμενο είναι το ίδιο, μια πινακίδα STOP, αλλά οι αναπαραστάσεις του είναι παραλλαγμένες. (Φωτογραφίες από το MATLAB)

Αρχικά δίνονται σε όλα τα βάρη (weights) τυχαίες τιμές, άρα σε αυτό το στάδιο το νευρωνικό δίκτυο θα κάνει πολλά λάθη μιας και ο συνδυασμός των τιμών στα βάρη που επηρεάζουν το αποτέλεσμα της απόφασης του νευρωνικού δικτύου αποκλείεται στατιστικά να είναι τα σωστά. Άλλωστε στην Εικόνα 4 είδαμε ότι οι τιμές για τα βάρη του νευρωνικού δικτύου εμφανίζονταν με ερωτηματικό, επειδή ακριβώς δεν ήταν ακόμη κατάλληλα ορισμένες. Η πιθανότητα του ορισμού των βαρών με τυχαίο τρόπο την πρώτη φορά μαζί με την σωστή συμπεριφορά του νευρωνικού δικτύου είναι απειροελάχιστη ή καλύτερα μη υπαρκτή.

Δηλαδή αρχικά δίνοντας τυχαίες τιμές στα παραπάνω βάρη, εάν έχουμε σχεδιάσει το νευρωνικό δίκτυο να δέχεται ως είσοδο μια εικόνα από ένα αισθητήρα και να προσπαθεί στην έξοδο του να την κατηγοριοποιεί σε δύο κατηγορίες, πχ πινακίδα STOP ή πινακίδα απαγόρευσης στάθμευσης, τότε αρκετές φορές ενώ η είσοδος θα είναι πινακίδα STOP η έξοδος θα είναι πινακίδα απαγόρευσης στάθμευσης. Εδώ το σημαντικό σημείο είναι η μέτρηση αυτού του λάθους επειδή στο επόμενο στάδιο θα χρησιμοποιηθεί για την εκπαίδευση του νευρωνικού δικτύου, δηλαδή για την απομείωση αυτού του λάθους με αποτέλεσμα το νευρωνικό δίκτυο να δίνει πάντοτε σωστά αποτελέσματα.

Το παράλληλο παράδειγμα με οπλικά συστήματα είναι αν υποθέσουμε ότι ένα αυτόνομο drone βλέπει με τον αισθητήρα του μια εικόνα που αντιστοιχεί στην πραγματικότητα σε ένα οπλικό σύστημα, όπως ένα Phalanx, πάνω σε μια φρεγάτα. Όμως αυτή η εικόνα μπορεί να είναι παραλλαγμένη αφού η διόπτευση από το drone μπορεί να γίνει από πολλές πλευρές όπως επίσης μπορεί να υπάρχει κάποια και μικροδιαφορά στην εγκατάσταση του συστήματος πάνω στην υπερκατασκευή του πλοίου. Δηλαδή κάθε μια τέτοια διόπτευση σίγουρα θα διαφέρει σε μικρότερο ή μεγαλύτερο βαθμό από την άλλη, όμως όλες θα ανήκουν στον ίδιο αντικείμενο. Επιπροσθέτως κάθε μια τέτοια διόπτευση του αισθητήρα του drone θα δίνει κάποιο βαθμό λάθους ανάλογα με το πόσο αντιστοιχεί στο σχήμα ενός πραγματικού phalanx ή όχι. 

1.2: Εκπαίδευση Νευρωνικού Δικτύου

Τώρα ο κύριος σκοπός είναι να επιτευχτεί η μεγαλύτερη δυνατόν μείωση αυτού του λάθους, έτσι ώστε τα δεδομένα στην είσοδο να δημιουργούν πάντοτε την σωστή κατηγορία στην έξοδο του νευρωνικού δικτύου.

Αναλυτικά αυτή η διαδικασία της προσαρμογής των βαρών στα hidden layers του νευρωνικού δικτύου ονομάζεται εκπαίδευση (training). Δυστυχώς αυτή η εκπαίδευση είναι μια δύσκολη υπόθεση μιας και ο ορισμός των τιμών όλων των βαρών πρέπει να γίνεται ταυτόχρονα.

Εικόνα 6. Συνοπτική επεξήγηση ενός νευρωνικού δικτύου

Συγκεκριμένα η αυτή η εκπαίδευση μπορεί να γίνει με τρείς μεθόδους, πρώτον με την βοήθεια ενός ανθρώπινου παράγοντα που γνωρίζει την σωστή έξοδο για την αντίστοιχη είσοδο και άρα μπορεί να κωδικοποιήσει σωστά τα δεδομένα (labeled data), δεύτερον την αυτόματη εκπαίδευση του νευρωνικού δικτύου όπου το νευρωνικό δίκτυο ψάχνει να βρει  τους σωστούς συνδυασμούς στα δεδομένα έτσι ώστε να μπορέσει να αποφασίσει ποιά θα πρέπει να είναι η σωστή έξοδος και τρίτον με μια υποβοήθηση με ένα υποσύνολο από labeled data από ένα ανθρώπινο παράγοντα ενώ τα υπόλοιπα δεδομένα αφήνονται στο νευρωνικό δίκτυο για την  εύρεση των σωστών συνδυασμών των βαρών.

Ο συγκεκριμένος τρόπος που τον νευρωνικό δίκτυο προσπαθεί να απομειώσει το λάθος του πραγματοποιείται ενδεικτικά με μια μέθοδο που ονομάζεται stochastic gradient descent, όπως φαίνεται στην Εικόνα 7. Επεξηγηματικά αφού η τιμή του λάθους είναι γνωστή άρα με την αλλαγή των βαρών στους νευρώνες αλλάζει και η κλίση μεταξύ λάθους και βαρών. Όσο πιο χαμηλή είναι αυτή η κλίση τόσο λιγότερο γίνεται το λάθος. Πληροφοριακά ο όρος stochastic σημαίνει ότι στην αρχή δίνεται μια τυχαία τιμή στα βάρη και έπειτα υπολογίζεται το αρχικό λάθος όπου ξαναγυρνάει στο σύστημα για να γίνει η προσπάθεια απομείωσης του (εκπαίδευση του νευρωνικού δικτύου).

Εικόνα 7. Gradient Descent

Όμως πως ακριβώς συντελούνται οι διεργασίες που ονομάζονται «τεχνητή νοημοσύνη» για να μπορέσει ένα ρομπότ να αναγνωρίσει από μόνο του πρόσωπα όπως ένα αντίπαλο διοικητή, ήχους από προπέλες εχθρικών υποβρύχιων ή αντικείμενα πάνω σε υπερκατασκευές πλοίων του αντίπαλου στόλου? 

2.1: Convolutional Neural Networks για όραση σε αυτόνομα drones

Η τεχνική απάντηση είναι η χρησιμοποίηση των Convolutional Neural Networks (CNN), ή νευρωνικών δικτύων που φαινομενικά λόγω της ονομασίας τους χρησιμοποιούν την μαθηματική πράξη της συνέλιξης. Για την ακρίβεια ενώ τα CNN χρησιμοποιούν τον όρο convolutional, στην πραγματικότητα χρησιμοποιούν την πράξη της συσχέτισης (correlation) αντί της συνέλιξης (convolution). 

Με απλά λόγια η συνέλιξη χρησιμοποιεί ένα σήμα που συνήθως ονομάζεται κέρνελ ή πυρήνας (kernel) που το αναστρέφει στο χρόνο για να επέμβει πάνω σε ένα άλλο κύριο σήμα (είσοδος του οπτικού αισθητήρα). Με αυτό τον τρόπο τα δύο σήματα συμπίπτουν χωρικά, δηλαδή η αριστερή πλευρά του ενός σήματος συμπίπτει με την αριστερή του άλλου σήματος. Το αποτέλεσμα της συνέλιξης είναι ότι το kernel μπορεί να επέμβει και να αλλάξει συγκεκριμένα και επιλεγμένα σημεία του κυρίου σήματος. 

Τώρα μια σημαντική παρατήρηση είναι ότι όταν το kernel είναι συμμετρικό, δηλαδή όταν και μετά την αναστροφή του παραμένει το ίδιο, τότε η συνέλιξη (convolution) μετατρέπεται σε συσχέτιση (correlation). Όμως με αυτό τον τρόπο η επιρροή του kernel πάνω στο κύριο σήμα δείχνει τον βαθμό ομοιότητας των δύο σημάτων. Αναλυτικά το kernel ταξιδεύει πάνω από το κύριο σήμα επικαλύπτοντας όλο και περισσότερη επιφάνεια, καθώς παράλληλα υπολογίζει την ομοιότητα του με αυτή του κομματιού του κύριου σήματος.  Πληροφοριακά η ανίχνευση ενός στόχου στα ραντάρ χρησιμοποιεί ακριβώς αυτή την πράξη της συσχέτισης [Κωστής, Ραντάρ & Ηλεκτρονικός Πόλεμος, σελ 284, 2021].

Σε αυτό το σημείο ένα παράδειγμα μιας τέτοιας διεργασίας θα βοηθούσε καλύτερα στην κατανόηση όλης της διαδικασίας. Ας υποθέσουμε ότι προσπαθούμε να υπολογίσουμε εάν το κύριο σήμα που έρχεται από ένα οπτικό αισθητήρα πάνω σε ένα drone που έχει διαστάσεις 9×9 πίξελ είναι πλήρως άσπρο ή μαύρο, εάν περιέχει κάθετα τμήματα, εάν περιέχει διαγώνια τμήματα ή εάν περιέχει οριζόντια τμήματα. Ο λόγος που θέλουμε να κάνουμε αυτό τον υπολογισμό είναι επειδή αυτά είναι τα βασικά σχήματα που συνθέτουν πιο πολύπλοκες εικόνες, όπως στοιχεία πάνω σε υπερκατασκευές πλοίων. 

Δηλαδή ας υποθέσουμε ότι έχουμε προγραμματίσει αυτό το kamikazi drone να ψάχνει να βρει συστήματα Phalanx πάνω σε καταστρώματα πλοίων. Στον υπολογιστή του drone το νευρωνικό δίκτυο χωρίζει ένα μεγάλο πρόβλημα, όπως ολόκληρη την εικόνα ενός  Phalanx, σε πολλά μικρότερα προβλήματα που είναι κομμάτια αυτής της εικόνας, δηλαδή πλήρως άσπρα ή μαύρα σημεία, κάθετα τμήματα, διαγώνια τμήματα ή οριζόντια τμήματα. Μετά χρησιμοποιεί αυτά τα κομμάτια για συνθέσει την τελική εικόνα και από το αποτέλεσμα που βγάζει το νευρωνικό δίκτυο αποφασίζει εάν αυτό που βλέπει είναι ένα Phalanx ή κάτι άλλο. 

Συγκεκριμένα η αποσύνθεση της κύριας εικόνας ανατίθεται σε νευρώνες, ή με πιο απλή ορολογία εισόδους που επηρεάζονται από παραμέτρους που ονομάζονται «βάρη ή weights». Στο παράδειγμα μας το νευρωνικό δίκτυο αναλύει την κύρια εικόνα σε τέσσερις νευρώνες που για κάθε σημείο παίρνουν μια απόφαση για το πόσο μοιάζουν με εκείνο το σημείο της κύριας εικόνας. 

Εικόνα 8. Αισθητήρας συνδεδεμένος σε νευρωνικό δίκτυο χωρίς εκπαίδευση.

Οι είσοδοι του οπτικού αισθητήρα, προφανώς ανάλογα με την ευαισθησία του, μπορούν να ανιχνεύουν διαφορετικές αποχρώσεις του άσπρου και μαύρου, όπως φαίνεται στην Εικόνα 9.

Εικόνα 9. Παραλλαγές του άσπρου και του μαύρου

Σε αυτό το παράδειγμα ο αισθητήρας μπορεί και ανιχνεύει εννέα ασπρόμαυρες αποχρώσεις που αντιστοιχούν σε τιμές βολτ που με τη σειρά τους χρησιμοποιούνται ως είσοδοι στον νευρωνικό δίκτυο.

Τώρα οι τιμές που αντιστοιχούν σε μέρη της εικόνας του αισθητήρα συγκρίνονται για ομοιότητα (μέσω συσχέτισης) με ένα κέρνελ που έχουμε επιλέξει. Όμως για την απλοποίηση αυτού του παραδείγματος θα υποθέσουμε ότι οι τιμές που παίρνουν οι αισθητήρες είναι μόνο άσπρο (+1) ή μαύρο (-1).

Για αυτό το σκοπό, όπως φαίνεται στην Εικόνα 10, χρησιμοποιούμε ένα κέρνελ με πολύ μικρότερες διαστάσεις από αυτές του αισθητήρα, εδώ το κέρνελ είναι 2×2 για τις ανάγκες του παραδείγματος. Άρα όλες οι παραλλαγές των σχετικών κέρνελ θα είναι όπως εξής:

Εικόνα 10. Παραλλαγές κέρνελ για την ανίχνευση στοιχείων από ένα αισθητήρα

2.2: Εκπαίδευση CNN νευρωνικού δικτύου

Ως τώρα ασχοληθήκαμε με την προώθηση των δεδομένων μας στην επεξεργαστική μονάδα του νευρωνικού δικτύου και πήραμε μια έξοδο. Τώρα το θέμα είναι ότι θέλουμε να ελαχιστοποιήσουμε το λάθος στην έξοδο.

Για αυτό τον σκοπό χρησιμοποιούμε την έννοια της ανατροφοδότησης (feedback) που υλοποιείται μέσω μιας κατάλληλης συνάρτησης, όπως για παράδειγμα την προαναφερόμενη Stochastic Gradient Descent.

Εικόνα 11. Αναπαράσταση του νευρωνικού δικτυού μετά την εκπαίδευση. Τώρα τα βάρη έχουν τιμές που για μια συγκεκριμένη είσοδο (διαγώνια ή κάθετη γραμμή) δίνουν την σωστή έξοδο.
Εικόνα 12. Πλήρης ανάλυση των συνδέσεων του νευρωνικού δικτύου
Εικόνα 13. Συγκεκριμένη έξοδος του νευρωνικού δικτύου εάν η είσοδος είναι μια διαγώνιος. 

Μετά την πλήρη εκπαίδευση το νευρωνικό δίκτυο θα δίνει την σωστή απάντηση στην κατηγοριοποίηση της εισόδου.

Μέρος ΙΙΙ: Τεχνική κατηγοριοποίησης εικόνας από το νευρωνικό δίκτυο

Χρησιμοποιώντας το κέρνελ που ψάχνει για διαγώνιους από πάνω αριστερά προς κάτω δεξιά, το τελικό αποτέλεσμα που βγάζει το νευρωνικό δίκτυο εάν η είσοδος του αισθητήρα είναι πάλι μια τέτοια διαγώνιος είναι 100%. Σε αυτή την περίπτωση η ψηφοφορία του νευρωνικού δικτυού έδειξε ότι ο υπολογιστής βλέπει μια διαγώνιο από πάνω αριστερά ως κάτω δεξιά, όπως είναι και το σωστό, με πιθανότητα 100%.

Εικόνα 14. Αριθμητικό παράδειγμα εκπαιδευμένου δικτύου.

Όμως η διαγώνιος μπορεί να είναι περιστραμμένη ή εκτός ακριβούς θέσης λόγω της γωνίας διόπτευσης του οπτικού αισθητήρα του drone ή να μην είναι τόσο έντονα λευκή, αλλά να περιέχει πιο αχνα χρώματα όπως στην Εικόνα 9. Όμως σε κάθε τέτοια περίπτωση το νευρωνικό δίκτυο θα πρέπει να μπορεί να καταλαβαίνει ότι ακόμη και τέτοιες περιπτώσεις κατατάσσονται στην κατηγορία των αριστερά-πάνω δεξιά-κάτω διαγωνίων, απλά το αποτέλεσμα της ψηφοφορίας του θα είναι λιγότερο από το προηγούμενο τέλειο παράδειγμα του 100%. Συνοπτικά το βασικό σημείο είναι ότι το τελευταίο στάδιο της διαδικασίας είναι μια ψηφοφορία όπου η κατηγορία με τις περισσότερες ψήφους υπερισχύει.

4: Νευρωνικά δίκτυα με αυτογνωσία

Σε ένα υπολογιστικό σύστημα η συλλογή των δεδομένων γίνεται από τους αισθητήρες, για παράδειγμα τους οπτικούς, ηλεκτροπτικούς και ηλεκτρομαγνητικούς (ραντάρ). Το επόμενο στάδιο είναι η μετατροπή αυτών των δεδομένων σε πληροφορίες, δηλαδή η οργάνωση των δεδομένων σε μια μορφή που να επιτρέπει την επεξεργασία τους. Τελικώς ως νοημοσύνη ορίζεται η ικανότητα ενός συστήματος να μπορεί να επεξεργάζεται τις πληροφορίες και με αυτό τον τρόπο να μπορεί να δημιουργεί σχέσεις και αναλογίες που καταλήγουν στην λήψη αποφάσεων. Για παράδειγμα εάν το θερμόμετρο δείχνει θερμοκρασία 0 βαθμών Κελσίου (δεδομένα) τότε η πληροφορία είναι η μείωση της ασάφειας για τον καιρό, δηλαδή η κατηγοριοποίηση των δεδομένων στον κρύο καιρό. Περαιτέρω η νοημοσύνη είναι δυνατότητα λήψης απόφασης για την επιλογή του κατάλληλου ρουχισμού για την σωστή αντιμετώπιση του κρύου καιρού.

Στην σειρά των ταινιών Terminator τα ρομπότ είναι εξοπλισμένα με ένα επεξεργαστή που έχει αυτογνωσία (self-awareness). Με όρους τεχνητής νοημοσύνης αυτά τα ρομπότ έχουν φτάσει στο ανώτερο στάδιο της εκπαίδευσης του επεξεργαστή τους, αφού μπορούν και έχουν μια αναπαράσταση για τον εαυτό τους παράλληλα με μια αναπαράσταση για το περιβάλλον τους. Η σημερινή τεχνολογία δεν έχει φτάσει ακόμη σε αυτό το επίπεδο αφού η πιο πρόσφατη εξέλιξη είναι τα αυτοκίνητα με αυτόματο πιλότο που ανήκουν στην κατηγορία των μηχανών με περιορισμένη μνήμη (limited memory machines). Για την ιστορία η τεχνητή νοημοσύνη έκανε την πρώτη της εμφάνιση με μηχανές χωρίς μνήμη, όπως τον σκακιστικό υπολογιστή Deep Blue που είχε καταφέρει να νικήσει τον Κασπάροφ.

Άρα το T-101 έχει ένα επεξεργαστή που είναι δομημένος να αποθηκεύει και να επεξεργάζεται πληροφορίες με έμφαση στις μαθηματικές πράξεις και την αρχιτεκτονική μνήμης που υποστηρίζουν άμεσα την τεχνητή νοημοσύνη, όπως την πολύ γρήγορη συσχέτιση και παραγώγιση. Η ταινία αφιερώνει ένα μεγάλο μέρος της πλοκής για να εμπεδώσει στον θεατή ότι ο υπολογιστής που μια μέρα θα μπορεί να έχει εκπαιδευτεί σε μέγιστο βαθμό αναπαράστασης του περιβάλλοντος και του εαυτού του θα είναι πραγματικά ένα επαναστατικό σύστημα για τα σημερινά δεδομένα. Για την ακρίβεια θα είναι ένας ευφυής πράκτορας (intelligent agent), δηλαδή μια αυτόνομη οντότητα που θα αντιλαμβάνεται το περιβάλλον μέσω αισθητήρων και θα μπορεί να ενεργεί σε αυτό μέσω κατάλληλων υποδομών και δυνατοτήτων. Προφανώς θα είναι συνάμα και τέλειος στρατιώτης.

Συμπεράσματα

Ένα νευρωνικό δίκτυο είναι ένας υπολογιστής που χρησιμοποιεί ένα πρόγραμμα για τον σκοπό της κατηγοριοποίησης της εισόδου των αισθητήρων του. Αναλυτικά η είσοδος μπορεί να είναι μια παραλλαγμένη εικόνα ενός αντικειμένου, όμως το νευρωνικό σύστημα θα προσπαθήσει να κατηγοριοποιήσει ορθά αυτή την είσοδο. Το δυσκολότερο μέρος ενός νευρωνικού δικτύου είναι η ολική και σωστή εκπαίδευση του έτσι ώστε να μπορεί να αναγνωρίζει το αντικείμενο που ανιχνεύεται από τους αισθητήρες του σε όλες τις παραλλαγές του.

ΠΗΓΕΣ

Θεόδωρος Κωστής, 2021, Ραντάρ και Ηλεκτρονικός Πόλεμος, Τύπος Μέσου: έντυπο / ΒΙΒΛΙΟ, Έκδοση: 1η, Εκδοτικός Όμιλος Ίων, 683 σελ., ISBN: 978-960-508-323-6 Γλώσσες : Ελληνική (gre) Ημ/νία Παραχώρησης : 05/02/2021

Brandon Rohrer, How convolutional neural networks work, in depth, https://www.youtube.com/watch?v=JB8T_zN7ZC0

K. Amer, M. Samy, M. Shaker and M. ElHelw,  Deep Convolutional Neural Network-Based Autonomous Drone Navigation, Center for Informatics Science, Nile University, Giza, Egypt. 

https://arxiv.org/ftp/arxiv/papers/1905/1905.01657.pdf
https://www.ibm.com/cloud/learn/gradient-descent
https://uk.mathworks.com/help/deeplearning/ug/create-simple-deep-learning-network-for-classification.html
https://www.ibm.com/cloud/blog/supervised-vs-unsupervised-learning
https://ml4a.github.io/ml4a/how_neural_networks_are_trained/

The post Τεχνική επεξήγηση της όρασης μέσω τεχνητής νοημοσύνης στα αυτόνομα drones appeared first on Defence Review.

Άλλα τελευταία άρθρα Κατηγορίας