Thales + Friends

Τα ρομπότ μαθαίνουν να παίζουν ποδόσφαιρο

Αναρτήθηκε σε 7 Οκτωβρίου, 2024 κατηγορία: Ειδήσεις | Tags: , , , , ,

Συντάκτης: Γιώργος Καρουζάκης

Πώς παίζουν ποδόσφαιρο τα ρομπότ; Μπορούν να αποκτήσουν — ή έστω να μιμηθούν — τις ποδοσφαιρικές δεξιότητες του Μέσι και του Μπέκαμ; Η εξέλιξη στον κόσμο της ρομποτικής επιστρατεύει τη βαθιά ενισχυτική μάθηση (deep reinforcement learning) για να εκπαιδεύσει μια ομάδα ρομποτικών ποδοσφαιριστών, ώστε να αναπτύξουν ποδοσφαιρικές δεξιότητες, ευκινησία και στρατηγική. Στη συνέχεια, παίζουν ποδόσφαιρο μεταξύ τους και βελτιώνουν τις επιδόσεις τους, μιμούμενοι τη συμπεριφορά πραγματικών ποδοσφαιριστών.

Το ερευνητικό πρόγραμμα της εταιρείας DeepMind βασίζεται στη διαδικασία της δοκιμής και του λάθους. Τα ρομπότ μαθαίνουν τους κανόνες και τις λεπτομέρειες του παιχνιδιού, παρατηρώντας αρχικά ανθρώπινους παίκτες ποδοσφαίρου — γνώση που δοκιμάζουν παίζοντας ποδόσφαιρο μεταξύ τους, τόσο σε προσομοιώσεις όσο και σε φυσικό περιβάλλον. Η εκπαίδευσή τους στοχεύει στην ανάπτυξη ικανοτήτων που θα τους επιτρέψουν να επιλύουν περίπλοκα προβλήματα σε μη προβλέψιμα περιβάλλοντα — κάτι που ξεπερνά τα όρια του γηπέδου.

Τα ρομπότ εμφανίζουν τελικά πρωτόγνωρες δεξιότητες στο γήπεδο: την ικανότητα να σηκώνονται γρήγορα ύστερα από μία πτώση, να τρέχουν και να αμύνονται. Η μέθοδος που χρησιμοποιούν αρχικά οι ερευνητές της DeepMind περιλαμβάνει την εκπαίδευση των ρομπότ σε προσομοιώσεις, όπου αυτά παίζουν μεταξύ τους βελτιώνοντας τις επιδόσεις τους. «Τα ρομπότ τελειοποιούν τις ποδοσφαιρικές τους δεξιότητες σε αγώνες ένας προς έναν εναντίον αντιγράφων του εαυτού τους. Παίζουν πάντα εναντίον κάποιας προηγούμενης έκδοσης του εαυτού τους, γεγονός που σημαίνει ότι και οι αντίπαλοι μαθαίνουν και βελτιώνονται», λένε οι ερευνητές. Και προσθέτουν: «Για να βοηθήσουμε περαιτέρω τη λήψη αποφάσεων, η τεχνητή νοημοσύνη ενεργοποιεί ένα επιπλέον πρόγραμμα-κριτή που καθοδηγεί τα ρομπότ ύστερα από κάθε ενέργεια. Προσπαθεί να εκτιμήσει την πιθανότητα του ρομπότ να σκοράρει, προσφέροντάς του άμεση ανατροφοδότηση, λειτουργώντας ουσιαστικά σαν ένας προπονητής».

Η μεταφορά των δεξιοτήτων αυτών από την προσομοίωση στην πραγματικότητα είναι ιδιαίτερα εντυπωσιακή. Τα ρομπότ κινούνται και αντιδρούν με τρόπους που θυμίζουν ανθρώπινη συμπεριφορά: ισορροπούν ύστερα από ένα σουτ, στρίβουν με ακρίβεια, αμύνονται. Όλες αυτές οι δεξιότητες δεν είναι προγραμματισμένες εκ των προτέρων, αλλά βελτιώνονται μέσω της μάθησης.

Το επόμενο βήμα για τους ερευνητές είναι να κάνουν τα ρομπότ αυτά πιο αυτόνομα, εξοπλίζοντάς τα με αισθητήρες που θα τους επιτρέψουν να κινούνται και να αντιλαμβάνονται τον κόσμο χωρίς εξωτερική βοήθεια από συστήματα παρακολούθησης. Ο τελικός στόχος είναι να δημιουργήσουν ρομπότ γενικής χρήσης, τα οποία θα μπορούν να λειτουργούν και να συνεργάζονται με τους ανθρώπους σε διάφορες εργασίες, αξιοποιώντας τις δεξιότητες που έχουν ήδη αναπτύξει στο γήπεδο.

Περισσότερες πληροφορίες, εδώ

© Copyright 2001-2024 Θαλής + Φίλοι.

designed & developed by UNICORG EE