Thales + Friends

Τι είναι η μηχανική μάθηση;

Αναρτήθηκε σε 26 Ιουλίου, 2024 κατηγορία: Ειδήσεις | Tags: , , ,

Συντάκτης: Γιώργος Καρουζάκης

Photo by Mahdis Mousavi on Unsplash

Ο όρος «μηχανική μάθηση» εμφανίζεται όλο και πιο συχνά, σε διάφορα κείμενα, μπροστά μας. Αναφέρεται στον κλάδο της τεχνητής νοημοσύνης που ασχολείται με την ανάπτυξη αλγορίθμων και μοντέλων που επιτρέπουν στους υπολογιστές να μαθαίνουν και να βελτιώνουν την απόδοσή τους σε ορισμένα καθήκοντα μέσω της επεξεργασίας και της ανάλυσης μεγάλης ποσότητας δεδομένων. Αρκετοί άνθρωποι θεωρούν ότι γνωρίζουν τι είναι η μηχανική μάθηση, λέγοντας απλώς ότι τροφοδοτείς τους υπολογιστές με δεδομένα προκειμένου να μάθουν να εκτελούν εργασίες χωρίς να απαιτείται ο ακριβής καθορισμός της μεθόδου.

Ο αρθρογράφος John Pavlus δίνει έναν πληρέστερο ορισμό, σε ένα κείμενο που δημοσιεύεται στο περιοδικό Quanta, σημειώνοντας ότι «η μηχανική μάθηση είναι ένα υποπεδίο της τεχνητής νοημοσύνης το οποίο διερευνά πώς να προσομοιώνει ή να υπερβαίνει υπολογιστικά την ανθρώπινη νοημοσύνη». Και ότι η πρόοδος που αναγνωρίζεται σε αυτό το πεδίο εντοπίζεται στη χρήση αλγορίθμων που βοηθούν άλλους αλγόριθμους να βελτιώνονται αυτόνομα».

Πώς λειτουργεί η μηχανική μάθηση στην πράξη;

Η διαδικασία ξεκινά με μία εντολή – ας πούμε, «αναγνωρίζω γάτες σε φωτογραφίες». Ο στόχος είναι να βρεθεί μια μαθηματική συνάρτηση που να μπορεί να εκτελέσει την εργασία. Αυτή η συνάρτηση, η οποία ονομάζεται μοντέλο, δέχεται ως είσοδο έναν τύπο αριθμών — σε αυτή την περίπτωση, ψηφιοποιημένες φωτογραφίες — και μετατρέπει αυτούς τους αριθμούς σε άλλους αριθμούς ως έξοδο, οι οποίοι μπορεί να αντιπροσωπεύουν ετικέτες όπως “γάτα” ή “όχι γάτα”. Το μοντέλο έχει μια βασική μαθηματική μορφή που παρέχει κάποια δομή για την εκτέλεση της εργασίας, αλλά δεν εγγυάται από την αρχή την παραγωγή σωστών αποτελεσμάτων.

Στη συνέχεια έρχεται η ώρα να εκπαιδευτεί το μοντέλο, και εδώ είναι που ένας άλλος τύπος αλγόριθμου αναλαμβάνει. Πρώτα, μια διαφορετική μαθηματική συνάρτηση (που ονομάζεται «στόχος») υπολογίζει έναν αριθμό που δείχνει την τρέχουσα “απόσταση” μεταξύ των αποτελεσμάτων του μοντέλου και του επιθυμητού αποτελέσματος. Ακολούθως, ο αλγόριθμος εκπαίδευσης χρησιμοποιεί αυτή τη μέτρηση της απόστασης για να προσαρμόσει τη μορφή του αρχικού μοντέλου. Δε χρειάζεται να “γνωρίζει” τίποτα για το τι αντιπροσωπεύει το μοντέλο. Απλώς ρυθμίζει τα μέρη του μοντέλου (που ονομάζονται παράμετροι) σε ορισμένες μαθηματικές κατευθύνσεις που ελαχιστοποιούν αυτή την απόσταση μεταξύ της πραγματικής και της επιθυμητής εξόδου.

Μόλις γίνουν αυτές οι προσαρμογές, η διαδικασία ξεκινά και πάλι. Το ενημερωμένο μοντέλο μετατρέπει τις εισόδους από τα παραδείγματα εκπαίδευσης σε (ελαφρώς καλύτερες) εξόδους, και στη συνέχεια η συνάρτηση «στόχος» υποδεικνύει άλλη μία (ελαφρώς καλύτερη) προσαρμογή στο μοντέλο. Και έτσι συνεχίζεται, πίσω-μπρος, πίσω-μπρος. Μετά από αρκετές επαναλήψεις, το εκπαιδευμένο μοντέλο θα πρέπει να μπορεί να παράγει ακριβή αποτελέσματα για τα περισσότερα από τα παραδείγματα εκπαίδευσής του. Και εδώ είναι η πραγματική πρόκληση: Θα πρέπει επίσης να διατηρεί αυτή την απόδοση σε νέα παραδείγματα της ίδιας εργασίας, όσο αυτά δε διαφέρουν πολύ από τα παραδείγματα εκπαίδευσης.

Photo by Clarisse Croset on Unsplash

Αγγαρεία και μηχανική μάθηση

Η χρήση μιας συνάρτησης που προσαρμόζει επανειλημμένα μια άλλη συνάρτηση παραπέμπει περισσότερο σε αγγαρεία παρά σε «μηχανική μάθηση». Αλλά αυτό είναι το στοίχημα. «Θέτοντας σε κίνηση αυτή την αυτόματη διαδικασία, προκύπτει μια μαθηματική προσέγγιση της εργασίας χωρίς να χρειάζεται οι άνθρωποι να προσδιορίσουν ποιες λεπτομέρειες είναι σημαντικές. Με αποδοτικούς αλγόριθμους, καλά επιλεγμένες συναρτήσεις και αρκετά παραδείγματα, η μηχανική μάθηση μπορεί να δημιουργήσει ισχυρά υπολογιστικά μοντέλα που κάνουν πράγματα που δεν ξέρουμε πώς να προγραμματίσουμε», τονίζει ο αρθρογράφος. Και προσθέτει: «Οι εργασίες ταξινόμησης και πρόβλεψης — όπως η αναγνώριση γατών σε φωτογραφίες ή η ανίχνευση ανεπιθύμητων μηνυμάτων στα emails — συνήθως βασίζονται στην εποπτευόμενη μηχανική μάθηση, που σημαίνει ότι τα δεδομένα εκπαίδευσης είναι ήδη ταξινομημένα εκ των προτέρων: Οι φωτογραφίες που περιέχουν γάτες, για παράδειγμα, έχουν ετικέτα «γάτα». Η διαδικασία εκπαίδευσης διαμορφώνει μια συνάρτηση που μπορεί να συσχετίσει όσο το δυνατόν περισσότερες από τις εισόδους στην αντίστοιχη (γνωστή) έξοδο. Μετά από αυτή την πορεία, το εκπαιδευμένο μοντέλο κατηγοριοποιεί άγνωστα παραδείγματα».

Προκλήσεις και περιορισμοί

Ακόμα όμως και αυτά τα μοντέλα μάθησης είναι στην ουσία απλώς μαθηματικές συναρτήσεις με πολλές αδυναμίες. «Ένα “υπερεκπαιδευμένο” μοντέλο προσαρμόζεται τόσο καλά στα παραδείγματα εκπαίδευσής του που δεν μπορεί να γενικεύσει αξιόπιστα, καθώς ένα σύστημα αναγνώρισης γατών αποτυγχάνει όταν μια φωτογραφία είναι αντεστραμμένη. Οι προκαταλήψεις στα δεδομένα μπορούν να ενισχυθούν από τη διαδικασία εκπαίδευσης, οδηγώντας σε διαστρεβλωμένα — ή ακόμη και μεροληπτικά — αποτελέσματα», τονίζει ο αρθρογράφος. Και συμπεραίνει: «Ακόμη και όταν ένα μοντέλο λειτουργεί, δεν είναι πάντα σαφές πώς καταλήγει στα αποτελέσματά του. Οι αλγόριθμοι «βαθιάς μάθησης» είναι ιδιαίτερα επιρρεπείς σε αυτό το πρόβλημα, καθώς συχνά είναι δύσκολο να κατανοηθεί η λογική πίσω από τις αποφάσεις τους».

Πηγή: Quanta magazine

© Copyright 2001-2024 Θαλής + Φίλοι.

designed & developed by UNICORG EE