Μιλάμε όλη την ώρα που οι υπολογιστές μας καταλαβαίνουν. Λέμε ότι η Google "γνώριζε" τι ψάχναμε ή ότι η Cortana "πήρε" αυτό που λέγαμε, αλλά η "κατανόηση" είναι μια πολύ δύσκολη ιδέα. Ειδικά όταν πρόκειται για υπολογιστές.
Ένα πεδίο υπολογιστικής γλωσσολογίας, που ονομάζεται επεξεργασία φυσικής γλώσσας (NLP), επεξεργάζεται αυτό το ιδιαίτερα δύσκολο πρόβλημα. Είναι ένα συναρπαστικό πεδίο τώρα και μόλις έχετε μια ιδέα για το πώς λειτουργεί, θα αρχίσετε να βλέπετε τα αποτελέσματά του παντού.
Μια γρήγορη σημείωση: Αυτό το άρθρο έχει μερικά παραδείγματα ενός υπολογιστή που ανταποκρίνεται στην ομιλία, όπως όταν ρωτάς τον Siri για κάτι. Ο μετασχηματισμός της ακουστικής ομιλίας σε μορφή κατανοητή από τον υπολογιστή ονομάζεται αναγνώριση ομιλίας. Το NLP δεν ασχολείται με αυτό (τουλάχιστον στην ικανότητα που συζητάμε εδώ). Το NLP μπαίνει σε λειτουργία μόλις το κείμενο είναι έτοιμο. Και οι δύο διαδικασίες είναι απαραίτητες για πολλές εφαρμογές, αλλά είναι δύο πολύ διαφορετικά προβλήματα.
Καθορισμός κατανόησης
Πριν βρεθούμε στον τρόπο με τον οποίο οι υπολογιστές χειρίζονται τη φυσική γλώσσα, πρέπει να ορίσουμε μερικά πράγματα.
Πρώτα απ 'όλα, πρέπει να ορίσουμε τη φυσική γλώσσα. Αυτό είναι εύκολο: κάθε γλώσσα που χρησιμοποιείται τακτικά από ανθρώπους εμπίπτει σε αυτή την κατηγορία. Δεν περιλαμβάνει πράγματα όπως κατασκευασμένες γλώσσες (Klingon, Esperanto) ή γλώσσες προγραμματισμού υπολογιστών. Χρησιμοποιείτε φυσική γλώσσα όταν μιλάτε στους φίλους σας. Μπορείτε πιθανώς να το χρησιμοποιήσετε για να μιλήσετε με τον ψηφιακό προσωπικό σας βοηθό.
Τι εννοούμε όταν λέμε κατανόηση; Λοιπόν, είναι περίπλοκο. Τι σημαίνει κατανόηση μιας φράσης; Ίσως θα λέγατε ότι σημαίνει ότι τώρα έχετε το περιεχόμενο του μηνύματος στο μυαλό σας. Η κατανόηση μιας έννοιας μπορεί να σημαίνει ότι μπορείτε να εφαρμόσετε αυτήν την έννοια σε άλλες σκέψεις.
Οι ορισμοί των λεξικών είναι νεφελώδης. Δεν υπάρχει έξυπνη απάντηση. Οι φιλόσοφοι έχουν μιλήσει για τέτοια πράγματα εδώ και αιώνες.
Για τους σκοπούς μας, πρόκειται να πούμε ότι η κατανόηση είναι η ικανότητα να εξαγάγει με ακρίβεια το νόημα από τη φυσική γλώσσα . Για να κατανοήσει ένας υπολογιστής, χρειάζεται να επεξεργαστεί με ακρίβεια μια εισερχόμενη ροή ομιλίας, να μετατρέψει αυτό το ρεύμα σε μονάδες νοήματος και να είναι σε θέση να ανταποκριθεί στην είσοδο με κάτι που είναι χρήσιμο.
Προφανώς αυτό είναι πολύ ασαφές. Αλλά είναι το καλύτερο που μπορούμε να κάνουμε με περιορισμένο χώρο (και χωρίς πτυχίο νευροφυσιολογίας). Εάν ένας υπολογιστής μπορεί να προσφέρει μια ανθρώπινη, ή τουλάχιστον χρήσιμη, απάντηση σε ένα ρεύμα εισόδου φυσικής γλώσσας, μπορούμε να πούμε ότι το καταλαβαίνει. Αυτός είναι ο ορισμός που θα χρησιμοποιήσουμε το μέλλον.
Ένα πολύπλοκο πρόβλημα
Η φυσική γλώσσα είναι πολύ δύσκολη για να αντιμετωπίσει κάποιος υπολογιστής. Θα μπορούσατε να πείτε, "Siri, μου δώστε οδηγίες να Punch Pizza", ενώ θα μπορούσα να πω, "Siri, Punch διαδρομή Pizza, παρακαλώ."
Στη δήλωση σας, ο Σίρι θα μπορούσε να επιλέξει τη φράση "δώσε μου οδηγίες", στη συνέχεια εκτελέστε μια εντολή που σχετίζεται με τον όρο αναζήτησης "Punch Pizza." Στη δική μου, όμως, ο Siri πρέπει να διαλέξει τη "διαδρομή" Punch Pizza "είναι εκεί που θέλω να πάω, όχι" παρακαλώ ". Και αυτό είναι απλώς ένα απλουστευτικό παράδειγμα.
Σκεφτείτε μια τεχνητή νοημοσύνη που διαβάζει τα μηνύματα ηλεκτρονικού ταχυδρομείου και αποφασίζει αν μπορεί να είναι απάτες. Ή μία που παρακολουθεί θέσεις κοινωνικών μέσων ενημέρωσης για να μετρήσει ενδιαφέρον για μια συγκεκριμένη εταιρεία. Κάποτε εργαζόμουν σε ένα έργο όπου έπρεπε να διδάξουμε έναν υπολογιστή για να διαβάσουμε ιατρικές σημειώσεις (οι οποίες έχουν όλο το είδος παράξενων συμβάσεων) και να συλλέξουμε πληροφορίες από αυτούς.
Αυτό σημαίνει ότι το σύστημα έπρεπε να είναι σε θέση να ασχολείται με συντομογραφίες, παράξενη σύνταξη, περιστασιακά ορθογραφικά λάθη και μια ευρεία ποικιλία άλλων διαφορών στις σημειώσεις. Είναι ένα εξαιρετικά σύνθετο έργο που μπορεί να είναι δύσκολο ακόμα και για έμπειρους ανθρώπους, πολύ λιγότερο μηχανές.
Ρύθμιση παραδείγματος
Σε αυτό το συγκεκριμένο έργο, ήμουν μέλος της ομάδας που διδάσκει τον υπολογιστή να αναγνωρίζει συγκεκριμένες λέξεις και τις σχέσεις μεταξύ των λέξεων. Το πρώτο βήμα της διαδικασίας ήταν να δείξουμε στον υπολογιστή τις πληροφορίες που περιέχονται σε κάθε σημείωση, γι 'αυτό σημειώσαμε τις σημειώσεις.
Υπήρξε ένας τεράστιος αριθμός διαφορετικών κατηγοριών οντοτήτων και σχέσεων. Πάρτε την πρόταση "κα. Η κεφαλαλγία του Green είχε υποβληθεί σε θεραπεία με ιβουπροφαίνη », για παράδειγμα. Η κα Green είχε επισημανθεί ως PERSON, ο πονοκέφαλος επισημάνθηκε ως ΣΗΜΑ Ή ΣΥΜΠΤΩΜΑ, η ιβουπροφαίνη χαρακτηρίστηκε ως MEDICATION. Στη συνέχεια, η κ. Green συνδέθηκε με πονοκέφαλο με σχέση PRESENTS. Τέλος, η ιβουπροφαίνη συνδέθηκε με τον πονοκέφαλο με μια σχέση TREATS.
Ετικέταμε χιλιάδες σημειώσεις με αυτόν τον τρόπο. Κωδικοποιήσαμε τις διαγνώσεις, τις θεραπείες, τα συμπτώματα, τις υποκείμενες αιτίες, τις συννοσηρότητες, τις δοσολογίες και όλα όσα θα μπορούσατε ενδεχομένως να πιστεύετε ότι σχετίζονται με την ιατρική. Άλλες ομάδες σχολιασμού κωδικοποίησαν άλλες πληροφορίες, όπως σύνταξη. Στο τέλος, είχαμε ένα σώμα γεμάτο ιατρικές σημειώσεις ότι το AI θα μπορούσε να "διαβάσει".
Η ανάγνωση είναι εξίσου δύσκολο να οριστεί ως κατανόηση. Ο υπολογιστής μπορεί εύκολα να δει ότι το ibuprofen αντιμετωπίζει έναν πονοκέφαλο, αλλά όταν μαθαίνει αυτές τις πληροφορίες, μετατρέπεται σε νόημα (σε μας) και μηδενικά. Μπορεί σίγουρα να δώσει πληροφορίες που μοιάζουν με ανθρώπους και είναι χρήσιμες, αλλά αυτό συνιστά κατανόηση. Ποια τεχνητή νοημοσύνη δεν είναι η τεχνητή νοημοσύνη; Είναι έξυπνα, αισθανόμενα ρομπότ που αναλαμβάνουν τον κόσμο; Δεν είναι σήμερα - και ίσως όχι ποτέ. Διαβάστε περισσότερα ? Και πάλι, είναι σε μεγάλο βαθμό ένα φιλοσοφικό ερώτημα.
Η πραγματική μάθηση
Σε αυτό το σημείο, ο υπολογιστής πέρασε τις σημειώσεις και εφάρμοσε έναν αριθμό αλγορίθμων μηχανικής μάθησης. 4 Αλγόριθμοι μηχανικής μάθησης που διαμορφώνουν τη ζωή σας 4 Αλγόριθμοι μηχανικής μάθησης που διαμορφώνουν τη ζωή σας Μπορεί να μην το συνειδητοποιήσετε, αλλά η μηχανική μάθηση είναι ήδη γύρω σας. μπορεί να ασκήσει εκπληκτικό βαθμό επιρροής στη ζωή σας. Μη με πιστέψεις; Μπορεί να εκπλαγείτε. Διαβάστε περισσότερα . Οι προγραμματιστές ανέπτυξαν διαφορετικές ρουτίνες για την επισήμανση τμημάτων του λόγου, την ανάλυση εξαρτήσεων και περιφερειών και την επισήμανση σημασιολογικών ρόλων. Στην ουσία, ο AI μάθαινε να διαβάζει τις σημειώσεις.
Οι ερευνητές θα μπορούσαν τελικά να το δοκιμάσουν δίνοντάς του μια ιατρική σημείωση και να της ζητήσουν να επισημάνει κάθε οντότητα και σχέση. Όταν ο υπολογιστής αναπαραγάγει με ακρίβεια τον ανθρώπινο σχολιασμό, θα μπορούσατε να πείτε ότι έμαθε να διαβάζει τις εν λόγω ιατρικές σημειώσεις.
Μετά από αυτό, ήταν απλώς το θέμα της συλλογής τεράστιων στατιστικών για το τι είχε διαβάσει: ποια φάρμακα χρησιμοποιούνται για να θεραπεύσουν ποιες διαταραχές, ποιες θεραπείες είναι πιο αποτελεσματικές, τις υποκείμενες αιτίες συγκεκριμένων συνόλων συμπτωμάτων κ.ο.κ. Στο τέλος της διαδικασίας, το AI θα είναι σε θέση να απαντήσει σε ιατρικές ερωτήσεις που βασίζονται σε στοιχεία από πραγματικές ιατρικές σημειώσεις. Δεν χρειάζεται να βασίζεται σε εγχειρίδια, φαρμακευτικές εταιρείες ή διαίσθηση.
Βαθιά μάθηση
Ας δούμε ένα άλλο παράδειγμα. Το νευρωνικό δίκτυο DeepMind της Google μαθαίνει να διαβάζει άρθρα ειδήσεων. Όπως και ο βιοϊατρικός ΑΙ παραπάνω, οι ερευνητές ήθελαν να βγάλει σχετικές και χρήσιμες πληροφορίες από μεγαλύτερα κομμάτια κειμένου.
Η κατάρτιση ενός AI σε ιατρικές πληροφορίες ήταν αρκετά δύσκολη, ώστε να μπορείτε να φανταστείτε πόσα σχολιασμένα δεδομένα θα χρειαστείτε για να κάνετε έναν AI ικανό να διαβάσει γενικά άρθρα ειδήσεων. Η πρόσληψη αρκετών σχολιαστών και η μετάβαση σε αρκετές πληροφορίες θα ήταν απαγορευτικά δαπανηρές και χρονοβόρες.
Έτσι, η ομάδα DeepMind στράφηκε σε άλλη πηγή: ειδησεογραφικές ιστοσελίδες. Συγκεκριμένα, το CNN και το Daily Mail.
Γιατί αυτοί οι ιστότοποι; Επειδή παρέχουν συνοπτικές περιλήψεις των άρθρων τους που δεν τραβούν απλά προτάσεις από το ίδιο το άρθρο. Αυτό σημαίνει ότι το AI έχει κάτι από το οποίο πρέπει να μάθει. Οι ερευνητές δήλωσαν βασικά στον AI, "Εδώ είναι ένα άρθρο και εδώ είναι οι πιο σημαντικές πληροφορίες σε αυτό." Στη συνέχεια, ζήτησαν από αυτό να τραβήξει τον ίδιο τύπο πληροφοριών από ένα άρθρο χωρίς κουκκίδες.
Αυτό το επίπεδο πολυπλοκότητας μπορεί να αντιμετωπιστεί από ένα βαθύ νευρωνικό δίκτυο, το οποίο είναι ένας πολύ περίπλοκος τύπος συστήματος μηχανικής μάθησης. (Η ομάδα DeepMind κάνει κάποια εκπληκτικά πράγματα σε αυτό το πρόγραμμα. Για να δείτε τις λεπτομέρειες, δείτε αυτή τη μεγάλη επισκόπηση από την ανασκόπηση τεχνολογίας MIT.)
Τι μπορεί να κάνει ένα AI ανάγνωσης;
Τώρα έχουμε μια γενική κατανόηση του πώς οι υπολογιστές μαθαίνουν να διαβάζουν. Παίρνετε ένα τεράστιο ποσό κειμένου, πείτε στον υπολογιστή τι είναι σημαντικό και εφαρμόστε ορισμένους αλγορίθμους μηχανικής μάθησης. Αλλά τι μπορούμε να κάνουμε με ένα AI που τραβά τις πληροφορίες από το κείμενο;
Γνωρίζουμε ήδη ότι μπορείτε να τραβήξετε συγκεκριμένες ενημερωτικές πληροφορίες από ιατρικές σημειώσεις και να συνοψίσετε γενικά άρθρα ειδήσεων. Υπάρχει ένα πρόγραμμα ανοιχτού κώδικα που ονομάζεται PAN που αναλύει την ποίηση τραβώντας τα θέματα και τις εικόνες. Οι ερευνητές συχνά χρησιμοποιούν την εκμάθηση μηχανών για να αναλύσουν μεγάλους όγκους δεδομένων των κοινωνικών μέσων, τα οποία χρησιμοποιούν οι εταιρείες για να κατανοήσουν τα συναισθήματα των χρηστών, να δουν τι μιλάνε οι άνθρωποι και να βρουν χρήσιμα πρότυπα για το μάρκετινγκ.
Οι ερευνητές χρησιμοποίησαν την εκμάθηση μηχανών για να αποκτήσουν γνώσεις σχετικά με τις συμπεριφορές ηλεκτρονικού ταχυδρομείου και τα αποτελέσματα της υπερφόρτωσης μέσω ηλεκτρονικού ταχυδρομείου. Οι πάροχοι ηλεκτρονικού ταχυδρομείου μπορούν να το χρησιμοποιήσουν για να φιλτράρουν τα ανεπιθύμητα μηνύματα από τα εισερχόμενά σας και να ταξινομήσουν ορισμένα μηνύματα ως υψηλής προτεραιότητας Η ανάγνωση AIs είναι κρίσιμης σημασίας για την πραγματοποίηση αποτελεσματικών chatbots εξυπηρέτησης πελατών 8 Bots θα πρέπει να προσθέσετε στο Facebook Messenger App 8 Bots θα πρέπει να προσθέσετε στο Facebook Messenger App σας Το Facebook Messenger έχει ανοίξει για chat bots, επιτρέποντας στις εταιρείες να παραδίδουν εξυπηρέτηση πελατών, ειδήσεις και πιο άμεσα σε σας μέσω της εφαρμογής. Εδώ είναι μερικά από τα καλύτερα διαθέσιμα. Διαβάστε περισσότερα . Οπουδήποτε υπάρχει κείμενο, υπάρχει ένας ερευνητής που εργάζεται στην επεξεργασία φυσικής γλώσσας.
Και καθώς αυτός ο τύπος μηχανικής μάθησης βελτιώνεται, οι δυνατότητες αυξάνονται μόνο. Οι υπολογιστές είναι καλύτεροι από τους ανθρώπους στο σκάκι, το Go, και τα βιντεοπαιχνίδια τώρα. Σύντομα μπορεί να είναι καλύτερα στην ανάγνωση και τη μάθηση. Είναι αυτό το πρώτο βήμα προς την ισχυρή ΑΙ Εδώ είναι γιατί οι επιστήμονες νομίζουν ότι πρέπει να ανησυχείτε για την τεχνητή νοημοσύνη Εδώ είναι γιατί οι επιστήμονες νομίζουν ότι πρέπει να ανησυχείτε για την τεχνητή νοημοσύνη Νομίζετε ότι η τεχνητή νοημοσύνη είναι επικίνδυνη; Μπορεί το AI να αποτελέσει σοβαρό κίνδυνο για την ανθρώπινη φυλή. Αυτοί είναι μερικοί λόγοι για τους οποίους μπορεί να θέλετε να ανησυχείτε. Διαβάστε περισσότερα ? Θα πρέπει να περιμένουμε και να δούμε, αλλά μπορεί να είναι.
Τι είδους χρήσεις βλέπετε για ανάγνωση κειμένου και εκμάθηση AI; Τι είδους μηχανική μάθηση πιστεύετε ότι θα δούμε στο εγγύς μέλλον; Μοιραστείτε τις σκέψεις σας στα παρακάτω σχόλια!
Συντελεστές εικόνας: Vasilyev Alexandr / Shutterstock