Πώς η φωνητική πληκτρολόγηση είναι η νέα καλύτερη λειτουργία των Εγγράφων Google

Η φωνητική αναγνώριση έχει βελτιωθεί με άλματα και όρια τα τελευταία χρόνια. Νωρίτερα αυτή την εβδομάδα, η Google εισήγαγε τελικά τη φωνητική πληκτρολόγηση στα Έγγραφα Google. Αλλά είναι καλό; Ας ανακαλύψουμε!

Η φωνητική αναγνώριση έχει βελτιωθεί με άλματα και όρια τα τελευταία χρόνια.  Νωρίτερα αυτή την εβδομάδα, η Google εισήγαγε τελικά τη φωνητική πληκτρολόγηση στα Έγγραφα Google.  Αλλά είναι καλό;  Ας ανακαλύψουμε!
Διαφήμιση

Η φωνητική αναγνώριση ήταν τρομερά ανακριβής. Λειτουργούσε μόνο για λίγους ανθρώπους για μια χούφτα φορές. Αλλά τώρα είναι πραγματικά πολύ καλό, χάρη στις συνδυασμένες προσπάθειες της Nuance, της Microsoft, της Apple και της Google, οι οποίοι έριξαν αμέτρητους πόρους για να την βελτιώσουν.

Από όλες αυτές τις εταιρείες, λίγοι έχουν ανταποκριθεί στη δέσμευση να αναγνωρίσουν τη φωνή της Google, η οποία την έχει καταστήσει βασικό άξονα της στρατηγικής της για κινητά και υπηρεσίες.

Μία από τις πρώτες εξελίξεις της Google ήταν η βραχύβια GOOG-411 (ή η τοπική αναζήτηση Google Voice). Ξεκίνησε το 2008 και επέτρεψε στους χρήστες να αναζητήσουν τηλεφωνικούς αριθμούς επιχειρήσεων χρησιμοποιώντας τη φωνή τους. Η τεχνολογία αναγνώρισης φωνής αποτέλεσε επίσης ένα κεντρικό κομμάτι του Android, και με την κυκλοφορία του JellyBean, ποιες είναι οι μεγαλύτερες βελτιώσεις στο Android 4.2 και το 4.3; Ποιες είναι οι μεγαλύτερες βελτιώσεις στο Android 4.2 και 4.3; Εάν είστε κολλημένοι στο 4.0 Ice Cream Sandwich ή 4.1 Jelly Bean, πρέπει να κάνετε αναβάθμιση; Διαβάστε περισσότερα έγινε τελικά διαθέσιμη εκτός σύνδεσης.

Νωρίτερα αυτή την εβδομάδα, η Google εισήγαγε τελικά την αναγνώριση φωνής στα Έγγραφα Google.

Οι χρήστες μπορούν να υπαγορεύσουν κυριολεκτικά τα έγγραφά τους (όπως συμβαίνει με αυτό το άρθρο) χωρίς την ανάγκη εγκατάστασης πρόσθετου λογισμικού ή plug-ins. Είναι ένα σημαντικό άλμα προς τα εμπρός για την online σουίτα γραφείου, αλλά είναι καλό;

Ξεκινώντας

Πριν ξεκινήσουμε να βυθίζουμε τα χαρακτηριστικά του, θέλω να αγγίξω τον τρόπο με τον οποίο λαμβάνετε το Google Voice Typing. Αν έχετε λογαριασμό Google, έχετε ήδη αυτό. Απλά ανοίξτε τα Έγγραφα Google και ανοίξτε ένα νέο ή υπάρχον έγγραφο. Στη συνέχεια, θα εμφανιστεί ένα παράθυρο που θα σας ρωτήσει εάν θέλετε να δοκιμάσετε τη φωνητική υπαγόρευση. Κάντε κλικ στο Δοκιμάστε το .

GoogleVoiceTypingTry

Στη συνέχεια, πρέπει να δώσετε στα Έγγραφα Google άδεια χρήσης του μικροφώνου σας. Αυτό είναι απλώς ένα θέμα να κάνετε κλικ στο κουμπί Να επιτρέπεται σε ένα αναδυόμενο παράθυρο.

MicrophonePermission

Στη συνέχεια, πρέπει να επιλέξετε τη γλώσσα που θέλετε να χρησιμοποιήσετε με την πληκτρολόγηση του Google Voice. Το εύρος των γλωσσών και των διαλέκτων που προσφέρονται κυμαίνεται από τα αγγλικά και τα ισπανικά έως τα αφρικανικά και τα αραβικά.

Screen Shot 2016-02-25 στις 10.14.12

Στη συνέχεια, απλά κάντε κλικ στο εικονίδιο μικροφώνου και αρχίστε να μιλάτε.

Πόσο ακριβής είναι;

Ένα από τα μεγαλύτερα εμπόδια στην αναγνώριση της φωνής που χτυπάει το mainstream, είναι ότι συχνά δεν είναι αρκετά ακριβές . Ήταν δεδομένο ότι εάν δείτε τη χρήση φωνητικής αναγνώρισης, θα χρειαστεί να περάσετε λίγες ώρες επεξεργασίας και διόρθωσης του κειμένου σας. Πώς λοιπόν η Google προσφέρει ναύλο από την άποψη αυτή;

Πολύ ευνοϊκά, στην πραγματικότητα . Ως επί το πλείστον, το Google Voice Typing κατάλαβε τι είπα, παρόλο που έχω μια περιφερειακή αγγλική προφορά ( θα μιλήσουμε για accents αργότερα ).

GoogleVoiceOn

Εντυπωσιάστηκα ιδιαίτερα με τον τρόπο με τον οποίο η φωνή της Google αναγνώρισε το θόρυβο του περιβάλλοντος. Όπως έγραψα αυτό το άρθρο, ένα τεριέ Yorkshire τερμάτισε στο σαλόνι μου και το παράθυρό μου ήταν εν μέρει ανοιχτό. Ζω σε έναν πολυσύχναστο δρόμο, όπου τα αυτοκίνητα οδηγούν συνεχώς. Αλλά παρόλα αυτά, η Google μπόρεσε να το φιλτράρει και να επικεντρωθεί σε αυτά που έλεγα.

Το μεγαλύτερο πρόβλημα ήταν η πληκτρολόγηση του Google Voice που συχνά αγωνίστηκε με σημεία στίξης. Θα έλεγα "κόμμα", "περίοδο" και "πλήρης στάση", και θα ερμηνεύσει αυτό, όπως εγώ θέλω να γράψω "κόμμα", "περίοδος", και "πλήρης στάση". Αυτό ήταν απογοητευτικό για δύο λόγους.

Τελεία

Πρώτον, επειδή θα με χλευάζονταν, χρησιμοποιώντας πρώτα τη σωστή στίξη, πριν επιστρέψω αμέσως στην εκδοχή της λέξης. Δεν υπήρχε τρόπος να σταματήσει αυτό, και θα έπρεπε να επεξεργαστώ το έγγραφο με το χέρι για να το διορθώσω.

Αλλά, ίσως χειρότερα, δεν θα μπορούσα να το αποτρέψω. Δεν υπάρχει λεξικό όπου θα μπορούσατε να αντικαταστήσετε τις ορθογραφίες. Αυτό ακριβώς συμβαίνει και πρέπει να το αντιμετωπίσετε.

Δεν θέλω να υποτιμήσω πόσο απογοητευτικό είναι αυτό. Είναι σοβαρά ενοχλητικό . Αλλά είναι επίσης κάτι που είμαι βέβαιος ότι θα βελτιωθεί καθώς ολοένα και περισσότεροι άνθρωποι χρησιμοποιούν αυτό το χαρακτηριστικό και καθώς η Google δεσμεύεται περισσότερους πόρους για τη βελτίωση της φωνητικής της αναγνώρισης.

Εκτός από αυτή την ιδιαίτερη ενόχληση, ήμουν πολύ ευχαριστημένος με την ακρίβεια της φωνητικής αναγνώρισης της Google.

Πώς χειρίζεται τις επισημάνσεις

Έμεινα έκπληκτος από πόσες γλώσσες και διαλέκτους υποστηρίζει το Google Voice Typing. Μόνο στα αγγλικά υποστηρίζει τη Νέα Ζηλανδία, την αυστραλιανή, την ινδική, τη νοτιοαφρικανική, την αμερικανική και τη βρετανική διάλεκτο, για να αναφέρουμε μόνο μερικούς. Το πρόβλημα είναι ότι δεν υπάρχει στην πραγματικότητα αμερικανική έμφαση, όπως δεν υπάρχει βρετανική προφορά. Αντίθετα, υπάρχει μια σειρά από προφορές και διαλέκτους που διαφέρουν από τόπο σε τόπο.

Είναι αλήθεια ότι το Ηνωμένο Βασίλειο έχει έμφαση για κάθε ταχυδρομικό κώδικα. Η ομάδα MakeUseOf μπορεί να υπερηφανεύεται για μια σειρά από διαφορετικές προθέσεις στο βρετανικό προσωπικό. Ο Christian Cawley μιλάει με μια ευρεία έμφαση στο Middlesbrough. Ο Rob Nightingale, ο οποίος χαιρετά από το Southport, έχει περισσότερη βόρεια έλξη. Ενώ ο Mark O'Neil έχει σκωτσέζικο νεύρο.

Ζω στην Λίβερπουλ, έτσι έχω μια έμφαση Scouse που παρασύρει λίγο στον Ατλαντικό, κυρίως χάρη στην αμερικανική αρραβωνιαστικιά μου και στον χρόνο που έζησα στην Ελβετία.

Και είναι δίκαιο να πούμε ότι τα προγράμματα αναγνώρισης φωνής συχνά αγωνίζονται να κατανοήσουν τις περιφερειακές αγγλικές διαλέκτους. Όταν ο Siri βγήκε, για παράδειγμα, η αδυναμία του να καταλάβει τους χρήστες της Σκωτίας έγινε ένα αστείο.

Αλλά η προσφορά της Google ήταν εξαιρετική. Πιστέψτε με όταν λέω ότι δεν θα χρειαστεί να μιλήσετε με διαφορετική έμφαση. Τι εφαρμογές και ιστότοποι θα σας βοηθήσουν να βελτιώσετε την προτίμησή μου όταν μιλάτε άλλη γλώσσα; Τι εφαρμογές και ιστότοποι θα σας βοηθήσουν να βελτιώσετε την προτίμησή μου όταν μιλάτε άλλη γλώσσα; Θέλω πραγματικά να φτιάξω την αντιστοιχία μου με τον προφορικό λόγο ενός μητρικού ομιλητή. Υπάρχουν εφαρμογές ή ιστότοποι που μπορούν να με βοηθήσουν; Διαβάστε περισσότερα . Έχω μιλήσει με μια χούφτα φίλους που έχουν επίσης περιφερειακές αγγλικές προφορές, και έχουν κατά τον ίδιο τρόπο θετικές εμπειρίες με αυτό. Αν και παραδέχομαι ότι είναι ένα μικρό και εντελώς μη επιστημονικό δείγμα, είναι σίγουρα πολλά υποσχόμενο.

Ταχύτητα υπαγόρευσης φωνής

Τα προγράμματα αναγνώρισης φωνής παραδοσιακά παρεμποδίστηκαν από την αδυναμία να συμβαδίσουν με την ταχύτητα που υπαγορεύει ο χρήστης. Βεβαίως, ανησυχούσα λίγο ότι η προσφορά της Google δεν θα ήταν διαφορετική, ειδικά δεδομένου ότι πρόκειται για μια ηλεκτρονική υπηρεσία και όχι για ένα πρόγραμμα που τρέχει στο MacBook Pro μου.

Αλλά ήμουν εντυπωσιασμένος. Η Google μπόρεσε να συμβαδίσει με το υψηλό ποσοστό μιλώντας μου με καφεΐνη και δεν λειτουργούσε ως εμπόδιο στην παραγωγικότητα μου. Ήταν το απόλυτο αντίθετο των εμπειριών μου με άλλα εργαλεία φωνητικής υπαγόρευσης.

VoiceRecognitionSpeed

Δεν ξέρω αν αυτό οφείλεται στο γεγονός ότι έχω ένα γρήγορο FTTC (Fiber στο γραφείο) Ποια είναι η διαφορά μεταξύ του FTTC και του FTTP και γιατί πρέπει να σας ενδιαφέρει; Ποια είναι η διαφορά μεταξύ του FTTC και του FTTP και γιατί πρέπει να προσέχετε; Είμαστε όλοι εκεί σε ένα σημείο ή άλλο. Αρρωσταί από την υπηρεσία Διαδικτύου, αναζητώντας έναν νέο τρόπο σύνδεσης με το Διαδίκτυο, αλλά συγχέεται από τις πολλές διαφορετικές επιλογές. Διαβάστε περισσότερα την οικιακή σύνδεση στο Internet ή το γεγονός ότι η Google διαθέτει απεριόριστη προσφορά γρήγορων διακομιστών στη διάθεσή της. Είτε έτσι είτε αλλιώς, ήμουν σε θέση να κάνει τα πράγματα γίνονται.

Μια σημείωση σχετικά με τα μικρόφωνα

Τα ενσωματωμένα μικρόφωνα τείνουν να χτυπήσουν και να χάσουν. Από την εμπειρία μου, είναι είτε εξαιρετική, όπως συμβαίνει με τους φορητούς υπολογιστές της Apple, είτε δεν είναι. Πολύ σπάνια υπάρχει οποιοδήποτε μεσαίο έδαφος.

Κατά γενικό κανόνα, οι φθηνότεροι φορητοί υπολογιστές Οι καλύτεροι φορητοί υπολογιστές κάτω από $ 300: Όλα όσα πρέπει να γνωρίζετε Οι καλύτεροι φορητοί υπολογιστές κάτω από $ 300: Όλα όσα πρέπει να ξέρετε Βρίσκοντας έναν καλό φορητό υπολογιστή για λιγότερο από $ 300 είναι σχεδόν αδύνατο αυτές τις μέρες, αλλά μπορεί να γίνει, να αναζητήσουν. Εδώ είναι όλα όσα πρέπει να ξέρετε για να κάνετε μια αγορά που σας ... Διαβάστε περισσότερα θα έχουν τα χειρότερα εσωτερικά μικρόφωνα. Είναι μόνο ένα από αυτά τα χαρακτηριστικά που τείνουν να παραβλέπονται από τους κατασκευαστές συσκευών.

Άρχισα να υπαγορεύω αυτό το άρθρο χρησιμοποιώντας το εσωτερικό μικρόφωνο στο MacBook Pro μου. Παρόλο που τα Έγγραφα Google συχνά δήλωσαν ότι είχε πρόβλημα με την ακρόασή μου, αυτό δεν μεταφράστηκε σε πιο αργή ή ανακριβή υπαγόρευση. Όλα λειτουργούσαν καλά.

Προσπάθησα επίσης να πληκτρολογήσω το Google Voice Typing με ένα ακριβό εξωτερικό μικρόφωνο Micro Yeti. Αυτά είναι μικρόφωνα ποιότητας podcast που πωλούνται στο Amazon για πάνω από $ 100.

Μπλε Yeti USB Μικρόφωνο - Ασημί Μπλε Yeti USB Μικρόφωνο - Ασήμι Αγοράστε τώρα στο Amazon $ 110.00

Βεβαίως, δεν παρατηρήσαμε διαφορές όσον αφορά την ακρίβεια ή την ταχύτητα της υπαγόρευσης. Ωστόσο, το μεγαλύτερο πλεονέκτημα για τη χρήση αυτού του μικροφώνου ήταν ότι ήμουν σε θέση να εισάγετε ένα ζεύγος ακουστικών AKG και να τα χρησιμοποιήσετε ως οθόνη. Αυτό μου επέτρεψε να είμαι πιο ευαισθητοποιημένος στο θόρυβο του περιβάλλοντος και να αυτο-ρυθμίζω αν ήμουν πολύ δυνατός ή πολύ ήσυχος.

Τελικές σκέψεις

Η φωνητική αναγνώριση Google δεν είναι τέλεια. Αλλά αυτό δεν είναι απλά μια έκπληξη, καθώς η σταθερή αναγνώριση φωνής είναι ένα αρκετά σκληρό κατόρθωμα για να αποσυρθούν. Υπάρχουν πολλά που ένιωθα ότι θα μπορούσαν να βελτιωθούν.

Αυτό επικεντρώνεται κυρίως γύρω από το πώς το λογισμικό ασχολείται με τη στίξη και τη δομή των προτάσεων. Σε έναν ιδανικό κόσμο, η Google θα εισαγάγει αυτόματα σημεία στίξης με βάση το ρυθμό και το ρυθμό της φωνής σας, αλλά είμαστε πολύ μακριά από αυτό.

Είναι επίσης λυπηρό το γεγονός ότι το λογισμικό αυτό δεν έχει ακόμη φτάσει στις άλλες προσφορές της Google, όπως το Gmail. Στην ιδανική περίπτωση, θα ήθελα η ευκαιρία να κατεβάσετε το Google Voice Typing ως εφαρμογή και να το χρησιμοποιήσετε με άλλα κομμάτια λογισμικού, όπως το Pages Pages 5.0 του iWork για το Mac Περιέχει έξυπνο πίνακα επιθεωρητών, αλλά λιγότερες δυνατότητες Σελίδες 5.0 για Mac Περιλαμβάνει τον πίνακα Smart Inspector, Αλλά Λιγότερο Χαρακτηριστικά Υπάρχουν πολλοί ελαφροί και εύχρηστοι επεξεργαστές κειμένου για χρήστες Mac, αλλά για έργα που απαιτούν χαρακτηριστικά εκτύπωσης σε επιτραπέζιους υπολογιστές, οι πρόσφατα αναθεωρημένες σελίδες της Apple εξακολουθούν να είναι μια καλή λύση. Διαβάστε περισσότερα ή το πρόγραμμα επεξεργασίας markup IA Writer iA Writer για Mac & iOS: Ο καλύτερος επεξεργαστής κειμένου που δεν έχετε χρησιμοποιήσει ποτέ iA Writer για Mac & iOS: Ο καλύτερος επεξεργαστής κειμένου που δεν έχετε χρησιμοποιήσει ποτέ Είτε πρόκειται για σχολικό χαρτί είτε για blog post, όλοι μας σε κάποιο σημείο βρισκόμαστε στη θέση να χρειαστεί να πετάξουμε μια δέσμη χαρακτήρων σε ένα αρχείο κειμένου. Ενώ το κινητό τηλέφωνο ... Διαβάστε περισσότερα.

Αλλά αυτά είναι δύο μικρές ενοχλήσεις, το Google Voice Typing είναι τόσο καλό όσο παίρνει. Για αντίθεση, έγραψα αυτό το τμήμα του άρθρου χρησιμοποιώντας την ενσωματωμένη φωνητική αναγνώριση του OS X και δεν ήταν σχεδόν τόσο ακριβής όσο και γρήγορα.

Αν αυτό δεν πείσει τα άτομα να μεταβούν στο Google Drive, δεν ξέρω τι θα κάνει.

Τώρα πάνω σε σας! Έχετε μπει στον πειρασμό από την αναγνώριση ομιλίας του Google Drive; Έχετε δοκιμάσει αυτό, ακόμα; Πες μου όλα σχετικά με τα σχόλια παρακάτω.

In this article