Εάν θέλετε να μετατρέψετε τυχόν τυπωμένο κείμενο σε ψηφιακό κείμενο που μπορείτε να αντιγράψετε, επικολλήσετε, επεξεργαστείτε και αναζητήσετε, θα πρέπει να χρησιμοποιήσετε σαρωτές οπτικής αναγνώρισης χαρακτήρων (OCR).
Όταν επιλέγετε τη σάρωση ή τη λήψη μιας φωτογραφίας ενός εγγράφου, αυτό θα αποθηκευτεί σε μορφή όπως JPEG ή PDF. Το λογισμικό OCR μπορεί στη συνέχεια να αναγνωρίσει τα γράμματα και τους αριθμούς μέσα σε αυτά τα έγγραφα και να τα μετατρέψει σε PDF με δυνατότητα αναζήτησης 4 Μέθοδοι δημιουργίας και επεξεργασίας αρχείων PDF για δωρεάν 4 Μέθοδοι δημιουργίας και επεξεργασίας αρχείων PDF δωρεάν Από όλους τους συνήθεις τύπους αρχείων που βρίσκονται στο (PDF) είναι πιθανώς ένα από τα πιο περιοριστικά, ενώ ταυτόχρονα είναι διαθέσιμο για χρήση από όλους (κυρίως για ανάγνωση) .... Διαβάστε περισσότερα, ή σε ένα αρχείο που μπορείτε να επεξεργαστείτε σε προγράμματα όπως το Microsoft Word.
Το πρόβλημα είναι ότι ορισμένοι σαρωτές OCR λειτουργούν πολύ καλύτερα από τους άλλους, με το καλύτερο να είναι πολύ βαρύ στο πορτοφόλι.
Το Omnipage18, για παράδειγμα, κοστίζει $ 150, αλλά είναι ιδιαίτερα καλό για την αναγνώριση διαφορετικών γλωσσών. Το Adobe Acrobat Pro DC κοστίζει $ 400, αλλά έχει απίστευτη ακρίβεια. Το ABBYY FineReader κοστίζει $ 150, αλλά είναι φανταστικό στη μετατροπή εγγράφων όπως περιοδικά και φυλλάδια σε αναζητήσιμο κείμενο. Θα εξετάσουμε αργότερα την ηλεκτρονική προσφορά της ABBYY σε αυτό το άρθρο.
Ωστόσο, εάν είστε μετά από δωρεάν εναλλακτικές λύσεις που μπορείτε να κάνετε λήψη και χρήση σε Windows ή OS X, θα πρέπει να δοκιμάσετε αυτά τα εργαλεία OCR Τα 5 καλύτερα εργαλεία OCR για την εξαγωγή κειμένου από εικόνες Τα 5 καλύτερα εργαλεία OCR για την εξαγωγή κειμένου από εικόνες Όταν έχουν δεσμίδες χαρτιού, πώς μπορείτε να μετατρέψετε όλο αυτό το τυπωμένο κείμενο σε κάτι που ένα ψηφιακό πρόγραμμα θα είναι σε θέση να αναγνωρίσει και να δείξει; Κρατήστε ένα καλό λογισμικό OCR κοντά. Διαβάστε περισσότερα . Αλλά αν προτιμάτε να χρησιμοποιήσετε ένα δωρεάν, online εργαλείο OCR, συνεχίστε να διαβάζετε, καθώς δοκιμάσαμε τους πρώτους λίγους, με τα παρακάτω αποτελέσματα.
Το τέστ
Φαίνεται ότι οι περισσότεροι άνθρωποι χρησιμοποιούν πλέον τα smartphones τους για να κάνουν τη σάρωση τους για να κάνουν σάρωση και διαχείριση των αποδείξεων σας, εξοικονόμηση χώρου, χαρτιού και χρόνου σάρωσης και διαχείρισης των αποδείξεων σας, εξοικονόμηση χώρου, χαρτιού και ώρας. πλέον. Ευτυχώς, η ψηφιακή επίλυση των δύο αυτών προβλημάτων. Διαβάστε περισσότερα, αποφάσισα να χρησιμοποιήσω την εφαρμογή Scannable της Evernote (δωρεάν σε iOS και Android). Έψαξα την πρώτη σελίδα του Climbing Mount του Ρίτσαρντ Ντόουκν, απίθανη, για να δούμε τι αποτελέσματα θα μπορούσαμε να πάρουμε με πολύ βασική μορφοποίηση. Ελέγξαμε επίσης μια σελίδα του 4-ωρη Chef Tim Ferriss για να δοκιμάσετε τους σαρωτές με λίγο πιο περίπλοκη μορφοποίηση. Έχω αποθηκεύσει κάθε ένα από αυτά τα αρχεία ως PDF.
Αυτά τα έγγραφα στη συνέχεια εκτελέστηκαν μερικά από τα υποτιθέμενα καλύτερα ηλεκτρονικά εργαλεία OCR για να δουν πόσο καλά τα κατάφεραν.
Δωρεάν OCR στο διαδίκτυο
Ευτυχώς, δεν απαιτείται εγγραφή για χρήση του Free Online OCR. Και ήμουν εντυπωσιασμένος διπλά όταν έβλεπα το αίτημά τους να διατηρήσω τη μορφοποίηση και τη διάταξη του εγγράφου μου.
Ο ιστότοπος ισχυρίζεται ότι είναι σε θέση να υποστηρίξει τα PDF, GIF, BMP, JPEG, TIFF και PNG ως εισροή. Οι εξόδους μπορούν να είναι είτε DOC, έγγραφο κειμένου PDF, RTF και TXT. Δυστυχώς, δεν μπορούσα να μάθω αν είχαν ένα όριο μεγέθους αρχείου.
Βασικό έγγραφο σε μορφή PDF
Μετατραπεί απολύτως τέλεια. Δεν υπάρχει τίποτα περισσότερο να πω! Έχουμε ξεκινήσει πολύ καλά.
Βασικό Έγγραφο στο DOC
Οι πραγματικές λέξεις φαίνεται να έχουν μετατραπεί άψογα, εκτός από το "ount" από το "Mount Rushmore" κάνοντας AWOL. Η μορφοποίηση είναι μια διαφορετική ιστορία, όμως. Πολλά κόμματα αντικαταστάθηκαν με υπογράμμισες και τυχαία κενά εισήχθησαν σε σημεία σε όλο το έγγραφο. Όταν αργότερα θα δείτε πως το λογισμικό υψηλής ποιότητας διέφερε σε αυτή τη δοκιμασία, αυτό δεν είναι καθόλου κακή προσπάθεια.
Σύνθετο έγγραφο σε μορφή PDF
Η μετατροπή του εγγράφου απέτυχε 120 δευτερόλεπτα! Μόλις ολοκληρωθεί, όλο το κείμενο είχε μετατραπεί με ακρίβεια 95%, αν και το κείμενο στο ξεχωριστό πλαίσιο που βρίσκεται στην επάνω δεξιά πλευρά της σελίδας ήταν ακατάλληλο. Μερικοί άλλοι χαρακτήρες σε όλο το PDF ήταν επίσης εσφαλμένοι.
Σύνθετο έγγραφο στο DOC
Αυτή τη φορά, η μετατροπή χρειάστηκε μόνο 10 δευτερόλεπτα, με το κείμενο να μετατρέπεται και πάλι με ακρίβεια 95%. Υπήρχαν κάποιες παράξενες αποστάσεις και το λογισμικό αντιμετώπιζε πρόβλημα στη μετατροπή της γραμματοσειράς στο πάνω δεξιά μέρος του εγγράφου και χάθηκε μερικούς χαρακτήρες εδώ και εκεί.
Ετυμηγορία
Αν θέλετε να μετατρέψετε απλά μορφοποιημένα έγγραφα σε PDF, αυτό είναι ένα φανταστικό εργαλείο. Όσον αφορά τη μετατροπή σε DOC, τα αποτελέσματα δεν ήταν τίποτα για να γράψουμε στο σπίτι.
i2OCR
Το i2OCR κάνει κάποιες εντυπωσιακές αξιώσεις. Το εργαλείο αναγνωρίζει πάνω από 60 γλώσσες, μπορεί να χειριστεί διατάξεις πολλαπλών στηλών (αφαιρώντας τη μορφοποίηση), δεν έχει όρια μεγέθους αρχείου, μπορεί να μετατρέψει αρχεία που έχουν μεταφορτωθεί και από διευθύνσεις URL. Και δεν χρειάζεται να εγγραφείτε για να χρησιμοποιήσετε αυτό το εργαλείο.
Η υπηρεσία λειτουργεί απλά αφαιρώντας το κείμενο από την εικόνα σας και στη συνέχεια εκτυπώνοντας μη μορφοποιημένο κείμενο. Μπορείτε να διορθώσετε γρήγορα τυχόν λάθη στην προβολή δίπλα-δίπλα, προτού αντιγράψετε το κείμενο σε άλλα προγράμματα ή μεταφορτώσετε ως DOC, PDF ή HTML.
Σημείωση: όταν προσπάθησα να ανεβάσω τα έγγραφά μου στο PDF, αυτά απορρίφθηκαν από το i2OCR, οπότε έπρεπε να τα μετατρέψω σε JPEG (τραβώντας ένα στιγμιότυπο οθόνης από αυτά, φορτώνοντας τα αρχεία).
Βασικό έγγραφο σε απλό κείμενο
Λόγω του τρόπου με τον οποίο λειτουργεί αυτό το εργαλείο, χάνονται όλες οι μορφοποιήσεις, αν και η μετατροπή από εικόνα σε κείμενο ήταν σχεδόν τέλεια. Υπήρχαν μερικά μικρά σφάλματα, όπως η απόσταση μεταξύ των παραγράφων, και ορισμένα κόμματα αντικαταστάθηκαν με περιόδους, αλλά αυτά είναι μικρά niggles.
Σύνθετο έγγραφο σε απλό κείμενο
Η πλειοψηφία του κειμένου μετατράπηκε χωρίς πάρα πολλά λάθη, εκτός από τον τίτλο και τη συνταγή στην πάνω δεξιά γωνία, η οποία ήταν δυσανάγνωστη για αυτό το εργαλείο. Ο τρόπος με τον οποίο μετατράπηκαν οι κίονες σε απλό κείμενο δεν ήταν ιδανικό. Εάν θέλετε να καταστήσετε τη μετατροπή αυτή εφικτή, θα χρειαστεί πολύς χρόνος για την αναδιάταξη των γραμμών σε συνεκτικές προτάσεις.
Ετυμηγορία
Για βασικά έγγραφα, το i2OCR λειτουργεί εξαιρετικά. Η δυνατότητα επεξεργασίας του κειμένου πριν από τη λήψη είναι επίσης μια πολύ ωραία πινελιά. Για πιο περίπλοκα έγγραφα, ωστόσο, η μετατροπή εξακολουθεί να είναι αρκετά ακριβής, αλλά ο τρόπος με τον οποίο το κείμενο εξάγεται δεν θα κάνει τη ζωή σας πολύ πιο εύκολη.
Online OCR
Το online OCR υποστηρίζει επί του παρόντος 46 διαφορετικές γλώσσες και μπορεί να μετατρέψει PDF, JPG, BMP, TIFF και GIF σε μορφή Word, Excel ή απλού κειμένου. Ο ιστότοπος ισχυρίζεται ότι "τα έγγραφα που έχουν μετατραπεί φαίνονται ακριβώς όπως τα πρωτότυπα - πίνακες, στήλες και γραφικά".
Η έκδοση που μπορείτε να χρησιμοποιήσετε χωρίς εγγραφή σας επιτρέπει να μετατρέψετε μέχρι 15 εικόνες ανά ώρα (όριο 5mb). Εάν εγγραφείτε σε έναν λογαριασμό, μπορείτε να αγοράσετε περισσότερες σελίδες πάνω από αυτό το όριο, ενώ παράλληλα μπορείτε να μετατρέψετε έγγραφα πολλών σελίδων και αρχεία ZIP, επίσης.
Βασικό Έγγραφο στο DOC
Το βασικό έγγραφο μετατράπηκε άψογα εκτός από τον ρωμαϊκό αριθμό που δε λαμβάνω . Όπως υποσχέθηκε η τοποθεσία, η μορφοποίηση ήταν ακριβώς όπως ήταν στο βιβλίο. Kudos σε αυτό το εργαλείο.
Σύνθετο έγγραφο στο DOC
Αφού απογοητευτήκαμε από τα προηγούμενα εργαλεία OCR για τη μετατροπή του περίπλοκου εγγράφου, έγινα μεγάλη εντύπωση από το Online OCR. Η διάταξη ήταν σχεδόν τέλεια, όπως μπορείτε να δείτε παραπάνω. Για άλλη μια φορά όμως, η συνταγή δεν λήφθηκε πάρα πολύ καλά, αλλά οποιαδήποτε άλλα μικρά λάθη ήταν αμελητέα.
Ετυμηγορία
Απολύτως φανταστικά αποτελέσματα από το online OCR. Το μόνο μειονέκτημα που βλέπω είναι ότι δεν υπάρχει τρόπος να κατεβάσετε τα μετατραπέντα έγγραφα ως PDF, καθώς οι μορφές εξόδου που αναφέρονται περιλαμβάνουν μόνο DOCX, XLSX και TXT μόνο.
ABBYY FineReader Online (δοκιμή 10 σελίδων)
Όπως αναφέρθηκε προηγουμένως, η ABBYY είναι ένας από τους ηγέτες της αγοράς στο λογισμικό OCR, κοστίζοντας περίπου $ 150 για το πλήρες, downloadable πρόγραμμα τους. Προσφέρουν μια δωρεάν δοκιμή 10 σελίδων για το ηλεκτρονικό εργαλείο τους, αν και απαιτείται εγγραφή. Για συνδρομή $ 5, το ηλεκτρονικό εργαλείο τους θα σας επιτρέψει να μετατρέψετε 200 σελίδες κάθε μήνα.
Τα αρχεία που γίνονται αποδεκτά μπορούν να φτάσουν έως και 100mb σε οποιαδήποτε από αυτές τις μορφές: PDF, JPG, JPEG, TIF, TIFF, PCX, DCX, BMP και PNG. Η ABBYY αναγνωρίζει επίσης περίπου 200 γλώσσες. Οι έξοδοι είναι ιδιαίτερα εντυπωσιακές, με δυνατότητα επιλογής μεταξύ DOCX, XLSX, RTF, TXT, PPTX, ODT, PDF, FB2 και EPUB.
Μπορείτε να δοκιμάσετε ακόμη και μερικά χαρακτηριστικά BETA κατά τη διάρκεια της δοκιμής σας. Η πρώτη είναι η δυνατότητα μετάφρασης του εγγράφου σας σε άλλη γλώσσα. Το άλλο είναι να εξαγάγετε το έγγραφο που έχετε μετατρέψει στο λογαριασμό αποθήκευσης του cloud, είτε πρόκειται για το Dropbox, το Google Drive, το Evernote, το Microsoft OneDrive ή το Box.
Βασικό έγγραφο στο DOCX
Τα συνολικά αποτελέσματα ήταν καλά, αλλά δεν είναι εκπληκτικά, δεδομένου ότι πρόκειται για προϊόν υψηλής ποιότητας. Πολλαπλά κόμματα και περιόδους ανταλλάχθηκαν γύρω, πολλά ανεστραμμένα κόμματα αντικαταστάθηκαν με ένα αστέρι, λείπουν δυο κεφαλαία γράμματα και μια λέξη (literalist) γράφτηκε λανθασμένα.
Σύνθετο έγγραφο στο DOCX
Μόλις μετατραπούν υπήρχαν πολύ λίγα λάθη στο κείμενο μέσα στο έγγραφο (εκτός από το OCR που αγωνίζεται με τη γραμματοσειρά αυτής της συνταγής πάλι!), Αλλά η μορφοποίηση άφησε πολλά να είναι επιθυμητό.
Οι τρεις στήλες ανέλαβαν κάπως δύο σελίδες, με την κεντρική στήλη να εμφανίζεται μόνο στη δεύτερη σελίδα. Εάν θελήσατε να κάνετε οτιδήποτε με αυτό το μετατρεπόμενο έγγραφο, καταλήγετε να τραβάτε τα μαλλιά σας έξω.
Βασικό έγγραφο σε μορφή PDF
Κατά την εξέταση του PDF που μετατράπηκε, δεν βρήκα καθόλου λάθος. Ίσως βρήκαμε πού υπερέχει η ABBYY. Φανταστικά αποτελέσματα.
Σύνθετο έγγραφο σε μορφή PDF
Και πάλι, δεν μπορώ να βρω λάθη σε αυτό το αρχείο που μετατράπηκε. Το ABBYY γνωρίζει σαφώς πώς να μετατρέψει σε PDF εξαιρετικά καλά.
Ετυμηγορία
Εάν είστε χαρούμενοι που πληρώνετε μερικά δολάρια, η μετατροπή σε PDF φαίνεται να λειτουργεί φαινομενικά καλά με αυτήν την υπηρεσία και η δυνατότητα συγχρονισμού των μετατρεπόμενων αρχείων στο cloud storage σας είναι ιδιαίτερα χρήσιμη αν σαρώσετε ένα μεγάλο όγκο εγγράφων. Όπως και με τις άλλες επιλογές, όμως, η ABBYY δεν έχει καταλάβει πώς να μετατρέψει άψογα τα έγγραφα σε DOC για εύκολη επεξεργασία.
Το τελικό αποτέλεσμα
Αν, όπως οι περισσότεροι άνθρωποι, απλώς ψάχνετε να σαρώσετε μερικά άρθρα περιοδικών και μερικούς λογαριασμούς νοικοκυριών, δεν θα χρειαστεί να επεξεργαστείτε τα έγγραφα αυτά. Ως εκ τούτου, η μετατροπή απευθείας σε PDF θα είναι κατάλληλη για εσάς, επειδή θα μπορείτε να αναζητήσετε τα έγγραφα αυτά. Για αυτό, το Free Online OCR ήταν σίγουρα το καλύτερο δωρεάν εργαλείο που δοκιμάσαμε. Τούτου λεχθέντος, εάν είστε διατεθειμένοι να πληρώσετε 5 € ανά μήνα για σχεδόν τέλεια, το FineReader Online της ABBYY ήταν λίγο πιο ακριβές.
Όταν πρόκειται να μετατρέψουμε τα έγγραφα σε DOC, δεν καταφέραμε να βρούμε καμία λύση που να ήταν τέλεια, αλλά μακράν τα καλύτερα αποτελέσματα προήλθαν από το Online OCR. Η μετατροπή δεν ήταν τέλεια, αλλά η ακεραιότητα της διαμόρφωσης διατηρήθηκε σε μεγάλο βαθμό άθικτη και τα λάθη ήταν αμελητέα. Όταν συγκρίνουμε αυτά τα αποτελέσματα με την προσφορά "premium" από την ABBYY, δεν μπορείτε να βοηθήσετε παρά να εντυπωσιαστείτε μαζικά.
Δεν συμπεριελάβαμε τις δυνατότητες OCR του Google Drive σε αυτήν την ανάρτηση. λίγο για την καθετοποίηση της Google, αλλά περισσότερο για το γεγονός ότι θέλαμε να δοκιμάσουμε μερικές άλλες δωρεάν υπηρεσίες OCR στο διαδίκτυο εκεί έξω.
Πάνω σε σας: Ποια άλλα εργαλεία OCR online θα συνιστούσατε στους αναγνώστες μας; Και που προσπαθήσατε να μην ξαναχρησιμοποιήσετε;