Πώς λειτουργούν οι μηχανές αναζήτησης;

Για πολλούς ανθρώπους, το Google είναι το Διαδίκτυο. Είναι αναμφισβήτητα η πιο σημαντική εφεύρεση από το ίδιο το Διαδίκτυο. Και ενώ οι μηχανές αναζήτησης έχουν αλλάξει πολύ από τότε, οι βασικές αρχές παραμένουν οι ίδιες.

Για πολλούς ανθρώπους, το Google είναι το Διαδίκτυο.  Είναι αναμφισβήτητα η πιο σημαντική εφεύρεση από το ίδιο το Διαδίκτυο.  Και ενώ οι μηχανές αναζήτησης έχουν αλλάξει πολύ από τότε, οι βασικές αρχές παραμένουν οι ίδιες.
Διαφήμιση

Το άρθρο ενημερώθηκε από τον Joel Lee στις 10/10/2017

Ξεκλειδώστε το φύλλο εξαπάτησης "Κορυφαία συντομεύσεις πληκτρολογίου αναζήτησης Google" τώρα!

Αυτό θα σας υπογράψει στο newsletter μας

Εισαγάγετε το Email σας Ξεκλειδώστε Διαβάστε την πολιτική απορρήτου μας

Για πολλούς, το Google είναι το Διαδίκτυο. Είναι το σημείο εκκίνησης για την εξεύρεση νέων ιστοτόπων και είναι αναμφίβολα η πιο σημαντική εφεύρεση από το ίδιο το Διαδίκτυο. Χωρίς μηχανές αναζήτησης, το νέο περιεχόμενο ιστού θα ήταν απρόσιτο για τις μάζες.

Αλλά ξέρετε πώς λειτουργούν οι μηχανές αναζήτησης; Κάθε μηχανή αναζήτησης έχει τρεις κύριες λειτουργίες: ανίχνευση (για ανακαλύψεις περιεχομένου), ευρετηρίαση (για παρακολούθηση και αποθήκευση περιεχομένου) και ανάκτηση (για ανάκτηση σχετικού περιεχομένου όταν οι χρήστες κάνουν αναζήτηση στην μηχανή αναζήτησης).

Περνώντας

Η ανίχνευση είναι όπου αρχίζει όλα: η απόκτηση δεδομένων σχετικά με έναν ιστότοπο.

Αυτό περιλαμβάνει τη σάρωση ιστότοπων και τη συλλογή λεπτομερειών σχετικά με κάθε σελίδα: τίτλους, εικόνες, λέξεις-κλειδιά, άλλες συνδεδεμένες σελίδες κλπ. Διαφορετικά προγράμματα ανίχνευσης μπορούν επίσης να αναζητήσουν διαφορετικές λεπτομέρειες, όπως διατάξεις σελίδας, τοποθεσίες διαφημίσεων, σύνδεσμοι κτλ.

Πώς όμως ανιχνεύεται ένας ιστότοπος; Ένα αυτοματοποιημένο bot (που ονομάζεται "spider") επισκέπτεται σελίδα μετά τη σελίδα όσο το δυνατόν γρηγορότερα, χρησιμοποιώντας συνδέσμους σελίδων για να βρείτε πού να πάτε στη συνέχεια. Ακόμα και στις πρώτες μέρες, οι αράχνες της Google μπορούσαν να διαβάσουν αρκετές εκατοντάδες σελίδες ανά δευτερόλεπτο. Σήμερα, είναι στις χιλιάδες.

Πώς λειτουργούν οι μηχανές αναζήτησης; διαγράμματος περιηγητή ιστού

Όταν ένας ανιχνευτής ιστού επισκέπτεται μια σελίδα, συλλέγει κάθε σύνδεσμο στη σελίδα και τα προσθέτει στη λίστα των επόμενων σελίδων που θα επισκεφθεί. Πηγαίνει στην επόμενη σελίδα στη λίστα, συλλέγει τους συνδέσμους σε αυτή τη σελίδα και επαναλαμβάνει. Οι ανιχνευτές ιστού επανεξετάζουν επίσης παλιές σελίδες μια φορά σε μια στιγμή για να δουν αν συνέβη οποιαδήποτε αλλαγή.

Αυτό σημαίνει ότι οποιοσδήποτε ιστότοπος που συνδέεται από έναν ευρετήριο ιστότοπου θα ανιχνευθεί τελικά. Ορισμένες τοποθεσίες ανιχνεύονται συχνότερα και μερικές ανιχνεύονται σε μεγαλύτερα βάθη, αλλά μερικές φορές ένας ανιχνευτής μπορεί να εγκαταλείψει αν η ιεραρχία σελίδας ενός ιστότοπου είναι υπερβολικά περίπλοκη.

Ένας τρόπος για να κατανοήσετε πώς λειτουργεί ένας ανιχνευτής ιστού είναι να δημιουργήσετε τον εαυτό σας. Έχουμε γράψει ένα σεμινάριο για τη δημιουργία ενός βασικού ανιχνευτή ιστού στην PHP, οπότε ελέγξτε το αν έχετε κάποια εμπειρία προγραμματισμού.

Πώς λειτουργούν οι μηχανές αναζήτησης; αναζήτηση Google σε tablet

Σημειώστε ότι οι σελίδες μπορούν να επισημανθούν ως "noindex", που είναι σαν να ζητούμε από τις μηχανές αναζήτησης να παρακάμψουν την ευρετηρίασή τους. Τα μη ευρετηριασμένα τμήματα του Διαδικτύου είναι γνωστά ως ο "βαθύς ιστός". Τι είναι το Deep Web; Είναι πιο σημαντικό από ό, τι νομίζετε τι είναι ο βαθύς ιστός; Είναι πιο σημαντικό από ό, τι νομίζετε Ο βαθύς ιστός και ο σκοτεινός ιστός ακούγονται τόσο τρομακτικοί και κακοί, αλλά οι κίνδυνοι έχουν υπερδιπλασιαστεί. Εδώ είναι τι στην πραγματικότητα και πώς μπορείτε να έχετε πρόσβαση και εσείς οι ίδιοι! Διαβάστε περισσότερα και ορισμένοι ιστότοποι, όπως αυτοί που φιλοξενούνται στο δίκτυο TOR, δεν μπορούν να αναπροσαρμόζονται από τις μηχανές αναζήτησης. Τι είναι η διαδρομή με κρεμμύδι, ακριβώς; [Το MakeUseOf εξηγεί] Τι είναι το σκοινί του κρεμμυδιού, ακριβώς; [Η MakeUseOf εξηγεί] το ιδιωτικό απόρρητο στο Διαδίκτυο Η ανωνυμία ήταν ένα από τα μεγαλύτερα χαρακτηριστικά του Διαδικτύου στη νεολαία του τα χειρότερα χαρακτηριστικά του, ανάλογα με το ποιος ρωτάτε ... Αφήνοντας κατά μέρος τα είδη των προβλημάτων που αναδύονται ... Διαβάστε περισσότερα)

Ευρετηρίαση

Η ευρετηρίαση είναι όταν τα δεδομένα από μια ανίχνευση υποβάλλονται σε επεξεργασία και τοποθετούνται σε μια βάση δεδομένων.

Φανταστείτε να δημιουργήσετε μια λίστα με όλα τα βιβλία που έχετε, τους εκδότες τους, τους συγγραφείς, τα είδη τους, τις σελίδες τους, κλπ. Η ανίχνευση είναι όταν χτενίζετε κάθε βιβλίο ενώ η ευρετηρίαση είναι όταν τα καταγράφετε στη λίστα σας.

Τώρα φανταστείτε ότι δεν είναι μόνο ένα δωμάτιο γεμάτο βιβλία, αλλά κάθε βιβλιοθήκη στον κόσμο. Πρόκειται για μια έκδοση μικρής κλίμακας για το τι κάνει η Google, η οποία αποθηκεύει όλα αυτά τα δεδομένα σε τεράστια κέντρα δεδομένων με χιλιάδες μονάδες δίσκου petabytes. Μεγέθη μνήμης Επεξήγηση - Gigabytes, Terabytes & Petabytes σε Όρους Layman Επεξήγηση μεγεθών μνήμης - Gigabytes, Terabytes & Petabytes Όροι Layer Είναι εύκολο να δούμε ότι 500GB είναι πάνω από 100GB. Αλλά πώς συγκρίνουν τα διαφορετικά μεγέθη; Τι είναι ένα gigabyte σε ένα terabyte; Πού χωράει ένα petabyte; Ας ξεκαθαρίσουμε! Διαβάστε περισσότερα .

Ακολουθεί μια ματιά σε ένα από τα κέντρα δεδομένων αναζήτησης της Google:

Πώς λειτουργούν οι μηχανές αναζήτησης; κέντρα δεδομένων αναζήτησης Google
Image Credit: Google

Ανάκτηση και κατάταξη

Η ανάκτηση είναι όταν η μηχανή αναζήτησης επεξεργάζεται το ερώτημα αναζήτησης και επιστρέφει τις πιο συναφείς σελίδες που αντιστοιχούν στο ερώτημά σας.

Οι περισσότερες μηχανές αναζήτησης διαφοροποιούνται μέσω των μεθόδων ανάκτησης: χρησιμοποιούν διαφορετικά κριτήρια για να επιλέξουν ποιες σελίδες ταιριάζουν καλύτερα με αυτό που θέλετε να βρείτε. Αυτός είναι ο λόγος για τον οποίο τα αποτελέσματα αναζήτησης διαφέρουν μεταξύ της Google και του Bing και γιατί ο Wolfram Alpha είναι τόσο μοναδικά χρήσιμος 10 Cool Usages Of Wolfram Alpha Εάν διαβάζετε και γράφετε στην αγγλική γλώσσα 10 Cool Uses Of Wolfram Alpha Εάν διαβάσετε και γράψετε στην αγγλική γλώσσα με αρκετό καιρό να κλείσω το κεφάλι μου γύρω από το Wolfram Alpha και τα ερωτήματα που χρησιμοποιεί για να βγάλει τα αποτελέσματα αυτά. Πρέπει να βουτήξετε βαθιά μέσα στο Wolfram Alpha για να το εκμεταλλευτείτε πραγματικά για να ... Διαβάστε περισσότερα.

Οι αλγόριθμοι ταξινόμησης ελέγχουν το ερώτημα αναζήτησης με δισεκατομμύρια σελίδες για να προσδιορίσουν τη συνάφεια κάθε ατόμου. Οι εταιρείες φυλάσσουν τους αλγόριθμους κατάταξης ως κατοχυρωμένα με δίπλωμα ευρεσιτεχνίας μυστικά της βιομηχανίας λόγω της πολυπλοκότητας τους Ένας καλύτερος αλγόριθμος μεταφράζεται σε μια καλύτερη εμπειρία αναζήτησης.

Επίσης, δεν θέλουν οι δημιουργοί ιστού να παίζουν το σύστημα και να ανεβαίνουν άδικα στις κορυφές των αποτελεσμάτων αναζήτησης. Εάν η εσωτερική μεθοδολογία μιας μηχανής αναζήτησης έχει βγει ποτέ, όλα τα είδη των ανθρώπων σίγουρα θα εκμεταλλευτούσαν αυτή τη γνώση σε βάρος των ερευνητών όπως εσείς και εγώ.

Πώς λειτουργούν οι μηχανές αναζήτησης; pen html μηχανή αναζήτησης meta
Image Credit: φωτοβολίδες μέσω του Shutterstock

Η εκμετάλλευση της μηχανής αναζήτησης είναι βέβαια δυνατή, αλλά δεν είναι τόσο εύκολη πια.

Αρχικά, οι μηχανές αναζήτησης ταξινομούν ιστότοπους ανάλογα με τη συχνότητα εμφάνισης λέξεων-κλειδιών σε μια σελίδα, η οποία οδήγησε σε "πλήρωση λέξεων-κλειδιών" - γεμίζοντας σελίδες με λέξεις-κλειδιά βαριές ανοησίες.

Στη συνέχεια ήρθε η έννοια της σημασίας συνδέσμου: οι μηχανές αναζήτησης αξιολόγησαν ιστότοπους με πολλές εισερχόμενες συνδέσεις επειδή ερμήνευσαν τη δημοτικότητα του ιστότοπου ως σχετικότητα. Αλλά αυτό οδήγησε στη σύνδεση ανεπιθύμητων μηνυμάτων σε όλο τον ιστό. Σήμερα, οι μηχανές αναζήτησης βαρύνουν τους συνδέσμους ανάλογα με την "αρχή" του συνδέσμου. Οι μηχανές αναζήτησης δίνουν μεγαλύτερη αξία στους συνδέσμους από μια κυβερνητική υπηρεσία απ ​​'ότι οι σύνδεσμοι από έναν κατάλογο συνδέσμων.

Σήμερα, οι αλγόριθμοι κατάταξης περιβάλλεται σε περισσότερο μυστήριο από ποτέ, και «βελτιστοποίηση μηχανών αναζήτησης» Demystify SEO: 5 Οδηγούς βελτιστοποίησης μηχανών αναζήτησης που σας βοηθούν να ξεκινήσετε Demystify SEO: 5 Οδηγούς βελτιστοποίησης μηχανών αναζήτησης που σας βοηθούν να ξεκινήσετε Μάθηση μηχανών αναζήτησης παίρνει γνώση, εμπειρία, και πολλές δοκιμές και λάθη. Μπορείτε να ξεκινήσετε την εκμάθηση των βασικών στοιχείων και να αποφύγετε τα κοινά λάθη SEO εύκολα με τη βοήθεια πολλών οδηγών SEO που διατίθενται στον Ιστό. Διαβάστε περισσότερα δεν είναι τόσο σημαντικό. Οι καλές ταξινομήσεις μηχανών αναζήτησης προέρχονται από υψηλής ποιότητας περιεχόμενο και από εξαιρετικές εμπειρίες χρηστών.

Τι είναι Next για τις Μηχανές Αναζήτησης;

Αχ, τώρα υπάρχει μια ενδιαφέρουσα ερώτηση. Η απάντηση είναι "σημασιολογία": η έννοια του περιεχομένου της σελίδας. Μπορείτε να διαβάσετε περισσότερα σχετικά με την επισκόπηση της σημασιολογικής σήμανσης και του μελλοντικού αντικτύπου της. Τι σημασιολογική σήμανση είναι & πώς θα αλλάξει το Internet για πάντα [Τεχνολογία εξηγείται] Τι σημασιολογική σήμανση είναι & πώς θα αλλάξει το Internet για πάντα [Τεχνολογία Επεξήγηση] Διαβάστε περισσότερα.

Αλλά εδώ είναι η ουσία της.

Αυτή τη στιγμή, μπορείτε να αναζητήσετε "μπισκότα χωρίς γλουτένη", αλλά τα αποτελέσματα ενδέχεται να επιστρέψουν συνταγές για cookies χωρίς γλουτένη. Αντ 'αυτού, μπορείτε να βρείτε κανονικές συνταγές μπισκότων που λένε "Αυτή η συνταγή δεν είναι χωρίς γλουτένη". Έχει τις σωστές λέξεις-κλειδιά, αλλά το λάθος νόημα.

Με τη σημασιολογία, μπορείτε να αναζητήσετε συνταγές μπισκότων και στη συνέχεια να αφαιρέσετε ορισμένα συστατικά: αλεύρι, ξηροί καρποί κ.λπ. Μπορείτε επίσης να περιορίσετε τα αποτελέσματα σε μόνο τις συνταγές με χρόνο προετοιμασίας μικρότερο από 30 λεπτά και να δείτε βαθμολογίες 4/5 ή μεγαλύτερες. Αυτό θα ήταν δροσερό, σωστά; Εκεί κατευθυνόμαστε!

Ακόμα σύγχυση για το πώς λειτουργούν οι μηχανές αναζήτησης; Δείτε πώς εξηγεί η Google τη διαδικασία:

Αν βρήκατε αυτό το ενδιαφέρον, μπορείτε επίσης να μάθετε πώς λειτουργούν οι μηχανές αναζήτησης εικόνων .

Image Credit: prykhodov / Depositphotos

In this article