Συμβουλές Semalt σχετικά με τον τρόπο χρήσης της βαθιάς μάθησης για τη βελτιστοποίηση της αυτοματοποιημένης ετικέτας τίτλου



Ένας γρήγορος τρόπος να ηγηθείτε στην κατάταξη SEO είναι να συμπεριλάβετε μια κορυφαία λέξη-κλειδί στην ετικέτα τίτλου τους. Και αν το σκεφτείτε για ένα λεπτό, θα συνειδητοποιήσετε ότι είναι πράγματι μια έξυπνη λύση. Εάν έχετε μια σελίδα που έχει ήδη κατατάξει για μια λέξη-κλειδί χωρίς να υπάρχει η λέξη-κλειδί στον τίτλο, φανταστείτε τη σημασία που έχει η λέξη-κλειδί στον τίτλο. Φυσικά θα λαμβάνετε ευρετήριο πιο συχνά για αυτήν τη λέξη-κλειδί. ως εκ τούτου κατατάσσεστε καλύτερα.

Τώρα, αν πάρουμε αυτήν τη λέξη-κλειδί και την προσθέσουμε στη Μετα-περιγραφή σας, θα εμφανίζονται επισημασμένα στα αποτελέσματα αναζήτησης, πράγμα που σημαίνει ότι είναι πιθανότερο να κάνουν κλικ περισσότεροι χρήστες μηχανών αναζήτησης. Αυτό, φυσικά, θα ωφελήσει τον ιστότοπο.

Φανταστείτε ότι η Semalt δούλευε σε έναν ιστότοπο με εκατοντάδες, χιλιάδες ή εκατομμύρια σελίδες. Εάν έπρεπε να το κάνουμε χειροκίνητα, θα είναι χρονοβόρο και θα γίνει πολύ ακριβό γρήγορα. Πώς λοιπόν μπορούμε να το αναλύσουμε και να βελτιστοποιήσουμε κάθε περιγραφή τίτλου και μετα-; Η λύση είναι να χρησιμοποιήσετε ένα μηχάνημα. Με τη διδασκαλία ενός μηχανήματος για την εύρεση των λέξεων-κλειδιών με την υψηλότερη κατάταξη σε κάθε σελίδα, εξοικονομούμε χρόνο και κόστος. Η χρήση ενός μηχανήματος μπορεί να έχει καλύτερη απόδοση και ταχύτερη από μια ομάδα εισαγωγής δεδομένων.

Ας επαναφέρουμε το Uber's Ludwig και το T5 της Google

Συνδυάζοντας το Uber's Ludwig και το Google T5, έχετε ένα αρκετά ισχυρό σύστημα.

Συνοπτικά, το Ludwig είναι ένα εργαλείο αυτόματης ML ανοιχτού κώδικα που επιτρέπει στους χρήστες του να εκπαιδεύουν προηγμένα μοντέλα χωρίς να χρειάζεται να γράφουν κώδικα.

Το Google T5, από την άλλη πλευρά, είναι μια ανώτερη έκδοση μοντέλων τύπου SERT. Το T5 μπορεί να συνοψίσει, να μεταφράσει, να απαντήσει σε ερωτήσεις και να ταξινομήσει τα ερωτήματα αναζήτησης καθώς και πολλές άλλες λειτουργίες. Με λίγα λόγια, είναι ένα πολύ ισχυρό μοντέλο.

Ωστόσο, δεν υπάρχει ένδειξη ότι το T5 έχει εκπαιδευτεί για βελτιστοποίηση ετικετών τίτλου. Αλλά ίσως μπορούμε να το κάνουμε και εδώ είναι πώς:
  • Παίρνουμε ένα εκπαιδευμένο σύνολο δεδομένων με παραδείγματα από:
    • Αρχικές ετικέτες τίτλου χωρίς τη λέξη-κλειδί-στόχο μας
    • Οι λέξεις-κλειδιά-στόχοι μας
    • Βελτιστοποιημένες ετικέτες τίτλου με τις λέξεις-κλειδιά στόχου
  • Ένας κωδικός συντονισμού T5 και σεμινάρια για χρήση
  • Έχετε ένα σύνολο τίτλων που δεν έχουν βελτιστοποιηθεί, ώστε να μπορούμε να δοκιμάσουμε το μοντέλο μας
Θα ξεκινήσουμε με ένα σύνολο δεδομένων που έχει ήδη δημιουργηθεί και θα παρέχουμε έναν οδηγό για τον τρόπο δημιουργίας του συνόλου δεδομένων.

Οι συγγραφείς του T5 ήταν αρκετά γενναιόδωροι για να μας παρέχουν έναν λεπτομερή φορητό υπολογιστή Google Colab, τον οποίο χρησιμοποιούμε για να βελτιώσουμε το T5. Αφού αφιερώσαμε χρόνο για να το μελετήσουμε, καταφέραμε να απαντήσουμε σε αυθαίρετες ερωτήσεις σχετικά με τα ασήμαντα. Ο φορητός υπολογιστής Colab διαθέτει επίσης οδηγίες σχετικά με τον τρόπο βελτίωσης του T5 για νέες εργασίες. Ωστόσο, όταν εξετάζετε τις αλλαγές κώδικα και την προετοιμασία δεδομένων που απαιτούνται, ανακαλύπτετε ότι απαιτεί πολλή δουλειά και ότι οι ιδέες μας μπορεί να είναι τέλειες.

Τι γίνεται όμως αν θα ήταν πιο απλό; Χάρη στην έκδοση 3 του Uber Ludwig, η οποία κυκλοφόρησε πριν από μερικούς μήνες, έχουμε έναν συνδυασμό μερικών πολύ χρήσιμων λειτουργιών. Η έκδοση 3.0 του Ludwig συνοδεύεται από:
  • Ένας μηχανισμός βελτιστοποίησης υπερπαραμέτρων που επιτυγχάνει επιπλέον απόδοση από μοντέλα.
  • Χωρίς κώδικα ενσωμάτωση με το αποθετήριο Hugging Face's Transformers. Αυτό δίνει στους χρήστες πρόσβαση σε ενημερωμένα μοντέλα όπως GPT-2, T5, DistilBERT και Electra για εργασίες επεξεργασίας φυσικής γλώσσας. Ορισμένες από αυτές τις εργασίες περιλαμβάνουν ανάλυση συναισθημάτων ταξινόμησης, αναγνώριση οντοτήτων, απάντηση ερωτήσεων και άλλα.
  • Είναι νεότερο, γρηγορότερο, αρθρωτό, και έχει ένα πιο εκτεταμένο backend που βασίζεται στο TensorFlow 2.
  • Παρέχει υποστήριξη για πολλές νέες μορφές δεδομένων όπως το Apache Parquet, το TSV και το JSON.
  • Έχει ενεργοποιημένη την πολλαπλή εγκύρωση πολλαπλής επικύρωσης.
  • Όταν ενσωματώνεται με βάρη και μεροληψίες, μπορεί να χρησιμοποιηθεί για τη διαχείριση και παρακολούθηση πολλαπλών μοντέλων εκπαιδευτικών διαδικασιών.
  • Έχει έναν νέο τύπο δεδομένων φορέα που υποστηρίζει θορυβώδεις ετικέτες. Αυτό είναι χρήσιμο εάν αντιμετωπίζουμε αδύναμες εποπτικές ρυθμίσεις.
Υπάρχουν πολλές νέες δυνατότητες, αλλά βρίσκουμε την ενσωμάτωση στους μετασχηματιστές του Hugging Face's ως ένα από τα πιο χρήσιμα χαρακτηριστικά. Το αγκάλιασμα σωληνώσεων προσώπου μπορεί να χρησιμοποιηθεί για να βελτιώσει σημαντικά τις προσπάθειες SEO για τίτλους και δημιουργία μετα-περιγραφής.

Η χρήση αγωγού είναι ιδανική για την εκτέλεση προβλέψεων σε μοντέλα που έχουν ήδη εκπαιδευτεί και είναι ήδη διαθέσιμα στο μοντέλο bub. Ωστόσο, προς το παρόν δεν υπάρχουν μοντέλα που μπορούν να κάνουν ό, τι χρειαζόμαστε να κάνουμε, οπότε συνδυάζουμε το Ludwig και το Pipeline για να δημιουργήσουμε έναν τρομερό αυτόματο τίτλο και μετα-περιγραφή για κάθε σελίδα σε έναν ιστότοπο.

Πώς χρησιμοποιούμε το Ludwig στο Fine-Tune T5;

Αυτή είναι μια σημαντική ερώτηση καθώς προσπαθούμε να δείξουμε στους πελάτες μας τι ακριβώς συμβαίνει στο παρασκήνιο της ιστοσελίδας τους. Γύρω εδώ, υπάρχει ένα κλισέ που λέει, "η χρήση του Ludwig για την προπόνηση του Τ5 είναι τόσο απλή, θα πρέπει να το κάνουμε παράνομο." Η αλήθεια είναι ότι θα χρεώναμε τους πελάτες μας πολύ υψηλότερα εάν έπρεπε να προσλάβουμε έναν μηχανικό AI για να κάνουμε το αντίστοιχο.

Εδώ, θα μάθετε πώς ρυθμίζουμε το T5.
  • Βήμα 1: Ανοίξτε ένα νέο σημειωματάριο Google Colab. Μετά από αυτό, αλλάζουμε το Runtime για χρήση GPU.
  • Πραγματοποιούμε λήψη του συνόλου δεδομένων Hootsuite που έχει ήδη συγκεντρωθεί.
  • Στη συνέχεια εγκαθιστούμε το Ludwig.
  • Μετά την εγκατάσταση, φορτώνουμε το σύνολο δεδομένων εκπαίδευσης σε ένα πλαίσιο δεδομένων pandas και το επιθεωρούμε για να δούμε πώς φαίνεται.
  • Τότε αντιμετωπίζουμε το πιο σημαντικό εμπόδιο, το οποίο δημιουργεί το κατάλληλο αρχείο διαμόρφωσης.
Η οικοδόμηση του τέλειου συστήματος απαιτεί την τεκμηρίωση για το T5 και συνεχή δοκιμή και σφάλμα έως ότου το διορθώσουμε. (θα προχωρούσε πολύ αν μπορείτε να βρείτε τον κώδικα Python για παραγωγή εδώ.)

Βεβαιωθείτε ότι έχετε ελέγξει τα λεξικά των δυνατοτήτων εισαγωγής και εξόδου και βεβαιωθείτε ότι έχετε επιλέξει σωστά τις ρυθμίσεις σας. Εάν γίνει σωστά, το Ludwig θα αρχίσει να χρησιμοποιεί το «t5-small» ως το τρέχον μοντέλο. Για μεγαλύτερα μοντέλα T5, είναι πιο εύκολο να αλλάξετε τον κόμβο μοντέλου και ενδεχομένως να βελτιώσετε την παραγωγή του.

Αφού εκπαιδεύσουμε ένα μοντέλο για αρκετές ώρες, αρχίζουμε να έχουμε εντυπωσιακή ακρίβεια επικύρωσης.

Είναι σημαντικό να σημειώσετε ότι το Ludwig επιλέγει αυτόματα άλλες κρίσιμες μετρήσεις δημιουργίας κειμένου, κυρίως αμηχανία και απόσταση επεξεργασίας. Αυτοί είναι και οι δύο χαμηλοί αριθμοί που ταιριάζουν σωστά για εμάς.

Πώς χρησιμοποιούμε τα εκπαιδευμένα μοντέλα μας για τη βελτιστοποίηση των τίτλων

Το να δοκιμάσουμε τα μοντέλα μας είναι το πραγματικά ενδιαφέρον μέρος.

Πρώτον, κατεβάζουμε ένα σύνολο δεδομένων δοκιμής με μη βελτιστοποιημένους τίτλους Hootsuite που παρέμειναν αόρατοι από το μοντέλο κατά την προπόνηση. Θα μπορείτε να κάνετε προεπισκόπηση του συνόλου δεδομένων χρησιμοποιώντας αυτήν την εντολή:

!κεφάλι

Hootsuite_titles_to_optimize.csv

Είναι πολύ εντυπωσιακό το γεγονός ότι οι Ludwig και T5 μπορούν να κάνουν τόσο πολύ με οποιοδήποτε μικρό σετ προπόνησης και δεν απαιτούν προηγμένο συντονισμό Hyperparameter. Η σωστή δοκιμή καταλήγει στο πώς αλληλεπιδρά με τις λέξεις-κλειδιά-στόχους μας. Πόσο καλά αναμιγνύεται;

Δημιουργία εφαρμογής βελτιστοποίησης ετικετών τίτλου με Streamlight

Οι συγγραφείς περιεχομένου θεωρούν αυτήν την εφαρμογή πιο χρήσιμη. Δεν θα ήταν εκπληκτικό να έχουμε μια απλή στη χρήση εφαρμογή που δεν απαιτεί πολλές τεχνικές γνώσεις; Λοιπόν, αυτό ακριβώς είναι το Streamlight εδώ.

Η εγκατάστασή του, καθώς και η χρήση του, είναι αρκετά απλή προς τα εμπρός. Μπορείτε να το εγκαταστήσετε χρησιμοποιώντας:

! pip install streamline

Δημιουργήσαμε μια εφαρμογή που αξιοποιεί αυτό το μοντέλο. Όταν χρειαστεί, μπορούμε να το τρέξουμε από το ίδιο μέρος όπου εκπαιδεύουμε ένα μοντέλο ή μπορούμε να κατεβάσουμε ένα ήδη εκπαιδευμένο μοντέλο στο σημείο που σκοπεύουμε να τρέξουμε το σενάριο. Έχουμε επίσης ετοιμάσει ένα αρχείο CSV με τους τίτλους και τις λέξεις-κλειδιά που ελπίζουμε να βελτιστοποιήσουμε.

Τώρα ξεκινάμε την εφαρμογή. Για να τρέξουμε το μοντέλο, πρέπει να παρέχουμε τη διαδρομή προς το αρχείο CSV, το οποίο έχει τους τίτλους και τις λέξεις-κλειδιά που ελπίζουμε να βελτιστοποιήσουμε. Τα ονόματα των στηλών CSV πρέπει να ταιριάζουν με τα ονόματα κατά την εκπαίδευση του Ludwig. Εάν το μοντέλο δεν βελτιστοποιεί όλους τους τίτλους, δεν πρέπει να πανικοβληθείτε. Το να αποκτήσετε σωστό αριθμό είναι επίσης ένα εξαιρετικό βήμα προς τα εμπρός.

Ως ειδικοί στην Python, ενθουσιάζουμε πολύ όταν δουλεύουμε με αυτό, καθώς συνήθως αντλεί το αίμα μας.

Πώς να δημιουργήσετε ένα προσαρμοσμένο σύνολο δεδομένων για εκπαίδευση

Χρησιμοποιώντας τίτλους Hootsuite, μπορούμε να εκπαιδεύσουμε μοντέλα που θα λειτουργούσαν καλά για τους πελάτες μας, αλλά ενδέχεται να είναι προεπιλεγμένα για τους ανταγωνιστές τους. Αυτός είναι ο λόγος για τον οποίο διασφαλίζουμε ότι παράγουμε το δικό μας σύνολο δεδομένων και εδώ το κάνουμε αυτό.
  • Αξιοποιούμε τα δικά μας δεδομένα από το Google Search Console ή τα Εργαλεία για Webmasters Bing.
  • Εναλλακτικά, μπορούμε επίσης να αντλήσουμε τα δεδομένα ανταγωνισμού των πελατών μας από SEMrush, Moz, Ahrefs κ.λπ.
  • Στη συνέχεια γράφουμε ένα σενάριο για ετικέτες τίτλου και στη συνέχεια χωρίζουμε τίτλους που έχουν και δεν έχουν τη λέξη-κλειδί στόχο.
  • Παίρνουμε τους τίτλους που έχουν βελτιστοποιηθεί χρησιμοποιώντας λέξεις-κλειδιά και αντικαθιστούμε τις λέξεις-κλειδιά με συνώνυμα, ή χρησιμοποιούμε άλλες μεθόδους, έτσι ώστε ο τίτλος να είναι "μη βελτιστοποιημένος".

συμπέρασμα

Semalt είναι εδώ για να σας βοηθήσει να βελτιστοποιήσετε αυτόματα τις ετικέτες τίτλου σας καθώς και τις μετα-περιγραφές. Με αυτόν τον τρόπο, μπορείτε να παραμείνετε μπροστά στο SERP. Η ανάλυση ενός ιστότοπου δεν είναι ποτέ εύκολη υπόθεση. Αυτός είναι ο λόγος για τον οποίο η εκπαίδευση μιας μηχανής για να μας βοηθήσει να το κάνουμε αυτό όχι μόνο εξοικονομεί κόστος, αλλά και εξοικονομεί χρόνο.

Στο Semalt, υπάρχουν επαγγελματίες που θα ρυθμίσουν το σύνολο δεδομένων σας, το Ludwig και το T5, έτσι ώστε να μπορείτε να συνεχίσετε να κερδίζετε πάντα.

Κάντε μας μία κλήση σήμερα.

mass gmail