TF-IDF: Dapatkah Ini Benar-Benar Membantu SEO Anda?
TF-IDF seharusnya tidak menjadi pengganti strategi pengoptimalan yang komprehensif. Pelajari bagaimana penggunaan TF-IDF dapat bermanfaat untuk SEO.
Seperti banyak konsep lain dalam SEO, TF-IDF adalah topik yang banyak diperdebatkan.
Pertama, Anda membaca bahwa TF-IDF merupakan peluru perak untuk meningkatkan peringkat konten Anda di Google.
Kemudian, Anda segera mendengar bahwa TF-IDF sangat kuno sehingga tidak layak untuk dicoba.
Kebenarannya biasanya berada di tengah-tengah.
Artikel ini akan membahas mengapa Anda tidak seharusnya mengharapkan TF-IDF untuk menggantikan strategi pengoptimalan yang komprehensif dan apa manfaat sebenarnya dari penggunaan TF-IDF untuk SEO.
TF-IDF: Binatang Apa Itu?
Untuk otak manusia, tidak perlu matematika untuk mengetahui tentang apa artikel saya ini. Ini tentang TF-IDF, bukan?
Tetapi ketika relevansi dievaluasi (dan, yang paling penting, dibandingkan untuk beberapa artikel) oleh mesin, kita membutuhkan representasi numerik untuk melihatnya:
Artikel A adalah tentang TF-IDF (berbeda dengan, katakanlah, link building).
Artikel A lebih banyak membahas tentang TF-IDF daripada artikel B.
Bisakah kita menghitung berapa kali kata kunci kita, TF-IDF, muncul di setiap dokumen?
Tidak, dengan demikian kita jelas mengabaikan ukuran dokumen.
Bisakah kita membandingkan jumlah kata kunci kita dengan jumlah total kata?
Inilah yang kami sebut dengan kepadatan kata kunci – metrik pengoptimalan konten yang banyak digunakan di masa lalu.
Namun, dengan mengandalkan kepadatan kata kunci, saya pikir kata “menjadi” (bukan “TF-IDF”) adalah kata yang paling menonjol dalam artikel ini.
Apakah ada cara untuk menyesuaikan perhitungan saya dengan fakta bahwa beberapa kata lebih sering muncul dalam percakapan secara umum?
Di sinilah TF-IDF berperan, mari kita lihat bagaimana frekuensi penggunaan “TF-IDF” di artikel ini dibandingkan dengan frekuensi penggunaan rata-rata di dokumen lain di Web.
Memajukan Bisnis Anda Dengan Pemasaran Konten
Tingkatkan visibilitas online Anda, jangkau pelanggan baru, dan dorong penjualan dengan perangkat pemasaran konten lengkap ini.
Coba Gratis
Dengan demikian, kami dapat mengurangi perhatian pada semua kata yang umum digunakan dan membedakan topik yang sangat spesifik untuk konten tertentu.
Rumus perhitungan saya terlihat seperti ini:
Atau, sederhananya (penafian: saya sengaja menyederhanakan di sini demi menyampaikan ide dasarnya), kita ambil:
Frekuensi Istilah = (jumlah istilah) / (jumlah total kata dalam dokumen)
Inverse Document Frequency = log (jumlah dokumen) / (dokumen yang mengandung kata kunci)
Ketika dikalikan dengan Inverse Document Frequency, Term Frequency menjadi lebih rendah untuk kata-kata yang umum digunakan dan lebih tinggi untuk istilah pengidentifikasi topik yang unik.
Kembali ke contoh kita, kata kerja “to be” digunakan di setiap artikel dalam bahasa Inggris. Tetapi sangat sedikit artikel yang menyebutkan “TF-IDF”, “kata kunci”, “konten”, dan subtopik penting lainnya yang saya bahas dalam artikel saya.
Jadi, TF-IDF untuk istilah-istilah ini menjadi lebih tinggi dan… voila! Mesin tahu tentang apa artikel saya.
Secara umum, TF-IDF digunakan ketika kita membutuhkan mesin untuk mengidentifikasi topik dari sekumpulan dokumen yang sangat besar. Misalnya, ini banyak diterapkan dalam sistem rekomendasi di perpustakaan digital.
Apakah Google Menggunakan TF-IDF sebagai Sinyal Peringkat?
Jawaban singkatnya adalah “tidak.”
TF-IDF disebut dalam sejumlah Paten Google sebagai sesuatu yang dapat digunakan mesin pencari untuk menghilangkan kata-kata yang tidak penting, yaitu untuk menghilangkan semua kata fungsi dalam kueri penelusuran dan konten halaman:
Namun, menggunakan mekanisme yang tepat untuk mengidentifikasi dan membandingkan relevansi ini sangat tidak mungkin.
Hanya karena sebagai contoh mekanisme pencarian leksikal, TF-IDF tidak dapat melihat lebih dari kata kunci.
Model ini menganggap kata kunci sebagai rangkaian karakter dan tidak dapat mengidentifikasi hubungan semantik di antara mereka, berbeda dengan model pencarian semantik yang kemungkinan besar digunakan oleh Google.
Dengan kata lain, TF-IDF sendiri bukanlah sinyal peringkat yang menentukan posisi halaman Anda.
Tidak ada nilai TF-IDF yang diharapkan yang harus Anda cocokkan untuk setiap kata kunci dalam konten Anda. Dan Anda sebaiknya lari dari siapa pun yang mencoba meyakinkan Anda.
Pencarian Semantik & Kejadian Bersama
Jadi, Google telah beralih ke penelusuran semantik, mencoba mencocokkan makna kueri penelusuran dengan konten yang relevan secara topikal, bukan mencocokkan kata kunci kueri dengan kata kunci yang sama pada halaman.
Dalam praktiknya, ini berarti bahwa alih-alih menghitung kata kunci itu sendiri, Google mulai menghitung kemunculan bersama, menggunakan konteks di sekitarnya untuk memahami maknanya.
Sebagai contoh, katakanlah Anda menemukan kalimat berikut ini dan Anda tidak tahu apa itu ikan trout:
Ikan trout kaya akan asam lemak omega-3.
Ikan trout memiliki daging yang lembut dan rasa yang ringan dan agak pedas.
Saat memilih ikan trout, kami memperhatikan warna merah-oranye yang jernih.
Dan Anda juga menemukan yang berikut ini. Saya berasumsi bahwa sebagian besar pembaca tahu apa itu salmon:
Salmon adalah jenis ikan yang populer dalam masakan Barat, yang cocok dengan anggur putih.
Daging salmon yang empuk bisa ditambahkan ke pasta.
Kulit salmon sangat padat nutrisi, jadi simpanlah kulitnya saat Anda memasak.
Fakta bahwa ikan trout muncul dengan kata-kata seperti omega-3