Gizli Semantik İndeksleme (LSI): Bir Google Sıralama Faktörü mü?
Gizli anlamsal indeksleme (LSI), terimler ve kavramlar arasındaki ilişkilerdeki kalıpları tanımlamak için kullanılan bir indeksleme ve bilgi alma yöntemidir. LSI ile, bir metin koleksiyonunda (bir indeks ) semantik olarak ilişkili terimleri bulmak için matematiksel bir teknik kullanılır; burada bu ilişkiler aksi takdirde gizlenebilir (veya gizli olabilir ). Ve bu bağlamda, bu SEO için çok önemli olabilir gibi görünüyor. Sonuçta, Google muazzam bir bilgi indeksidir ve anlamsal arama ve arama sıralama algoritmasında alaka düzeyinin önemi hakkında her türlü şeyi duyuyoruz . SEO’da gizli anlamsal indeksleme hakkında söylentiler duyduysanız veya LSI anahtar kelimeleri kullanmanız tavsiye edildiyse, yalnız değilsiniz. Ancak LSI, arama sıralamanızı iyileştirmeye gerçekten yardımcı olacak mı? Hadi bir bakalım.
İddia: Bir Sıralama Faktörü Olarak Gizli Semantik İndeksleme
İddia basit: Web içeriğini LSI anahtar kelimeleri kullanarak optimize etmek, Google’ın bunu daha iyi anlamasına yardımcı olur ve daha yüksek sıralamalarla ödüllendirilirsiniz. Backlinko, LSI anahtar kelimelerini şu şekilde tanımlar:
“LSI (Gizli Semantik İndeksleme) Anahtar Kelimeleri, arama motorlarının bir web sayfasındaki içeriği derinlemesine anlamak için kullandığı kavramsal olarak ilgili terimlerdir.”
Bağlamsal olarak alakalı terimleri kullanarak, Google’ın içeriğinize ilişkin anlayışını derinleştirebilirsiniz. Veya hikaye öylece gider. Bu kaynak, LSI anahtar kelimeleri için oldukça ikna edici argümanlar sunmaya devam ediyor:
- “ Google, içeriği bu kadar derin bir düzeyde anlamak için LSI anahtar kelimelerine güveniyor .”
- “ LSI Anahtar Kelimeleri eşanlamlı DEĞİLDİR. Bunun yerine, hedef anahtar kelimenize yakından bağlı terimlerdir.”
- “ Google YALNIZCA az önce aradığınızla (arama sonuçlarında) tam olarak eşleşen terimleri kalın yazmaz. Ayrıca benzer kelimeleri ve cümleleri de koyulaştırırlar. Söylemeye gerek yok, bunlar içeriğinize serpiştirmek istediğiniz LSI anahtar kelimeleri.”
Hedef anahtar kelimenizle yakından ilgili bu “serpme” terimleri uygulaması, LSI aracılığıyla sıralamanızı iyileştirmeye yardımcı olur mu?
Bir Sıralama Faktörü Olarak LSI İçin Kanıt
Alaka düzeyi, Google’ın herhangi bir sorgu için hangi sonucun en iyi yanıt olduğunu belirlemesine yardımcı olan beş temel faktörden biri olarak tanımlanır. Google’ın Arama Nasıl Çalışır kaynağında açıkladığı gibi :
“Sorgunuzla alakalı sonuçları döndürmek için öncelikle aradığınız bilgiyi, yani sorgunuzun arkasındaki amacı belirlememiz gerekiyor.”
Niyet oluşturulduktan sonra:
“…algoritmalar, sayfanın aradığınız şeyle alakalı olabilecek bilgiler içerip içermediğini değerlendirmek için web sayfalarının içeriğini analiz eder.”
Google, alaka düzeyinin “en temel sinyalinin”, arama sorgusunda kullanılan anahtar kelimelerin sayfada görünmesi olduğunu açıklamaya devam ediyor. Bu mantıklı – arama yapan kişinin aradığı anahtar kelimeleri kullanmıyorsanız, Google sizin en iyi cevap olduğunuzu nasıl söyleyebilir? Şimdi, bazılarının LSI’ın devreye girdiğine inandığı yer burası. Anahtar kelimeleri kullanmak bir alaka işaretiyse, sadece doğru anahtar kelimeleri kullanmak daha güçlü bir sinyal olmalıdır. Bu LSI anahtar kelimelerini bulmanıza yardımcı olmak için özel olarak oluşturulmuş araçlar vardır ve bu taktiğe inananlar, onları tanımlamak için her türlü diğer anahtar kelime araştırma taktiklerini kullanmanızı önerir.
Bir Sıralama Faktörü Olarak LSI Aleyhindeki Kanıt
Google’dan John Mueller bu konuda çok net :
“…LSI anahtar kelimeleri kavramımız yok. Yani bu tamamen görmezden gelebileceğiniz bir şey.”
Google’ın algoritmanın bütünlüğünü korumak için bizi yoldan çıkaracak şeyler söyleyebileceği konusunda SEO’da sağlıklı bir şüphecilik var. O halde burayı kazalım. İlk olarak, LSI’nin ne olduğunu ve nereden geldiğini anlamak önemlidir. Gizli anlamsal yapı, 1980’lerin sonlarında bir bilgisayar sisteminde depolanan dosyalardan metinsel nesneleri almak için bir metodoloji olarak ortaya çıktı. Bu nedenle, programcılar için mevcut olan daha önceki bilgi alma (IR) kavramlarından birine bir örnektir. Bilgisayar depolama kapasitesi geliştikçe ve elektronik olarak erişilebilir veri kümeleri büyüdükçe, bu koleksiyonda tam olarak ne aradığını bulmak daha zor hale geldi. Araştırmacılar, çözmeye çalıştıkları sorunu 15 Eylül 1988’de yapılan bir patent başvurusunda şöyle anlatmışlardı:
“Çoğu sistem, veri nesneleri veya metin nesneleri arasındaki açık ilişkileri ve bağlantıları belirtmek için hala bir kullanıcıya veya bilgi sağlayıcıya ihtiyaç duyar, bu nedenle sistemlerin kullanımı veya içeriği kullanıcıya yabancı olabilecek büyük, heterojen bilgisayar bilgi dosyalarına uygulanması sıkıcı hale gelir. ”
O zamanlar IR’de anahtar kelime eşleme kullanılıyordu, ancak sınırlamaları Google ortaya çıkmadan çok önce belirgindi. Çok sık olarak, bir kişinin aradığı bilgiyi aramak için kullandığı kelimeler, indekslenen bilgilerde kullanılan kelimelerle tam olarak eşleşmedi. Bunun iki nedeni vardır:
- Eşanlamlılık : Tek bir nesneyi veya fikri tanımlamak için kullanılan çeşitli kelimeler, ilgili sonuçların kaçırılmasına neden olur.
- Çok anlamlılık : Tek bir kelimenin farklı anlamları, alakasız sonuçların alınmasına neden olur.
Bunlar bugün hala sorunlar ve bunun Google için ne kadar büyük bir baş ağrısı olduğunu hayal edebilirsiniz. Ancak, Google’ın alaka düzeyini çözmek için kullandığı metodolojiler ve teknoloji uzun zaman önce LSI’dan ayrıldı. LSI’nin yaptığı, bilgi erişimi için otomatik olarak bir “anlamsal alan” yaratmaktı. Patentin açıkladığı gibi, LSI, ilişkilendirme verilerinin bu güvenilmezliğini istatistiksel bir sorun olarak ele aldı. Bu araştırmacılar, yabani otlara fazla girmeden, sözcük kullanım verilerinden çıkarabilecekleri, altta yatan gizli bir semantik yapı olduğuna inanıyorlardı. Bunu yapmak, gizli anlamı ortaya çıkaracak ve tam bir anahtar kelime eşleşmesi olmasa bile , sistemin daha alakalı sonuçları ve yalnızca en alakalı sonuçları geri getirmesini sağlayacaktır .
İlk olarak, koleksiyon veya dizin Gizli Semantik Analize tabi tutulur. İkinci olarak, sorgu analiz edilir ve önceden işlenmiş dizin daha sonra benzerlikler için aranır. Google arama sıralama sinyali olarak LSI ile ilgili temel sorun da burada yatmaktadır. Google’ın dizini yüz milyarlarca sayfayla çok büyük ve sürekli büyüyor. Bir kullanıcı bir sorgu girdiğinde, Google en iyi yanıtı bulmak için dizinini saniyenin çok kısa bir bölümünde sıralar. Algoritmada yukarıdaki metodolojiyi kullanmak Google’ın şunları yapmasını gerektirir:
- Tüm dizini boyunca LSA kullanarak bu anlamsal alanı yeniden oluşturun .
- Sorgunun anlamsal anlamını analiz edin .
- Tüm indeksi analiz ederek oluşturulan anlamsal alanda , sorgunun anlamsal anlamı ile belgeler arasındaki tüm benzerlikleri bulun .
- Bu sonuçları sıralayın ve sıralayın .
Bu çok büyük bir basitleştirme, ancak mesele şu ki, bu ölçeklenebilir bir süreç değil. Bu, küçük bilgi koleksiyonları için çok yararlı olacaktır. Örneğin, bir şirketin bilgisayarlı teknik dokümantasyon arşivinde ilgili raporları ortaya çıkarmak için yardımcı oldu. Patent başvurusu, LSI’nin dokuz belgeden oluşan bir koleksiyon kullanarak nasıl çalıştığını göstermektedir. Bunu yapmak için tasarlandı. LSI, bilgisayarlı bilgi erişimi açısından ilkeldir.