Site iconBeytullah Güneş

Semantik Aramanın Bir Parçası Olarak Sorgu Gevşetme ve Kapsam Belirleme

Doğru arama sorgusu Goldilocks tarzı bir çabadır: Sonuç alamayacak kadar spesifik değil ve çok fazla sonuç elde edecek kadar geniş değil. Bu arada anlamsal arama, arama yapanların bir arama kutusuna ne attığını anlamakla ilgilidir. Başka bir deyişle, semantik arama ile, bizim olduğumuz yerde bizimle buluşmalarını istemek yerine, arama yapanlarla bulundukları yerde buluşuyoruz. Sorgu gevşemesini ve sorgu kapsamını girin. Arama motorları, eş anlamlılar, sorgu kelimesini kaldırma ve sorgu kapsamı belirleme gibi teknikler aracılığıyla arama yapanları hemen doğru içeriğe ulaştırır.

Aksi halde ortaya çıkmayacak ilgili bilgileri kaçırmaktan kaçınır ve alakalı olmayan bilgileri dışarıda bırakırız. Sorgu gevşemesi ve kapsam belirleme, kesinlik ve geri çağırma kavramıyla çok yakından bağlantılıdır. Kesinlik, döndürülen sonuçların ilgili olup olmadığını ölçer ve geri çağırma, ilgili sonuçların döndürülüp döndürülmediğidir. Özellikle geri çağırmayı artırmanın bir yolu, sorgu genişletmesidir.

Sorgu Genişletme

Sorgu genişletme, daha iyi sonuçlar elde etme umuduyla sorgunun neyle eşleşeceğini genişletmekle ilgilidir. Bir arama motorunun sorgu genişletmeyi uygulayabilmesinin ana nedeni, sorgu genişletmesi olmadan “temel” arama sonuçlarının arama yapan kişi için tatmin edici olmayacağına dair bazı göstergelerden kaynaklanmaktadır. Bu seride, sorguları genişletmenin bazı yollarını zaten gördük. Yazım hatası toleransı, çoğul yok sayma, kökten ayırma ve lemmatization , aramaların geri çağrılmasını artırmanın yollarıdır. Bu sorgu genişletme yöntemlerini aramanın temelleri arasında zaten gördük, ancak diğer sorgu genişletme yöntemleri de aynı derecede temeldir. 2008’de Search Engine Journal’da yayınlanan bir makale, Google‘ın sorgu genişletmeyi nasıl gerçekleştirdiğini ele alıyor ! Makale, yalnızca kökten türetme ve yazım hatası toleransı değil, aynı zamanda çeviriler, sözcük çıkarma ve eşanlamlıları da tartışıyor.

Eşanlamlılar ve Alternatifler

George Orwell’in 1984 adlı romanında Newspeak’i tanıtmasının ve bunun, yavanlık noktasına kadar tamamen kontrol edilen yaşam hakkında bir hikayede yankılanmasının bir nedeni var. Dilsel zenginlik, aynı şeyi veya neredeyse aynı şeyi farklı kelime ve ifadelerle söyleyebilme yeteneğinden kaynaklanır. “Harika”, “harika” olabilir ve “düşük maliyetli”, “ucuz”a yakın bir komşudur. Bu arada, bu farklı kelimeler, benzer öğelere en küçük şekillerde daha kesin olarak atıfta bulunmamıza yardımcı olabilir. Bu farklılıklar bazen o kadar küçüktür ki, bu hassasiyet bunun yerine kafa karışıklığına neden olur ve istediğimizi bulma olasılığını azaltır.

Sallanan sandalye isteyen bir müşteri, “sallanan sandalyeler”, “sallanan sandalyeler” veya sadece “sandalyeler” araması yapıp yapmayacağını bilemeyebilir. Eşanlamlıların ve alternatiflerin değer sağladığı yer burasıdır. Arama sonuçlarında hatırlamayı genişletmemize yardımcı olurlar. Eş anlamlılar ve alternatifler benzerdir, ancak aynı değildir. (Eş anlamlı olmadıklarını söyleyebilirsiniz.) Eş anlamlılar, aynı anlama gelen iki kelime veya kelime öbeğine atıfta bulunur. Alternatifler, bunun yerine benzer kelimelere veya ifadelere atıfta bulunur, ancak bazı derecelerde farklılıklara sahiptir.

Eş anlamlı

Çoğu zaman, eşanlamlılar, eşanlamlı listeler aracılığıyla bir arama motoruna girerler. Bu listeler, genel e-ticaret terimleri gibi önceden tanımlanmış listelerden gelebilir. Önceden tanımlanmış listelerle ilgili sorun, bir şirketin arama motorunun eşanlamlılarının mutlaka başka bir şirket için çalışmamasıdır. Hızlı: Konsol nedir? Hemen video oyunları düşünebilirsiniz, ancak başka biri bir araba veya müzik düşünebilir. Bu nedenle, şirket içinde birçok eşanlamlı liste oluşturulur. Bir arama uygulama sürecinin başlangıcında, dahili konu uzmanları, diğer kelimelerle eşanlamlı olabilecek tüm kelimeleri düşünür ve bunları arama motoru yapılandırmasına ekler.

(Gerçekte bu, genellikle ne olduğuna dair idealleştirilmiş bir görünümdür. Çoğu zaman eşanlamlı listesini oluşturan kişi bir konu uzmanı değil, bunun yerine arama motorunu uygulayan kişidir.) Genel olarak, bu ilk liste iyi bir başlangıç ​​noktası sağlayacaktır, ancak eş anlamlı sözcüklerin eksik olduğu kesindir. Arama yapanların hangi terimleri kullanacağını keşfetmenin tek gerçek yolu, aramalarına izin vermektir.

Eş Anlamlıları Keşfetmek için Analytics’i Kullanma

Yeni eş anlamlıları kullanabilecek analiz sorgularınızda çok hızlı bir şekilde göreceksiniz. Bu sorgular sıfır sonuç döndürüyor ve arama yapanların bulamayacakları bir şey aradıklarının bir işareti. Şimdi, bu sorguların tümü size yeni bir eş anlamlı vermeyecektir. Bazen, arayanlar sizde olmayan öğeleri arar. Bununla birlikte, hemen “oh, bizde bu var” ve “İnsanların böyle istediğini bilmiyordum” diye düşündüğünüz sorgular göreceksiniz. Ayrıca, bir sorgunun sonuçları döndürdüğü, ancak arama yapanın istediğini vermediği zamanlar olacaktır. “Arama ayrıntılandırmalarını” izlerseniz, bu sorgular size eş anlamlılar için fikir verebilir.

Arama ayrıntılandırmaları, arama yapanların ne zaman arama yapıp tekrar aramalarını temsil eder. Bu, arayanların ilk seferde istediklerini bulamadıkları ve daha iyisini bulmak için tekrar denedikleri anlamına gelir. “Dell dizüstü bilgisayar” arayan ve ardından “Dell dizüstü bilgisayar” diyen biri, “dizüstü bilgisayar” ve “dizüstü bilgisayar”ın ilişkili olduğunu söylüyor ancak “dizüstü bilgisayar” için yapılan arama sonuçları yetersizdi. Analitiğinizde bu eğilimleri manuel olarak aramakta yanlış bir şey olmasa da (çalışma haftasını yavaş yavaş kolaylaştırmak iyi bir etkinlik olabilir), bunları sizin için proaktif olarak sağlayan bir sisteminiz varsa çok daha üretken olursunuz.

Bazı sistemler sizin adınıza eş anlamlı sözcükleri bile uygulayabilir, ancak bu her zaman yardımcı olmaz. Bir insan, geçerli eş anlamlılar göstermeyen iyileştirmeleri tespit edebilir veya sistemin yanlış bir eşanlamlı türü önerdiğini görebilir.

Eşanlamlı Türleri

Bu doğru: Farklı eş anlamlı türleri vardır. Bu kavram ilk başta garip görünebilir, ancak muhtemelen çoğu insanın onlar hakkında düşündüğünden çok uzak değildir. “İki yönlü” eşanlamlılığın ilk türüdür. Bu eş anlamlılar birbirlerinin doğrudan yerine geçer. “Small” ve “mini” birbirlerinin iki yönlü eşanlamlılarıdır. Kelimelerin mükemmel ikameler olması gerekmez, ancak insanların birini diğeri için kullanabileceği kadar yakın olabilir. Örneğin, “ip” ve “ip” aynı şeyi tanımlamaz, ancak iki yönlü eş anlamlılara layık olacak kadar yakındır. Eşanlamlılar kullanılarak oluşturulan sorguyu düşünmek faydalı olabilir.

“Küçük peynirli pizza” sorgusunu alıp genişletirsek, sorguyu şimdi “(küçük veya mini) ve peynir ve pizza” olarak düşünebilirsiniz. “Tek yönlü” bir sonraki eşanlamlı türüdür. Bu tür genellikle daha büyük bir kategoriye ait olan bir nesneye atıfta bulunan kelimeler için kullanılır. “PlayStation” bir tür video oyunu “konsol”dur, ancak “konsol” bir “PlayStation” türü değildir. Arama yapılandırmasına tek yönlü bir eşanlamlı eklerseniz, birisi “konsol” için arama yaptığında PlayStation’ların görünmesini sağlayabilirsiniz. Neden bu iki terim arasında iki yönlü bir eşanlamlı olmasın?

Çünkü iki yönlü eş anlamlılar geçişlidir. Birinci terim ve ikinci terim iki yönlü eşanlamlıysa ve iki ve üçüncü terim iki yönlü eşanlamlıysa, o zaman bir ve üç terim iki yönlüdür. Daha doğrudan bir örnekte, iki yönlü eşanlamlı iki grup olarak “PlayStation” ve “konsol” ve “Xbox” ve “konsol”, “PlayStation” ve “Xbox”ın eşanlamlı olduğu anlamına gelir ve arama yapanlar, arama yaparken Playstation’ları görür. Xbox’lar ve tam tersi. “Alternatif düzeltmeler” son tiptir. Bunlar, kelimeler birbirinin yerine tam olarak geçmediğinde ve tam eşleşmenin alternatiften daha yüksek görünmesini istediğinizde kullanılır.

Örneğin, “pantolon”un “şort”a bir alternatif olduğunu söyleyebilirsiniz, ancak birisi “şort” kelimesini aradığında, tüm şortlar genel olarak pantolonlardan daha yüksek görünmelidir. Tüm eşanlamlı türleri, doğası gereği, hatırlamayı genişletir. Bununla birlikte, bu eşanlamlılar benzer kavramlara “işaretçiler” olduğundan, kesinlik üzerindeki etki minimum düzeyde olmalıdır. Son kullanıcı için daha iyi bir arama deneyimi beklersiniz.

Sorgu Kelimesi Kaldırma

Bazen arama yapanlar, sorgu çok spesifik olduğundan veya hiçbir kayıtta bulunmayan bir kelime kullandığından hiçbir şey döndürmeyen bir sorgu kullanır. Sorgudan bir veya iki kelimeyi kaldırın ve mükemmel şekilde iyi sonuçlar geri gelecektir. Bu, sorgu sözcüğü kaldırmayı kullanmak için harika bir zamandır.

Kelimeleri Durdur

Belki de en yaygın sorgu sözcüğü kaldırma adımı “durdurma sözcüklerini” kaldırmaktır. Durdurma sözcükleri, iletişim için anlam sağlayan ancak geri çağırmaya yardımcı olmayan çok yaygın sözcüklerdir. “The” veya “an” gibi kelimeler, aksi takdirde iyi eşleşmeleri kaldırabilir. Bu, sesli arama sorguları gibi doğal dile yönelik sorgularda daha yaygındır. Buna bir örnek, bir ürün arama motorunda “turuncu bir gömlek” aramak olabilir. Arama motoru başlık, renk ve kategori üzerinden arama yaparsa, kategori olarak “gömlek” ve renk olarak “turuncu” olan çok sayıda kayıt olabilir, ancak hiçbiri “an” kelimesini içermeyen kayıtlar olabilir.

Şimdi, gerçekten, “an” kelimesi burada herhangi bir yararlı bilgi sağlıyor mu? Hayır, öyle değil ve arama motoru kesinlik kaybetmeden onu güvenle kaldırabilir. Eşanlamlıların aksine, genellikle kendi durak kelime listelerinizi oluşturmak istemezsiniz ve çoğu arama motorunda bu listeler her dil için yerleşik olarak bulunur. Ancak, bir sorguya herhangi bir değer sağlamayan çok yaygın bir sektör teriminiz varsa, yerleşik listeyi genişletmek isteyeceğiniz zamanlar vardır.

Sonuç Yoksa Sözcükleri Kaldırma

Ardından, tüm kelimelerin değer getirdiği, ancak birlikte arandığı, sonuç getiremediği sorgular var. Arama yapanlar, daha fazla hatırlama karşılığında genellikle daha az kesin sonuçlardan memnun kalacaklardır. Bu durumlarda, sonuçları kullanıcının önüne koymak için kelimeleri kaldırmak istiyoruz. Bunu yapmanın iki ana yolu vardır: tüm sorgu sözcüklerini isteğe bağlı yapmak veya sorgudan sözcükleri kaldırmak. Sonuç yokken tüm sorgu sözcüklerini isteğe bağlı yaparsanız, diğer her şey eşit olmak üzere, daha fazla sözcükle eşleşen kayıtların daha alakalı olduğunu varsaymış olursunuz. Bir alternatif, eşleşen kayıtları bulana veya sorguda başka sözcük kalmayana kadar sorgu sözcüklerini tek tek kaldırmaktır.

İlk kelimeleri veya son kelimeleri kaldırarak başlayabilirsiniz. Son kelime kaldırma daha yaygın olma eğilimindedir. Tüm sorgu sözcüklerini isteğe bağlı yapmak ve ardından eşleşen sözcük sayısına göre sıralamak, özellikle durdurma sözcüklerinin kaldırılmasıyla eşleştirildiğinde genellikle daha iyi bir yaklaşımdır. Ancak bu, kesinlik önemli olduğunda daha az ideal bir yaklaşımdır ve gerçekten de tüm sorgu sözcükleriyle eşleşen hiçbir sonuç olmadığını göstermek istersiniz.

Bir kişi “Gucci v yaka kazak” sorgusu için Uniqlo v yaka kazakları görmekten memnun olabilirken, bir diğeri bu sonuçları tamamen alakasız olarak görebilir. Tabii ki, başka bir senaryo, sorguya gerçekte hangi kelimelerin en fazla değeri sağladığını bilmek ve bunları isteğe bağlı olarak işaretlemektir. Bu genellikle anahtar kelime tabanlı arama motorlarında görülmez, ancak duraklama kelimeleri için benzer bir yaklaşım benimseyen bazı arama motorları olmuştur. Örneğin, bazı arama motorları, ters belge sıklığını kullanarak ortak sözcükleri durak sözcük listeleri olmadan otomatik olarak indirgemeyi denedi.

Eş anlamlı kelimelerde olduğu gibi, sorgu kelimesini kaldırma, genellikle kesinlik üzerinde bir etki yaratmadan hatırlamayı genişletecektir. Durdurma sözcükleri sonuca çok fazla değer katmadığından, onları eklemeyerek iyi sonuçları kaybetmezsiniz. Benzer şekilde, hiçbir sonuç olmadığında kelimeleri kaldırmak, kesin olabilecek hiçbir sonuç olmadığı için azaltılacak bir kesinliğe sahip değildir.

Sorgu Kapsamı

Öncelikle, arama yapan kişinin aşırı hassas olduğu ve arama motorunun hatırlamayı iyileştirmek için sorguyu genişletmesi gereken durumlara baktık. Benzer şekilde, arama motorunun kullanıcının amacını anlayabileceği ve sorgu kapsamının kesinliği artırabileceği zamanlar vardır. Arama uzmanı Daniel Tunkelang, sorgu kapsamını “sorgu amacını yakalamanın en etkili yollarından biri” olarak adlandırıyor. Sorgu kapsamı belirlemede iki ana adım tanımlar. Birincisi, sorgu etiketleme, ardından kapsamın kendisidir. Sorgu etiketleme, bir sorgunun parçalarını muhtemelen ait oldukları niteliklerle tanımlar. Örneğin, “Marcia” büyük olasılıkla bir “ad” özelliğiyle eşleşirken, “The Brady Bunch” bir “başlığı göster” özelliğiyle eşleşir.

Sorgu kapsamı, bu eşlemeyi alır ve bu sorgu parçaları için öznitelik aramasını kısıtlar. Arama motoru, “ad” özelliğinin içinde “Brady”yi veya “başlığı göster” özelliğinde “Marcia”yı aramaz. Bu tür bir sorgu kapsamı, diğer özniteliklerde o metne sahip sonuçları görmeyeceğimiz için hatırlamayı azaltır. Bununla birlikte, alakasız nitelikler aramadığımız için daha yüksek kesinliğe sahip olmamız gerekir. Sonuçları bilinen öznitelik değerlerine göre filtreleyerek kesinliği daha da artırabiliriz. Arama motoru, bir sorgudaki model değerleri ve metin arasında basit bir eşleşme yapabildiğinden, bu, makine öğrenimi bile gerektirmez.

Bu, geri çağırmayı büyük ölçüde azaltır, böylece sonuçları filtreleme yerine eşleşen değerlerle artırdığımız güzel bir denge de bulabiliriz. Sorgu filtresi eşleşmesi, arama yapanın istediği şeyin bu olduğuna dair bir sinyal verdiğinden, artırılan sonuçlar en iyi eşleşen sonuçlar olma eğiliminde olacaktır. Analitik veya uygulamalı deneyiminiz aracılığıyla, aramanızın kullanıcı amacının eksik olduğunu ve aramaların “tam doğru” olmasını gerektirdiğini fark ederseniz, sorgu genişletme ve sorgu kapsamı belirleme, kesinliğinizi ve geri çağırmanızı kalibre etmenin iki yoludur. Bu yaklaşımlar, olması gereken sonuçları sağlar ve olmaması gerekenleri dışarıda bırakır.

Semantik Aramanın Bir Parçası Olarak Sorgu Gevşetme ve Kapsam Belirleme
Exit mobile version