Google arama motoru 1998 yılında hayatımıza girdi. Günümüzde internet kullanıcılarının yüzde 91’i Google arama motoru kullanmakta. Yapılan araştırmalarda günde ortalama 3,5 milyar kelime araması yapıldığını göstermekte. Başka bir deyişle saniyede 90 bin arama sorgusu işlemekte. Bu süre boyunca tüm dünyada kaç kere arama yapıldığını hayal edin. İnanılmaz değil mi? Peki arama yaptığımızda arka planda neler oluyor bakalım.
Google bir kelime veya cümle aratımı yaptığımızda karşımıza çıkan sonuçlar web siteleri değil web indeksleridir. Arama sonuçları Google'ın spider(örümcek) adını verdiği bir yazılım sayesinde karşımıza çıkıyor. Google Arama Motorunun kullandığı veritabanını geliştirmek, belirlenen kurallar bütünü ile yeni web sitelerini ya da güncellenen web sitelerini veritabanına kaydeden bot yazılımı, nihayetinde bir robot yazılımıdır. Spider sitenin kalite puanını, site içerisinde yer alan çeşitli görseller, yazı içerikleri gibi verileri tüm etkenleri ile birlikte sınıflandırarak veritabanına kaydeder. Tüm verileri sınıflandıran spider web sitenin SERP (Search Engine Result Page) yani arama motoru sonuç sayfasında yer almasına olanak sağlar.
Bu spider’lar ilk etapta birkaç web sitesine gidiyor ve sayfaları getiriyor. Gittiği sayfalarda adeta zincirleme bir reaksiyon başlayarak sayfalardaki diğer bağlantıları takip ederek bağlantıların gösterdiği sayfalara yönlendiriliyor. Yönlendiği sayfaları getirir ve tekrardan bu sayfalardaki bağlantılara bakarak spider yine yollara düşer. Gittiği bağlantıda bulduğu sayfaları getirir. Bu sayede çok büyük bir ağ oluşuyor ve sonucunda binlerce web sitesindeki binlerce sayfa toplanana kadar süreç devam eder. Spider bu şekilde binlerce web sitesini ve sayfalarını veritabanına doldurur.
Google’ın yapmış olduğu spider yazılımı sayesinde web sitelerini nasıl dolaştığını ve veritabanına eklediğini öğrenmiş olduk. Şimdi ise bu web sitelerini karşımıza nasıl getiriyor ona bakalım.
Bir örnek ile arama motoru sonuçları nasıl geliyor bir bakalım. Arama çubuğuna "Türkiye'nin yüzölçümü" yazalım ve arama butonuna tıklayalım. İşte başlıyoruz…
Spider yazılımı işe koyuluyor, veritabanında bulunan web siteleri ve sayfalarını yazdığımız kelimelerle eşleşen bir şey bulmak için sayfaları tek tek taramaya başlıyor. Binlerce siteden sonuçlar gelmeye başlıyor, bu kadar sonuç içinde spider nasıl boğulmuyor? Bulmak istediğimiz sonucu bize göstermek için nasıl karar veriyor?
Sayfalara tek tek soru sorarak aradığımız kelimeler sayfalarda ne kadar sıklıkla geçiyor? Kelimelerimiz sayfa başlıklarında yer almış mı? Sayfa URL ile aradığımız kelime beraber kullanılmış mı? Sayfada arama yaptığımız kelimelerin eş anlamlıları yer alıyor mu? Taradığı web sitelerinin ve sayfalarının kalite puanı yüksek mi yoksa düşük mü? Ya da spam içeren bir web sitesi mi? Aslında yazılım arama sonucuna en uygun sonuçları ortaya çıkarmak web sitesini ve sayfaları detaylı sorguluyor.
Tüm etkenler bir araya geldikten, arama butonuna tıkladıktan sadece yarım saniye içinde sonuçlar karşınızda. İnanılmaz öyle değil mi?
Bu arada unutmadan, Türkiye'nin yüzölçümü 783.562 km²'dir.