Arama motoru olarak Google ne yapıyor ? - Text Mining on Web
Sunday, March 1st, 2009Data mining (veri madenciliği) > Text mining (metin tabanlı veri madenciliği) > Text mining on web (Web üzerinde metin tabanlı veri madenciliği):
İşte arama motoru olarak Google bunu yapıyor, text mining on web.
Peki neden ? Neden ihtiyaç vardı “text mining on web” konusuna ?
Şimdi 90′lı yılların ortalarına gidelim. Web sayfalarının yavaştan hayatlarımıza girmeye başladığı günler. Dünyanın çeşitli yerlerinden çeşitli konularda, ilk başta onlarca yüzlerce, ve birkaç sene içinde onbinlerce yüzbinlerce web sayfası yayına girdi. Lakin, web sayfaları yaratılırken ya da web’e yerleştirilirken bir “indeksleme” yapılmıyordu. Yani, “bu web sayfası şu konularda bilgi içerir” gibisinden bir kayıt altına alınmadan yayına giriyordu. Dolasıyla web o günlerde, indesklenmemiş, yüzbinlerce web sayfasından oluşan ama hangi sayfanın içeriğinin ne ile ilgili olduğu bilinmeyen düzensiz bir yığındı.
Ve işte bu noktada “arama motorları” hayatımıza girdi. Web’i belirli aralıklarla ve kendilerine has algoritmalarla tarayan, yakaladıkları ipuçlarına göre web sayfalarını indeksleyen, yani “text mining on web” yapan sistemler. Ve Google, bu alanın ilk oyuncusu olmamasına rağmen, öne sürdüğü “text mining on web” algoritmasının ve alt yapısının başarısıyla, yani, web’de arama yapan kişilere hızlı bir şekilde etkili sonuçlar döndürebildiği için, en etkili arama motoru olarak hayatlarımızda yer edindi.

