Hangi yerli arama motorlarını biliyorsunuz. İnternette bilgi arama

  • 24.05.2019

Arama motorları

Arama motorları, belirli bir konuyla ilgili veya anahtar kelimeler veya bunların kombinasyonları ile sağlanan WWW belgelerini bulmanızı sağlar. Arama motorları iki arama yöntemini işler:

· Kavramlar hiyerarşisine göre;

· Anahtar kelimelere göre.

Arama sunucuları otomatik veya manuel olarak doldurulur. Arama motorunun genellikle diğer arama motorlarına bağlantıları vardır ve kullanıcının isteği üzerine onlara bir arama isteği gönderir.

İki tür arama motoru vardır.

1. "Tam metin" arama motorları, bir web sayfasındaki her kelimeyi (durdurma kelimeleri hariç) indeksler.

2. Her sayfanın bir özetini oluşturan "Özet" arama motorları.

Web yöneticileri için, tam metin makineleri daha kullanışlıdır, çünkü bir web sayfasında görünen herhangi bir kelime, kullanıcı istekleriyle alaka düzeyini belirlemek için analiz edilir. Ancak, soyut makineler sayfaları tam metin olanlardan daha iyi indeksleyebilir. Bilgi çıkarma algoritmasına, örneğin aynı kelimeleri kullanma sıklığına bağlıdır.

Arama motorlarının temel özellikleri.

1. Arama motorunun boyutu, dizine eklenen sayfaların sayısına göre belirlenir. Ancak, herhangi bir zamanda, kullanıcı isteklerine yanıt olarak verilen bağlantılar farklı yaşlarda olabilir. Bunun olmasının nedenleri:

· Bazı arama motorları, kullanıcının isteği üzerine sayfayı hemen indeksler ve ardından henüz indekslenmemiş sayfaları indekslemeye devam eder.

· Diğerlerinin en popüler web sayfalarını dizine ekleme olasılığı daha yüksektir.

2. İndeksleme tarihi. Bazı arama motorları, belgenin dizine eklendiği tarihi gösterir. Bu, kullanıcının belgenin web'de ne zaman göründüğünü belirlemesine yardımcı olur.

3. İndeksleme derinliği, arama motorunun belirtilen sayfadan sonra kaç sayfa indeksleyeceğini gösterir. Çoğu makinenin indeksleme derinliği limiti yoktur. Tüm sayfaların dizine eklenememesinin nedenleri:

· Çerçeve yapıların yanlış kullanımı.

Normal bağlantıların kopyası olmadan bir site haritasının kullanılması

4. Çerçevelerle çalışma. Arama robotu çerçeve yapıları ile nasıl çalışacağını bilmiyorsa, indeksleme sırasında çerçeveli birçok yapı gözden kaçacaktır.

5. Bağlantıların sıklığı. Büyük arama motorları, bir belgenin popülerliğini, ne sıklıkta referans verildiğine göre belirleyebilir. Bazı makineler, bu tür verilere dayanarak, bir belgeyi indekslemeye değip değmeyeceği "sonuçlandırılır".

6. Sunucu güncelleme sıklığı. Sunucu sık sık güncellenirse, arama motoru onu daha sık yeniden dizine ekler.

7. İndekslemenin kontrolü. Arama motorunun ne şekilde kontrol edilebileceğini gösterir.

8 yönlendirme. Bazı siteler, ziyaretçileri bir sunucudan diğerine yönlendirir ve bu parametre, bunun bulunan belgelerle nasıl ilişkilendirileceğini gösterir.

9. Kelimeleri durdurun. Bazı arama motorları, belirli kelimeleri dizinlerinde içermez veya bu kelimeleri kullanıcı sorgularında yer almayabilir. Bu kelimeler genellikle edat veya yaygın olarak kullanılan kelimeler olarak kabul edilir.

10. Spam cezaları. İstenmeyen postaları engelleme yeteneği.

11. Eski verilerin silinmesi. Sunucu kapatıldığında veya başka bir adrese taşındığında web yöneticisinin eylemlerini belirleyen bir parametre.

Arama motorlarına örnekler.

1. Altavista. Sistem Aralık 1995'te açılmıştır. DEC şirketine aittir. 1996 yılından beri Yahoo ile çalışmaktadır. AltaVista, özel aramalar için en iyi seçimdir ... Ancak sonuçları kategoriye göre sıralamakçukurlar yürütülmez ve sağlanan bilgileri manuel olarak gözden geçirmeniz gerekir. AltaVista, etkin nokta listelerini, haberleri veya diğer içerik arama özelliklerini almak için bir araç sağlamaz.

2. Aramayı Heyecanlandırın. 1995'in sonunda piyasaya sürüldü. Eylül 1996 - WebCrawler tarafından satın alındı. Bu düğümün güçlü bir arama kürkü varnizm, otomatik olarak özelleştirme yeteneğisağlanan bilgiler ve derlenen niteliklerdüğüm kümesini tanımlamak için kalifiye personel tarafından. Heyecanlandırmak diğer arama sitelerinden farklıdır.haber servislerini aramanıza ve incelemeler yayınlamanıza olanak tanırİnternet sayfaları. Arama motoru araçları kullanırstandart anahtar kelime arama ve buluşsaliçerik arama yöntemleri. Bu kombinasyon sayesinde,anlamla eşleşen sayfaları bulabilirsiniz Ağ, kullanıcı tanımlı bir anahtar içermiyorlarsa kelimeler çıktı. Excite'ın dezavantajı biraz kaotik bir arayüz.

3.HotBot. Mayıs 1996'da piyasaya sürüldü. Wired'a aittir. Berkeley Inktomi arama motoru teknolojisine dayanmaktadır. HotBot, tam metin dizinli bir belge veritabanıdır ve Web'deki en kapsamlı arama motorlarından biridir. Herhangi bir bölge veya Web sitesindeki boolean arama ve arama kısıtlamaları, kullanıcının gereksiz bilgileri filtrelerken ihtiyaç duyduğu bilgileri bulmasına yardımcı olur. HotBot, açılır listelerden gerekli arama parametrelerini seçme olanağı sağlar.

4.Bilgi Arama. 1995'ten önce piyasaya sürüldü ve kolayca erişilebilir. Şu anda yaklaşık 50 milyon URL içeriyor. Infoseek iyi tasarlanmış bir arayüze ve mükemmel arama araçlarına sahiptir. Sorgulara verilen yanıtların çoğuna "ilgili konular" bağlantıları eşlik eder ve her yanıtı "benzer sayfalar" bağlantıları izler. Tam metinle indekslenen sayfaların arama motoru veritabanı. Yanıtlar iki göstergeye göre sıralanır: sayfada bir kelimenin veya kelime öbeğinin görülme sıklığı tsakh'ın yanı sıra sayfalardaki kelimelerin veya kelime öbeklerinin yeri. Aranabilecek yüzlerce alt kategoriye sahip 12 kategoriye bölünmüş bir Web Dizini vardır. Kataloğun her sayfası, yeniden özellikli düğümler.

5. Lycos. Mayıs 1994'ten beri çalışmaktadır. Yaygın olarak bilinir ve kullanılır. Çok sayıda URL içeren bir dizin içerir. ve tam metinle indekslemenin aksine, sayfa içeriğinin istatistiksel analizi teknolojisine sahip Point arama motoru. Lycos, haberler, site incelemeleri, popüler sitelere bağlantılar, şehir haritaları ve adres bulmak için araçlar içerir. görüntüler ve ses ve video klipler. Lycos cevapları yazışma derecesine göre sıralarbirkaç kritere göre bir sorgunun sonuçları, örneğin, sayısına görelu belge ek açıklamasında bulunan arama terimleripolis, arasındaki aralıkBelgenin belirli bir cümlesinde kelimeleri yapmak, konumBelgedeki terimler.

6. Web Tarayıcı. 20 Nisan 1994'te Washington Üniversitesi projesi olarak açıldı. Web tarayıcısı fırsatlar sağlar sorguları belirtmek için sözdizimi ve geniş bir seçim karmaşık olmayan bir arayüze sahip düğümlerin ek açıklamaları.


Her yanıtın ardından WebCrawler, istekle eşleşmenin yaklaşık bir tahminini içeren küçük bir piktogramın önüne geçecektir. Coma Togo, her yanıt için kısa bir özeti, tam URL'sini, tam eşleşme puanını içeren bir sayfa görüntüler ve ayrıca sorgudaki bu yanıt, anahtar sözcükleri olarak modellenmiştir.Sorguları özelleştirmek için bir grafik arayüz Web Tarayıcı no. H e'ye izin verilirjoker karakter kullanımı ve aynı zamanda imkansızanahtar kelimelere ağırlıklar atayın.Arama alanını sınırlamanın bir yolu yokbelirli alan.

7. Yahoo. En eski Yahoo dizini 1994 yılının başlarında piyasaya sürüldü. Yaygın olarak bilinen, sıklıkla kullanılan ve en çok saygı duyulan. Mart 1996'da çocuklar için Yahooligans kataloğu yayınlandı. Yahoo bölgesel ve üst dizinleri görünür. Yahoo, abonelik tabanlıdır. İyi organize edilmiş bilgilere sahip bir siteyi bulmak için sınıflandırma sistemini kullandığından, herhangi bir Web araması için bir başlangıç ​​noktası olarak hizmet edebilir. Web içeriği, Yahoo! ana sayfasında listelenen 14 genel kategoriye ayrılmıştır. Kullanıcının isteğinin özelliklerine bağlı olarak, alt kategoriler ve düğüm listelerini tanımak için bu kategorilerle çalışmak veya tüm veritabanında belirli kelime ve terimleri aramak mümkündür. Kullanıcı ayrıca aramayı Yahoo!'nun herhangi bir bölümü veya alt bölümüyle sınırlayabilir! Düğümlerin sınıflandırılmasının insanlar tarafından yapılması ve bir bilgisayar tarafından değil, bağlantıların kalitesi genellikle çok yüksektir. Ancak, başarısızlık durumunda bir aramayı hassaslaştırmak zordur. Yahoo'ya ! arama motoru dahil AltaVista, yani aramanız Yahoo! otomatik olarak olur bir arama motoru kullanarak tekrarlama AltaVista ... Sonuçlar daha sonra şuraya aktarılır: Yahoo!. Yahoo! Usenet ve Fourl 1'de e-posta adresleri aramak için sorgular gönderme yeteneği sağlar.

Rus arama motorları şunları içerir:

1. Rambler Bu, Rusça bir arama motorudur. Rambler ana sayfasında listelenen bölümler, Rusça dilindeki Web kaynaklarını kapsar. Bir bilgi sınıflandırıcı var. Çalışmak için uygun bir fırsat, her biri için en çok ziyaret edilen sitelerin bir listesini sağlamaktır. önerilen konu.

2. Aport Arama. aport sertifikalı önde gelen arama motorları arasında yer aldı Microsoft yerel arama motorları olarakRus versiyonu için sistemler Microsoft Internet Explorer. Aport'un avantajlarından biri, Rusça İnternet kaynaklarında arama yapmayı mümkün kılan sorguların ve arama sonuçlarının İngilizce-Rusça ve Rusça-İngilizce çevrimiçi çevirisidir. Rus dilini bile bilmeden. Dahası bilgi arayabilirsin cümleler için bile ifadeler kullanarakAport arama motorunun ana özellikleri arasında şunları yapabilirsiniz:şunları paylaşın:

Sorgunun ve arama sonuçlarının Rusça'dan İngilizce'ye çevirisigökyüzü dili ve tersi;

İsteğin yazım hatalarının otomatik kontrolü;

Bulunan siteler için arama sonuçlarının bilgilendirici görüntüsü;

Herhangi bir gramer biçiminde arama yeteneği;


profesyoneller için gelişmiş sorgu dili nal kullanıcılar.

Diğer arama özellikleri şunları içerir:beş ana kod sayfası desteği (farklı işletimsistemleri) Rus dili için, arama teknolojisini kullanarakkısıtlamalarımız var URL ve belgelerin tarihi, arama uygulamasıbaşlıklara, yorumlara ve başlıklara göreresimlere vb. gidin, arama parametrelerini kaydedin ve tanımlayın birleştirerek sınırlı sayıda önceki kullanıcı isteği farklı sunucularda bulunan belgenin kopyaları.

3. Liste. ru ( http://www.list.ru) Uygulanmasıyla, bu sunucunun birçokİngilizce konuşulan sistemle ortak Yahoo!. Sunucu ana sayfası, en popüler arama kategorilerine bağlantılar içerir.


Kataloğun ana kategorilerine bağlantıların listesi merkezi kısmı kaplar. Katalogda arama, sorgulama sonucunda hem tek tek siteler hem de kategoriler bulunabilecek şekilde gerçekleştirilir. Arama başarılı olursa URL, başlık, açıklama, anahtar kelimeler görüntülenir. Kullanıma izin verildi Yandex'in fotoğrafı. İLE BİRLİKTEbağlantı "Yapıkatalog "ayrı bir pencerede tam kata kategorisini açarkayıt. Değerlendirme listesinden seçilen herhangi bir alt kategoriye geçiş yapma özelliği uygulandı. Daha detaylı tematik bölümmevcut başlık, bir bağlantı listesiyle temsil edilir. Katalog bu şekilde düzenlenmiştir yapının alt seviyelerinde yer alan tüm sitelerinturlar başlıklar halinde sunulmuştur.Görüntülenen kaynak listesi alfabetik olarak sıralanmıştır, ancak şu sıralamayı seçebilirsiniz: zamana göre yeni eklemeler, geçişlere göre, kataloğa ekleme sırası,dizin ziyaretçileri arasında popülerlik.

4. Yandex'den. Yandex serisinin yazılım ürünleri, Rus dilinin morfolojisini dikkate alarak tam metin indeksleme ve metin verilerini aramak için bir dizi aracı temsil eder. Yandex, morfolojik analiz ve sentez, indeksleme ve arama modüllerinin yanı sıra belge analizörü, biçimlendirme dilleri, format dönüştürücüler, örümcek gibi bir dizi yardımcı modül içerir.

Temel kelime dağarcığına dayalı morfolojik analiz ve sentez algoritmaları, kelimeleri normalleştirebilir, yani ilk biçimlerini bulabilir ve ayrıca temel kelime dağarcığında yer almayan kelimeler için hipotezler oluşturabilir. Tam metin dizin oluşturma sistemi, kompakt bir dizin oluşturmanıza ve mantıksal operatörlere dayalı olarak hızlı bir şekilde arama yapmanıza olanak tanır.

Yandex, yerel ve küresel ağdaki metinlerle çalışmak üzere tasarlanmıştır ve ayrıca diğer sistemlere bir modül olarak bağlanabilir.

Merhaba blog sitesinin sevgili okuyucuları. , o zaman birkaç kullanıcısı kendi yer imlerine yetti. Ancak, hatırladığınız gibi, katlanarak oldu ve çok geçmeden tüm çeşitliliği içinde gezinmek daha zor hale geldi.

Ardından, yazarlarının çeşitli siteleri kategorilere eklediği ve sıraladığı dizinler (Yahu, Dmoz ve diğerleri) ortaya çıktı. Bu, küresel ağın o zamanlar henüz çok sayıda olmayan kullanıcıları için hayatı hemen kolaylaştırdı. Bu dizinlerin çoğu bugün hala hayatta.

Ancak bir süre sonra, veritabanlarının boyutu o kadar büyüdü ki, geliştiriciler önce içlerinde bir arama oluşturmayı ve ardından herkesin kullanımına sunmak için tüm İnternet içeriğini indekslemek için otomatik bir sistem oluşturmayı düşündüler.

İnternetin Rusça konuşulan bölümünün ana arama motorları

Tahmin edebileceğiniz gibi, bu fikir ezici bir başarı ile gerçekleşti, ancak her şey sadece internette kaybolmamayı başaran bir avuç seçkin şirket için iyi oldu. İlk dalgada ortaya çıkan hemen hemen tüm arama motorları artık ya ortadan kayboldu, bitki örtüsüne büründü ya da daha başarılı rakipler tarafından satın alındı.

Arama motoru çok karmaşık ve daha da önemlisi, çok kaynak yoğun bir mekanizmadır (yalnızca maddi kaynaklar değil, aynı zamanda insan kaynakları anlamına gelir). Görünüşe göre basit veya Google'ın çileci benzerinin arkasında, bu devasa yapının çalışmaya devam etmesi ve rekabetçi kalması için gerekli olan binlerce çalışan, yüz binlerce sunucu ve milyarlarca yatırım var.

Bu pazara şimdi girmek ve sıfırdan başlamak, gerçek bir iş projesinden çok bir ütopyadır. Örneğin, dünyanın en zengin şirketlerinden biri olan Microsoft, onlarca yıldır arama pazarında bir yer edinmeye çalışıyor ve ancak şimdi arama motorları Bing yavaş yavaş beklentilerini karşılamaya başlıyor. Ve ondan önce bir dizi başarısızlık ve başarısızlık vardı.

Çok fazla finansal etki olmadan bu pazara girmek hakkında ne söyleyebiliriz. Örneğin, yerli arama motorumuz Nigma'nın cephaneliğinde birçok faydalı ve yenilikçi şey var, ancak katılımları Rus pazarının liderlerinden binlerce kat daha düşük. Örneğin, Yandex'in günlük hedef kitlesine bir göz atın:

Bu bağlamda, Runet'in ve tüm İnternet'in ana (en iyi ve en başarılı) arama motorlarının listesinin zaten oluşturulduğunu ve tüm entrikanın yalnızca sonunda kimin kimi, iyi veya nasıl yiyeceği ile ilgili olduğunu varsayabiliriz. yüzdesi, hepsi hayatta kalır ve ayakta kalırsa dağıtılacaktır.

Rusya'da arama motoru pazarıçok net bir şekilde görülebilir ve burada muhtemelen iki veya üç ana oyuncu ve birkaç küçük oyuncu ayırt edilebilir. Genel olarak, Runet'te, anladığım kadarıyla, dünyadaki sadece iki ülkede kendini tekrar eden oldukça benzersiz bir durum gelişti.

2004 yılında Rusya'ya gelen arama motoru Google'ın şu ana kadar liderliği ele geçirememiş olmasından bahsediyorum. Aslında, bu dönemde Yandex'i satın almaya çalıştılar, ancak orada bir şeyler işe yaramadı ve şimdi Çek Cumhuriyeti ve Çin ile birlikte "Rusya'mız", her şeye kadir Google'ın mağlup olmasa da en azından buluştuğu yerlerdir. ciddi direniş

Aslında, aralarındaki mevcut duruma bakın Rus İnternetinin en iyi arama motorları herkes yapabilir. Bu URL'yi tarayıcınızın adres çubuğuna eklemeniz yeterli olacaktır:

Http://www.liveinternet.ru/stat/ru/searches.html?period=ay;toplam=evet

Gerçek şu ki, çoğu bunu sitelerinde kullanıyor ve bu URL, çeşitli arama motorlarından RU etki alanı bölgesine ait tüm sitelere gelen ziyaretçilerin istatistiklerini görmenizi sağlıyor.

Verilen URL'yi girdikten sonra, çok çekici ve şık olmayan, ancak konunun özünü iyi yansıtan bir resim göreceksiniz. Rusça sitelerin trafik aldığı ilk beş arama motoruna dikkat edin:

Evet, elbette, Rusça içerikli tüm kaynaklar bu bölgede yer almıyor. Ayrıca SU ve RF vardır ve COM veya NET gibi ortak alanlar Runet'e odaklanan İnternet projeleriyle doludur, ancak yine de örnek oldukça temsilidir.

Bu bağımlılık, örneğin ağdaki birinin sunumu için yaptığı gibi daha renkli bir şekilde resmileştirilebilir:

Bu özü değiştirmez. Birkaç lider ve birkaç çok, çok gecikmeli arama motoru var. Bu arada, birçoğu hakkında zaten yazdım. Bazen bir başarı hikayesine dalmak ya da tersine, bir zamanlar umut vaat eden arama motorlarının başarısızlıklarının nedenlerini araştırmak oldukça eğlencelidir.

Bu nedenle, Rusya ve bir bütün olarak Runet için önem sırasına göre, onları listeleyeceğim ve kısa özellikler vereceğim:

    Google'da arama, gezegenin birçok sakini için zaten bir ev adı haline geldi - bununla ilgili bilgiyi bağlantıdan okuyabilirsiniz. Dünyanın her yerinden, ancak kendi dilinizde cevaplar aldığınızda, bu arama motorundaki "sonuçların çevirisi" seçeneğini beğendim, ancak şimdi maalesef mevcut değil (en azından google.ru'da).

    Son zamanlarda, yayınlarının kalitesi (Arama Motoru Sonuç Sayfası) da beni şaşırttı. Şahsen, her zaman önce runet ayna arama motorunu kullanırım (vardır, buna alışkınım) ve sadece orada anlaşılır bir cevap bulamayınca Google'a dönüyorum.

    Genellikle onların yayınlanması beni mutlu etti, ancak son zamanlarda sadece beni şaşırttı - bazen bu tür saçmalıklar ortaya çıkıyor. Seo tanıtımını itibarsızlaştırmak için içeriğe dayalı reklamcılıktan ve arama sonuçlarının sürekli olarak yeniden düzenlenmesinden elde edilen geliri artırma mücadelelerinin geri tepmesi olasıdır. Her durumda, bu arama motorunun Runet'te bir rakibi var ve ne tür.

    Rus İnternetinde arama yapmak için neredeyse hiç kimsenin Go.mail.ru'ya gitmeyeceğini düşünüyorum. Bu nedenle, bu arama motorundan gelen eğlence projelerinin trafiği yüzde ondan önemli ölçüde fazla olabilir. Bu tür projelerin sahipleri bu sisteme dikkat etmelidir.

Bununla birlikte, İnternet'in Rusça konuşulan bölümünün arama motoru pazarındaki belirgin liderlere ek olarak, payları oldukça düşük olan birkaç oyuncu daha var, ancak yine de varlıklarının gerçeği onlar hakkında birkaç söz söylememizi sağlıyor. .

İkinci kademeden Runet arama motorları


İnternet çapında arama motorları

Genel olarak, tüm İnternet ölçeğinde, yalnızca bir ciddi oyuncu var - Google... Bu tartışmasız lider, ama yine de biraz rekabeti var.

Birincisi hala aynı Bingörneğin, özellikle motorunun tüm Yahu hizmetlerinde (ABD arama pazarının neredeyse üçte biri) kullanıldığını düşünürsek, Amerikan pazarında çok iyi bir konuma sahip olan .

İkincisi, Çin'den gelen kullanıcıların toplam İnternet kullanıcısı sayısındaki büyük payı nedeniyle, ana arama motorları aradı. Baidu Olympus dünyadaki yerlerin dağılımına takılıyor. 2000 yılında doğdu ve şu anda Çin'deki tüm ulusal izleyicinin yaklaşık %80'ini oluşturuyor.

Baidu hakkında daha anlaşılır bir şey söylemek zor, ancak İnternette, Üst kısmındaki yerlerin yalnızca sorguyla en alakalı siteler tarafından değil, aynı zamanda bunun için ödeme yapanlar (doğrudan arama motoruna) tarafından işgal edildiğine dair yargılar var. , ve Seo ofisine değil). Tabii ki, bu öncelikle ticari sonuçlar için geçerlidir.

Genel olarak, istatistiklere bakıldığında, Google'ın içeriğe dayalı reklamcılıktan artan kâr karşılığında arama sonuçlarını kötüleştirme fikrine neden kolayca gittiği anlaşılıyor. Aslında, çoğu durumda gidecek özel bir yerleri olmadığı için, kullanıcı karmaşasından korkmuyorlar. Bu durum biraz üzücü ama bakalım bundan sonra ne olacak.

Bu arada, optimize edicilerin ömrünü daha da karmaşık hale getirmek ve belki de bu arama motorunun kullanıcılarının huzurunu korumak için Google, son zamanlarda kullanıcının tarayıcısından arama çubuğuna istekleri aktarırken şifreleme uyguladı. Yakında, kullanıcıların Google'dan size hangi istekleri için geldiklerini ziyaretçi sayaçlarının istatistiklerinde görmek mümkün olmayacak.

Tabii ki, bu yayında dile getirilen arama motorlarına ek olarak, bin tane daha yok - bölgesel, özel, egzotik, vb. Hepsini tek bir makale çerçevesinde listelemeye ve açıklamaya çalışmak mümkün olmayacak ve muhtemelen gerekli de değil. hakkında birkaç söz söylemeyi tercih ederim bir arama motoru oluşturmak ne kadar zor ve onu güncel tutmak ne kadar kolay ve ucuz değil.

Sistemlerin ezici çoğunluğu benzer ilkelere göre çalışır (hakkında ve hakkında okuyun) ve aynı hedefi takip eder - kullanıcılara sorularına bir yanıt vermek. Ayrıca, bu cevap ilgili (soruya karşılık gelen), kapsamlı ve önemsiz olmayan ilgili (ilk tazelik) olmalıdır.

Bu sorunu çözmek o kadar kolay değil, özellikle arama motorunun milyarlarca İnternet sayfasının içeriğini anında analiz etmesi, gereksiz olanları filtrelemesi ve diğerlerinden cevapların bulunduğu bir liste (sorun) oluşturması gerekeceği düşünüldüğünde Kullanıcının sorusuna en uygun olanı ilk önce gidecek.

Bu son derece karmaşık görev, çeşitli yöntemler kullanılarak bu sayfalardan ön bilgi toplanmasıyla çözülür. indeksleme robotları... Daha önce ziyaret edilen sayfalardan bağlantılar toplar ve onlardan arama motorunun tabanına bilgi yüklerler. Metni indeksleyen botlar vardır (sonuçlarda her zaman en son verilerin sunulması için haberler ve sık güncellenen kaynaklar üzerinde yaşayan düzenli ve hızlı robotlar).

Ek olarak, görüntü indeksleyici robotları (sonraki gösterimleri için), site simgeleri, site aynaları (sonraki karşılaştırmaları ve olası yapıştırmaları için), kullanıcıların veya web yöneticileri için araçlar aracılığıyla İnternet sayfalarının çalışabilirliğini kontrol eden botlar (buradan okuyabilirsiniz) vardır. hakkında, ve) ...

İndeksleme işleminin kendisi ve müteakip indeks tabanlarını güncelleme işlemi oldukça zaman alıcıdır. Google bunu rakiplerinden çok daha hızlı yapsa da, her durumda Yandex'in bunu yapması bir veya iki hafta sürer (hakkını okuyun).

Genellikle, arama motoru bir İnternet sayfasının metin içeriğini ayrı kelimelere ayırır, bu da temel temellere yol açar, böylece daha sonra farklı morfolojik formlarda sorulan sorulara doğru cevaplar verebilirsiniz. Tüm ekstra gövde kiti, Html etiketleri, boşluklar vb. şeyler silinir ve kalan kelimeler alfabetik olarak sıralanır ve bu belgedeki konumları yanlarında gösterilir.

Bu tür shnyaga'ya ters dizin denir ve web sayfalarında değil, arama motorunun sunucularında bulunan yapılandırılmış verilerde arama yapmanızı sağlar.

Yandex'deki (çoğunlukla sadece Rusça siteleri ve biraz da Ukraynaca ve Türkçe için arama yapan) bu tür sunucuların sayısı on, hatta yüzbinlerce ve Google için (yüzlerce dilde arama yapan) - milyonlarca .

Birçok sunucunun, hem belgelerin güvenliğini artırmaya hem de istek işleme hızını artırmaya (yükü dengeleyerek) yardımcı olan kopyaları vardır. Tüm bu çiftliğin bakımını yapmanın maliyetini tahmin edin.

Kullanıcının isteği, yük dengeleyici tarafından şu anda en az yüklü olan sunucu kesimine yönlendirilecektir. Ardından arama motoru kullanıcısının isteğini gönderdiği bölgenin analizi yapılır ve morfolojik olarak ayrıştırılır. Arama çubuğuna yakın zamanda benzer bir sorgu girilmişse, sunucunun tekrar yüklenmemesi için önbellekten gelen veriler kullanıcıya kaydırılır.

İstek henüz önbelleğe alınmamışsa, arama motorunun dizin tabanının bulunduğu alana iletilir. Yanıt olarak, istekle en azından bir ilişkisi olan tüm İnternet sayfalarının bir listesini alacaksınız. Sadece doğrudan oluşumlar değil, aynı zamanda diğer morfolojik formlar, vb. bir şeyler.

Onların Sıralama ihtiyacı, ve bu aşamada algoritma (yapay zeka) devreye giriyor. Aslında, kullanıcının talebi, yorumlanması için olası tüm seçeneklerle çarpılır ve aynı anda birçok talebe cevap aranır (bazıları sıradan kullanıcılar için de mevcut olan sorgu dili operatörlerinin kullanılması nedeniyle).

Kural olarak, arama sonuçları her siteden bir sayfa (bazen daha fazla) içerir. artık çok karmaşıktır ve birçok faktörü hesaba katar. Ek olarak, bunları düzeltmek ve kullanılan, referans sitelerini manuel olarak değerlendiren, bu da algoritmanın çalışmasını bir bütün olarak ayarlamanıza izin verir.

Genel olarak, bunun karanlık bir mesele olduğu açıktır. Bunu uzun uzun konuşabiliriz ama bir arama motoru ile kullanıcı memnuniyetinin sağlandığı da anlaşılıyor, ah, ne kadar zormuş. Ve her zaman bir şeyden hoşlanmayanlar olacaktır, örneğin, siz ve ben, sevgili okuyucular.

Sana iyi şanslar! Yakında blog sitesinin sayfalarında görüşürüz

adresine giderek daha fazla video izleyebilirsiniz.
");">

ilginizi çekebilir

Yandex Kişileri - sosyal ağlarda insanlar nasıl aranır Apometer, arama sonuçlarındaki değişiklikleri ve arama motorlarının güncellemelerini izlemek için ücretsiz bir hizmettir. DuckDuckGo sizi takip etmeyen bir arama motorudur
İnternet hızı nasıl kontrol edilir - bilgisayar ve telefonda çevrimiçi bağlantı testi, SpeedTest, Yandex ve diğer sayaçlar
Yandex ve Google görsellerinin yanı sıra Tineye ve Google'da görsel dosyasına göre arama

Bu, elbette, popüler arama motorlarının listesini bitirmiyor - yüzlerce var. Ancak, bunların İngilizce sitelerle çalışmak için fazlasıyla yeterli olduğundan eminim.

Unutulmamalıdır ki yukarıda sunulan arama motorlarının neredeyse tamamı Kiril alfabesi ile çalışabilir. Ancak Rusça bilgi aramak için hala yerel arama motorlarını öneriyorum:

Başka Rusça arama motorları da var, ancak bunlar en popüler olanları, özellikle ilk ikisi.

Pirinç. 4.1. Google arama motoru

İnternette Siyah PR ile Mücadele kitabından yazar Alexander Kuzin

"Savaş" İnternet kaynaklarını teşvik etmek ve bunları içerikle doldurmak için araçlar olarak arama motorları ve kataloglar Bu bölüm, "İnternet keşfi: eylem kılavuzu" kitabından bazı materyaller kullanılarak yazılmıştır.

Blog kitabından. Oluşturun ve tanıtın yazar Yuşçuk Evgeny Vladimirovich

Blog tanıtımı ve içerikle doldurulması için araçlar olarak arama motorları ve dizinler Bu, bir blogun ilginç içerikle doldurulmasını otomatikleştirmekle, yani bir blog için materyali diğer blog yazarlarından daha hızlı nasıl bulacağınızla ilgili olacaktır. edebilecektir

İnternet İstihbaratı kitabından [Eylem Kılavuzu] yazar Yuşçuk Evgeniy Leonidovich

Arama motorlarına firma ismi ile ilgili sorguların oluşturulması

Kitaptan Bilgisayarı kendi ellerimizle monte etmek yazar Vatamanyuk Aleksandr İvanoviç

5.2. Popüler işletim sistemleri Birçok işletim sistemi vardır ve her birinin kendi yaygınlık derecesi vardır. Bazı sistemler bir ağ üzerinde çalışmak için daha uygundur, diğerleri ise performans kaybı olmadan her şeyi birleştirdikleri için özerk çalışma için daha uygundur ve

Win2K SSS kitabından (v. 6.0) yazar Shashkov Alexey

(6.10) Karışık bir ağ, netware ve NT, W2kPro ve W98 istemcileri vardır. W98 makineleri W2k makinelerine giremez. Bu sorunu çözmek için, protokolleri kullanarak IPX / SPX'i yalnızca Novell istemcisine, TCP / IP'yi yalnızca Microsoft istemcisine bağlamanız gerekir. Bu, ağ bağlantıları menüsünün özelliklerinde yapılabilir.

Kitaptan Özet, dönem ödevi, bilgisayarda diploma yazar

Arama motorları Daha spesifik ve özel bilgilerle ilgili bir malzeme seçimine ihtiyacınız varsa, arama motorlarını kullanmak daha iyidir. Arama motoru, Web'de arama yapmak için bir dizi özel programdır. Doğal dezavantajlardan yoksundurlar.

İnternet kitabından. Yeni fırsatlar. hileler ve efektler yazar Balovsyak Nadezhda Vasilyevna

Arama motorları nasıl çalışır ve doğru sorgular nasıl oluşturulur Modern arama motorları, İnternette bilgi aramak için tasarlanmış bir dizi özel programdır.Çalışma prensibi aşağıdaki gibidir: zaman zaman

Kitaptan İnternet% 100'dür. Ayrıntılı bir eğitim: bir "çaydanlık"tan bir profesyonele yazar Gladkiy Alexey Anatolievich

Popüler çevrimiçi sinema salonları Popüler ücretsiz çevrimiçi sinema salonlarından biri http://vsekino.tv adresinde bulunabilir (Şekil 7.5). Pirinç.

İnternet kitabından - kolay ve basit! yazar Aleksandrov Yegor

Popüler Dizinler Dünyanın en popüler ve eksiksiz dizini, kuşkusuz İngilizce Yahoo! (http://dir.yahoo.com) (Şek. 4.4). Pirinç. 4.4. Bağlantıların en popüler dizini Yahoo! Dizinlerin genellikle arama motorları ile birleştirildiğine dikkat edilmelidir, bu nedenle pek çoğu

Herkes için Yandex kitabından yazar Abramzon M.G.

1.11.3. Popüler gönderiler Popüler gönderilerin listesi günde bir kez güncellenir. Bu türden birkaç düzine kayıt seçilir, ancak en popüler olanlardan yalnızca birkaçı Arama bölümünün başlık sayfasına yerleştirilir. Geri kalanı Toplam kayıtlar bağlantısında görüntülenebilir.

Kitaptan İnternette herhangi bir dosya nasıl bulunur ve indirilir yazar Raitman M.A.

1.11.6. Popüler kategoriler Daha önce blog yazarlarının, hizmetlerin, en popüler yayınların derecelendirmesi hakkında konuşulduysa, şimdi kategoriler hakkında konuşacağız. Gönderilerinin kategorisi yazarları tarafından belirlenir. Nasıl, neden, neden - temaya, modaya, ruh haline bağlıdır. Yine de

Windows 7'ye Başlarken kitabından. Yeni Başlayanlar Kılavuzu. yazar Kolisnichenko Denis N.

1.11.7. Popüler haberler Yandex hizmetinin haber derecelendirmesi, diğer göstergeler arasında ayrı bir blokta vurgulanır. Haberler. Bloglarda en çok tartışılan haber budur. Popüler haberlerin listesi her 5-10 dakikada bir güncellenir. Bağlantıyı takip ederseniz

Dizüstü Bilgisayarla Tanışın kitabından yazar Zhukov Ivan

Popüler izleyiciler Dünyada kullanabileceğiniz birçok torrent izleyicisi vardır. Aşağıdakiler en popüler izleyicilerdir.? http://lostfilm.tv bir TV dizisi izleyicisidir. Kural olarak, profesyonel dublaj ve kalitede yayınlar

BT Güvenliği kitabından: Bir Şirketi Riske Atmaya Değer mi? yazar McCarthy Linda

10.2.1. Arama Motorları İnternet, zengin bir bilgi içerir. Sonuçta, herkes İnternette bir web sitesi oluşturabilir, bu nedenle her gün yeni web sitelerinin sayısı artıyor. İnternette arama yapmak için arama motorları kullanılır.Arama motoru özel bir arama motorudur.

Yazarın kitabından

Popüler İnternet Uygulamaları ICQ ICQ, merkezi bir anlık mesajlaşma hizmetidir. Hizmetin kullanıcısı (yani siz) bir istemci programıyla ("haberci" olarak adlandırılan) çalışır. Mesajlar anında iletilir. Ayrıca

Yazarın kitabından

Popüler Bugtraq Posta Listeleri Bu liste, UNIX güvenlik açıklarını, bunların nasıl kötüye kullanılabileceğini ve bunların nasıl düzeltileceğini tartışır. Amacı, sistemlerin nasıl hackleneceğini öğretmek değil, aksine, güvenlik açıklarının nasıl tespit edileceğini, bunlarla ilgili bilgilerin nasıl paylaşılacağını, nasıl yapılacağını öğretmektir.

Giriş ……………………………………………………………………… .2

1 Arama motorları: kompozisyon, fonksiyonlar, çalışma prensibi

1.1 Arama motorlarının bileşimi …………………………………. ……………… 3

1.2 Arama motorlarının özellikleri ………………………………………… ..4

1.3 Arama motorları nasıl çalışır …………………………………… ..4

2 Arama motorlarının işleyişine genel bakış

2.1 Yabancı arama motorları: bileşimi ve çalışma ilkeleri .................................. 12

2.2 Rusça arama motorları: kompozisyon ve çalışma ilkeleri .... ... ..14

Sonuç ………………………………………………………… .. …………… 16

Kullanılmış literatür listesi ………………………………… .. ………… .17

Tanıtım

Arama motorları uzun zamandır Rus İnternetinin ayrılmaz bir parçası haline geldi.Çeşitli yollarla, birincil kaynaklardan almaktan kullanıcıya bir arama seçeneği sunmaya kadar bilgi işlemenin tüm aşamalarını bağımsız olarak sağlamaları nedeniyle, genellikle aranan otonom arama sistemler .

Arama motorları artık sadece bilgi bulmak için bir araç değil, aynı zamanda iş için çekici alanları temsil eden devasa ve karmaşık mekanizmalardır.Bu sistemler, aynı zamanda algoritmada bir dereceye kadar mevcut olan bilgi seçimi ilkesinde farklılık gösterebilir. otomatik dizin tarama programı ve kayıttan sorumlu dizin çalışanları için davranış kuralları. Tipik olarak, iki ana gösterge karşılaştırılır:

ISS'nin faaliyet gösterdiği mekansal ölçek,

Ve uzmanlığı.

Arama motorlarının kullanıcılarının çoğu, arama motorlarının çalışma prensibi, kullanıcı isteklerini işleme şeması, bu sistemlerin nelerden oluştuğu ve nasıl çalıştıkları hakkında hiç düşünmedi (veya düşündü, ancak bir cevap bulamadı). Arama motorları, aracıları işletmeleri atlayan ve bir veri tabanında bilgi toplayan bir referans hizmetiyle karşılaştırılabilir. Servisle iletişime geçildiğinde bu veri tabanından bilgi döndürülür. Veritabanındaki veriler güncel değil, bu nedenle aracılar bunları periyodik olarak günceller. Bazı işletmeler kendileri hakkında veri gönderir ve aracıların kendilerine gelmesi gerekmez. Başka bir deyişle, yardım masasının iki işlevi vardır: veritabanında veri oluşturma ve sürekli güncelleme ve müşterinin isteği üzerine veritabanında bilgi arama.

1 Arama motorları: kompozisyon, fonksiyonlar, çalışma prensibi

1.1 Arama motorlarının bileşimi

Bir arama motoru, İnternet'te arama yapmak ve bir metin ifadesi (arama sorgusu) biçiminde belirtilen bir kullanıcının isteğine, alaka düzeyine göre bilgi kaynaklarına bağlantıların bir listesini yayınlayarak yanıt vermek için tasarlanmış bir yazılım ve donanım kompleksidir. (talep doğrultusunda). En büyük uluslararası arama motorları: Google, Yahoo, MSN. Rus İnternetinde bunlar Yandex, Rambler ve Aport'tur.

Benzer şekilde, bir arama motoru iki bölümden oluşur: Web sunucularını atlayan ve arama motorunun veritabanını oluşturan sözde robot (veya örümcek).

Robotun temeli esas olarak kendisi (robotun kendisi yeni kaynaklara bağlantılar bulur) ve çok daha az ölçüde, sitelerini bir arama motoruna kaydeden kaynak sahipleri tarafından oluşturulur. Veritabanını oluşturan robota (ağ aracısı, örümcek, solucan) ek olarak, bulunan bağlantıların derecesini belirleyen bir program var.

Bir arama motorunun çalışma prensibi, kullanıcının sorgu alanında belirttiği anahtar kelimeler için kendi iç kataloğunu (veritabanı) sorgulamasına ve alaka düzeyine göre sıralanmış bir bağlantı listesi üretmesine dayanır.

Belirli bir kullanıcı isteğini işlerken, arama motorunun dahili kaynaklarla çalıştığına (ve deneyimsiz kullanıcıların genellikle varsaydığı gibi Web'de bir yolculuğa çıkmadığına) ve dahili kaynakların elbette sınırlı olduğuna dikkat edilmelidir. Arama motorunun veritabanının sürekli güncellenmesine rağmen, arama motoru tüm Web belgelerini indeksleyemez: çok fazla var. Bu nedenle, aradığınız kaynağın belirli bir arama motoru tarafından bilinmeme olasılığı her zaman vardır.

1.2 Arama motorlarının özellikleri

Çalışmada, arama süreci dört aşama ile temsil edilmektedir: formülasyon (arama başlamadan önce gerçekleşir); eylem (aramayı başlatma); sonuçlara genel bir bakış (kullanıcının aramadan sonra gördüğü sonuç); ve iyileştirme (sonuçları gözden geçirdikten sonra ve aynı ihtiyacın farklı bir formülasyonu ile bir aramaya geri dönmeden önce). Daha uygun bir doğrusal olmayan bilgi alma şeması aşağıdaki aşamalardan oluşur:

Doğal dilde bilgi ihtiyaçlarının kaydedilmesi;

Ağın gerekli arama hizmetlerinin seçimi ve belirli bilgi erişim dillerinde (IPL) bilgi ihtiyaçlarının kaydının kesin olarak resmileştirilmesi;

Oluşturulan isteklerin yürütülmesi;

Alınan belgelere bağlantı listelerinin ön işlemesi ve seçimi;

İstenilen belgeler için seçilen adreslerle iletişime geçilmesi;

Bulunan belgelerin içeriğinin önizlemesi;

İlgili belgeleri daha sonra çalışmak üzere kaydetme;

Talebi genişletmek için ilgili belgelerden bağlantıların çıkarılması;

Kaydedilen tüm belge dizisinin incelenmesi;

Bilgi ihtiyacı tam olarak karşılanmıyorsa ilk aşamaya dönülür.

1.3 Arama motorları nasıl çalışır?

Herhangi bir arama motorunun görevi, insanlara aradıkları bilgiyi ulaştırmaktır. İnsanlara “doğru” sorgulamaları yapmayı öğretin, ör. arama motorlarının ilkelerine karşılık gelen sorgular imkansızdır. Bu nedenle geliştiriciler, kullanıcıların tam olarak aradıkları bilgiyi bulmalarını sağlayacak arama motorlarının algoritmalarını ve ilkelerini oluşturur. Bu, arama motorunun, bilgi ararken kullanıcının düşündüğü şekilde "düşünmesi" gerektiği anlamına gelir.

Çoğu arama motoru, önceden indeksleme ilkesine göre çalışır. Çoğu arama motorunun veritabanı aynı prensipte çalışır.

Başka bir inşaat prensibi var. Doğrudan arama. Bir anahtar kelime aramak için kitap sayfasını sayfa sayfa çevirmenizden oluşur. Tabii ki, bu yöntem çok daha az etkilidir.

Ters indeksli varyantta, arama motorları dosya boyutu sorunuyla karşı karşıyadır. Kural olarak, oldukça büyüktürler. Bu sorun genellikle iki şekilde çözülür. Birincisi, gereksiz her şeyin dosyalardan kaldırılması ve yalnızca arama için gerçekten gerekli olanın kalmasıdır. İkinci yöntem, her konum için mutlak bir adresin değil, göreceli bir adresin hafızaya alınmasıdır, yani. mevcut ve önceki konumlar arasındaki adres farkı.

Bu nedenle, bir arama motoru tarafından gerçekleştirilen iki ana işlem site indeksleme, sayfa indeksleme ve aramadır. Genel olarak indeksleme işlemi arama motorları için sorun yaratmaz. Sorun, günde bir milyon isteği işliyor. Bunun nedeni, büyük bilgisayar sistemleri tarafından işlenen büyük miktarda bilgidir. Bir aramaya dahil olan sunucuların sayısını belirleyen ana faktör, arama yüküdür. Bu, bilgi ararken ortaya çıkan bazı tuhaflıkları açıklar.

Arama motorları beş ayrı yazılım bileşeninden oluşur:

örümcek: web sayfalarını indiren tarayıcı benzeri bir program.

tarayıcı: Sayfada bulunan tüm bağlantıları otomatik olarak takip eden "gezici" bir örümcek.

indeksleyici:Örümcekler tarafından indirilen web sayfalarını analiz eden kör bir program.

veritabanı: indirilen ve işlenen sayfaların depolanması.

arama motoru sonuç motoru: veritabanından arama sonuçlarını alır.

Örümcek:Örümcek, web sayfalarını indiren bir programdır. Bir web sitesine bağlandığınızda ve bir sayfa yüklediğinizde tam olarak tarayıcınız gibi çalışır. Örümceğin görsel bileşeni yoktur. Aynı işlemi (indirme) belirli bir sayfayı görüntülediğinizde ve tarayıcınızda “HTML kodunu görüntüle”yi seçtiğinizde de gözlemleyebilirsiniz.

tarayıcı:Örümceğin sayfaları indirmesi gibi, sayfayı soyabilir ve tüm bağlantıları bulabilir. Bağlantılara veya önceden tanımlanmış bir adres listesine dayanarak örümceğin nereye gitmesi gerektiğini belirlemek onun işidir.

Dizin oluşturucu: Dizin oluşturucu, sayfayı çeşitli bölümlerine ayrıştırır ve bunları analiz eder. Sayfa başlıkları, başlıklar, bağlantılar, metin, yapısal öğeler, BOLD, İTALİK öğeler ve sayfanın diğer biçimlendirilmiş bölümleri gibi öğeler izole edilir ve analiz edilir.

Veri tabanı: Veritabanı, bir arama motorunun indirdiği ve analiz ettiği tüm verilerin bir deposudur. Bu genellikle büyük kaynaklar gerektirir.

Arama Motor Sonuçlar: Sonuçları yayınlama sistemi, sayfaların sıralamasıyla ilgilenir. Hangi sayfaların kullanıcının isteğini karşıladığına ve hangi sırayla sıralanması gerektiğine karar verir. Bu, arama motoru sıralama algoritmalarına göre gerçekleşir. Bu bilgi bizim için en değerli ve ilginç - optimize edicinin etkileşimde bulunduğu arama motorunun bu bileşeniyle, sitenin SERP'deki konumunu iyileştirmeye çalışıyor, bu nedenle gelecekte tüm ayrıntıları ayrıntılı olarak ele alacağız. Sonuçların sıralamasını etkileyen faktörler.

Arama indeksinin çalışması, ilk ikisi hazırlayıcı ve kullanıcı için görünmez olan üç aşamada gerçekleşir. Arama dizini ilk olarak aşağıdakilerden bilgi toplar: Dünya Geniş . Bunu yapmak için tarayıcılara benzer özel programlar kullanın. Belirli bir Web sayfasını bir arama dizini sunucusuna kopyalayabilir, göz atabilir, sahip olduğu tüm köprüleri, orada bulunan kaynakları bulabilir, oradaki köprüleri yeniden bulabilir, vb. Bu tür programlara denir. solucanlar, örümcekler, tırtıllar, tarayıcılar, örümcekler ve diğer benzer isimler. Her arama dizini, bu amaç için genellikle kendi geliştirdiği kendi benzersiz programını kullanır. Birçok modern arama motoru, Web'i izleyen otomatik programların geliştirilmesi ve uygulanmasıyla ilgili deneysel projelerden doğdu. Teorik olarak, başarılı oturum açtıktan sonra örümcek tüm Web alanını tek bir daldırma işleminde tarama yeteneğine sahiptir, ancak çok zaman alır ve orada meydana gelen değişiklikleri izlemek ve "ölü" bağlantıları belirlemek için periyodik olarak daha önce ziyaret edilen kaynaklara geri dönmesi gerekir, yani, alaka düzeyini kaybetmiş olanlar.

Arama motorları, İnternette bilgi bulmanın ana yollarından biridir. Arama motorları her gün web'de gezinirler: Web sayfalarını ziyaret eder ve onları dev veritabanlarına girerler. Bu, kullanıcının bazı anahtar kelimeler girmesine, gönder düğmesine basmasına ve hangi sayfaların isteklerini karşıladığını görmesine olanak tanır.

Arama motorlarının nasıl çalıştığını anlamak, web yöneticileri için çok önemlidir. Onlar için, belgelerin ve tüm sunucunun veya sitenin arama motorları açısından doğru yapısı hayati derecede önemlidir. Bu olmadan, bir arama motoruna yapılan kullanıcı sorgularına yanıt olarak belgeler yeterince sık görünmeyecek veya hiç dizine eklenmeyebilir.

Web yöneticileri sayfalarının sıralamasını yükseltmek ister ve bu anlaşılabilir bir durumdur: sonuçta, bir arama motoruna yapılan herhangi bir talep için, ona karşılık gelen belgelere yüzlerce ve binlerce bağlantı verilebilir. Çoğu durumda, yalnızca ilk 10 bağlantı sorguyla yeterli alaka düzeyine sahiptir.

Doğal olarak, çoğu kullanıcı ilk ondan sonraki bağlantılara nadiren baktığından, belgenin ilk ona girmesini istersiniz. Başka bir deyişle, belgeye bağlantı onbirinci ise, o zaman hiç yokmuş gibi kötüdür.

Başlıca arama motorları

Yüzlerce arama motorundan hangisi bir web yöneticisi için gerçekten önemlidir? Eh, elbette, yaygın olarak bilinen ve sık kullanılan. Ancak aynı zamanda sunucunuzun tasarlandığı hedef kitleyi de göz önünde bulundurmalısınız. Örneğin, sunucunuz en son inek sağma yöntemleri hakkında oldukça özel bilgiler içeriyorsa, muhtemelen genel arama motorlarına güvenmemelisiniz. Bu durumda benzer konularla uğraşan meslektaşlarınızla bağlantı alışverişinde bulunmanızı tavsiye ederim 🙂 O halde önce terminolojiyi tanımlayalım.

Web sayfaları hakkında iki tür bilgi veri tabanı vardır: arama motorları ve dizinler.

Arama motorları: (örümcekler, tarayıcılar) belge veritabanlarını yenilemek için sürekli Web'i araştırıyor. Bu genellikle kişinin herhangi bir çaba göstermesini gerektirmez. Bir örnek, Altavista arama motoru olabilir.

Arama motorları için her belgenin yapısı oldukça önemlidir. Başlık, meta etiketler ve sayfa içeriği büyük önem taşımaktadır.

Dizinler: Arama motorlarından farklı olarak, bir kişinin inisiyatifiyle bir dizine bilgi girilir. Eklenen sayfa, katalogda kabul edilen kategorilerle sıkı bir şekilde bağlantılı olmalıdır. Bir dizin örneği Yahoo'dur. Sayfaların yapısı önemli değil. Ayrıca, esas olarak arama motorlarına odaklanacağız.

Altavista

Sistem Aralık 1995'te açılmıştır. DEC şirketine aittir. 1996 yılından beri Yahoo ile çalışmaktadır.

Heyecanlı Arama

1995 yılının sonlarında başlatılan sistem hızla gelişti. Temmuz 1996, Magellan'ı satın aldı, Eylül 1996, WebCrawler'ı satın aldı. Ancak, ikisi de birbirinden ayrı kullanır. Belki gelecekte birlikte çalışacaklar.

Bu sistemde ayrıca bir katalog var - Excite Reviews. Tüm siteler orada listelenmediğinden, bu dizine girmek bir şanstır. Ancak bu dizindeki bilgiler varsayılan olarak arama motoru tarafından kullanılmaz, ancak arama sonuçlarını görüntüledikten sonra kontrol etmek mümkündür.

HotBot

Mayıs 1996'da piyasaya sürüldü. Wired'a aittir. Berkeley Inktomi arama motoru teknolojisine dayanmaktadır.

Bilgi Arama

1995'ten biraz önce piyasaya sürüldü, iyi biliniyor, harika görünüyor ve kolayca erişilebilir. Ultrasmart / Ultraseek şu anda yaklaşık 50 milyon URL içeriyor.

Varsayılan arama seçeneği Ultrasmart'tır. Bu durumda, her iki dizin de aranır. Ultraseek seçeneği ile sorgu sonuçları ek bilgi olmadan döndürülür. Gerçekten yeni arama teknolojisi, daha kolay aramalara ve InfoSeek hakkında okuyabileceğiniz bir dizi başka özelliğe de olanak tanır. Arama motorundan ayrı bir InfoSeek Select dizini vardır.

Lycos

Mayıs 1994'ten beri, en eski arama motorlarından biri olan Lycos çalışıyor. Yaygın olarak bilinir ve sıklıkla kullanılır. Point arama motorunu (1995'ten beri çalışıyor) ve A2Z kataloğunu (Şubat 1996'dan beri çalışıyor) içerir.

Açık Metin

OpenText sistemi 1995'ten biraz daha erken ortaya çıktı. Haziran 1996'da Yahoo ile ortak olmaya başladı. Yavaş yavaş konumunu kaybediyor ve yakında büyük arama motorlarının sayısına dahil olmaktan çıkacak.

Web tarayıcısı

20 Nisan 1994'te Washington Üniversitesi'nde bir araştırma projesi olarak açıldı. America Online tarafından Mart 1995'te satın alındı. Bir WebCrawler Select kataloğu var.

yahoo

En eski Yahoo dizini 1994 yılının başlarında piyasaya sürüldü. Yaygın olarak bilinen, sıklıkla kullanılan ve en çok saygı duyulan. Mart 1996'da, Yahooligans for Kids adlı başka bir Yahoo dizini başlatıldı. Yahoo'nun giderek daha fazla bölgesel ve en iyi dizinleri var.

Yahoo, abonelik tabanlı bir kullanıcı olduğundan, bazı siteler listelenmeyebilir. Bir Yahoo araması herhangi bir uygun sonuç getirmezse, kullanıcılar arama motorunu kullanabilir. Bunu yapmak çok kolay. Yahoo'ya bir istek yapıldığında, dizin onu büyük arama motorlarından birine iletir. İsteği karşılama listesindeki ilk bağlantılar dizinden gelen adreslerdir ve ardından arama motorlarından, özellikle Altavista'dan alınan adresler vardır.

Arama motorlarının özellikleri

Her arama motorunun bir takım özellikleri vardır. Sayfalarınızı yaparken bu özellikler dikkate alınmalıdır.

arama motoru türü

"Tam metin" arama motorları, birkaç durak kelimesi hariç, bir web sayfasındaki her kelimeyi indeksler. "Özet" arama motorları, her sayfanın bir özetini oluşturur.

Web yöneticileri için, tam metin makineleri daha kullanışlıdır, çünkü bir web sayfasında görünen herhangi bir kelime, kullanıcı istekleriyle alaka düzeyini belirlemek için analiz edilir. Bununla birlikte, sayfaların tam metin olanlardan daha iyi dizine eklenmesi soyut arama motorlarında olabilir. Bu, örneğin sayfadaki aynı kelimelerin sıklığı gibi çıkarma algoritmasından gelebilir.

Boyut

Bir arama motorunun boyutu, dizine eklenen sayfaların sayısına göre belirlenir. Örneğin büyük boyutlu bir arama motorunda sayfalarınızın tamamına yakını indekslenebilir, ortalama bir hacimde sunucunuz kısmen indekslenebilir ve küçük bir hacimde sayfalarınız sitenin dizinlerinde yer almayabilir. hiç arama motoru.

Yenileme dönemi

  • bazı arama motorları, kullanıcının isteği üzerine sayfayı hemen dizine ekler ve ardından henüz dizine eklenmemiş sayfaları dizine eklemeye devam eder.
  • diğerlerinin en popüler web sayfalarında diğerlerinden daha fazla "tarama" olasılığı daha yüksektir

Belgenin dizine eklendiği tarih

Bazı arama motorları, belirli bir belgenin dizine eklendiği tarihi gösterir. Bu, kullanıcının bağlantının arama motoru tarafından ne kadar "taze" verildiğini anlamasına yardımcı olur. Diğerleri, kullanıcıları yalnızca tahmin etmeye bırakıyor.

Gönderilen sayfalar

İdeal olarak, arama motorları, bağlantıları izlemenin bir sonucu olarak herhangi bir sunucudaki herhangi bir sayfayı bulmalıdır. Gerçek resim farklı görünüyor. Sunucu sayfaları, doğrudan belirtirseniz (URL Ekle) arama motorlarının dizinlerinde çok daha erken görünür.

Gönderilmeyen sayfalar

Sunucunun en az bir sayfası belirtilirse, arama motorları kesinlikle belirtilen sayfadan gelen bağlantılarla sonraki sayfaları bulacaktır. Ancak bu daha uzun sürer. Bazı makineler tüm sunucuyu bir kerede indeksler, ancak çoğu yine de belirtilen sayfayı indekse yazdıktan sonra sunucu indekslemeyi geleceğe bırakır.

indeksleme derinliği

Bu parametre yalnızca listelenmeyen sayfalar için geçerlidir. Arama motorunun belirtilen sayfadan sonra kaç sayfa dizine ekleyeceğini gösterir.

Çoğu büyük makinenin indeksleme derinliği limiti yoktur. Uygulamada, bu tamamen doğru değil. Tüm sayfaların dizine eklenememesinin bazı nedenleri şunlardır:

  • çerçeve yapılarının aşırı dikkatli kullanılmaması (kontrol (çerçeve kümesi) dosyasında yinelenen bağlantı yok)
  • normal bağlantılarla çoğaltmadan imagemap kullanma

Çerçeve desteği

Arama robotu çerçeve yapıları ile nasıl çalışacağını bilmiyorsa, indeksleme sırasında çerçeveli birçok yapı gözden kaçacaktır.

ImageMap desteği

Bu, sunucu çerçeve yapıları ile kabaca aynı sorundur.

Parola korumalı dizinler ve sunucular

Bazı arama motorları, bir Kullanıcı Adı ve Parola verilirse bu tür sunucuları dizine ekleyebilir. Bu neden gerekli? Böylece kullanıcılar sunucunuzda ne olduğunu görebilir. Bu, en azından bu tür bilgilerin orada olduğunu bilmeye izin verir ve belki o zaman bilgilerinize abone olurlar.

Bağlantı frekansı

Büyük arama motorları, bir belgenin popülerliğini, web'deki başka yerlerden ne sıklıkla bağlantı verildiğine göre belirleyebilir. Bazı makineler, bu tür verilere dayanarak, böyle bir belgeyi indekslemek için zaman harcamaya değip değmeyeceği konusunda "bir sonuca varır".

öğrenme yeteneği

Sunucu sık sık güncelleniyorsa, arama motoru nadiren - daha az sıklıkta - daha sık yeniden dizine ekler.

indeksleme kontrolü

Belirli bir arama motoru tarafından hangi araçların kontrol edilebileceğini gösterir. Tüm büyük arama motorları robots.txt dosyası yönergelerini takip eder. Bazıları, indekslenen belgelerden META etiketlerini kullanarak kontrolü de destekler.

Yönlendirme

Bazı siteler, ziyaretçileri bir sunucudan diğerine yönlendirir ve bu parametre, belgelerinizle hangi URL'nin ilişkilendirileceğini belirtir. Bu önemlidir, çünkü arama motoru yeniden yönlendirmeyi işlemezse, var olmayan dosyalarla ilgili sorunlar ortaya çıkabilir.

Kelimeleri durdur

Bazı arama motorları, belirli kelimeleri dizinlerinde içermez veya bu kelimeleri kullanıcı sorgularında yer almayabilir. Bu tür kelimeler genellikle edat veya çok sık kullanılan kelimeler olarak kabul edilir. Ve medyada yer kazanmak için bunları dahil etmeyin. Örneğin, Altavista web kelimesini yok sayar ve web geliştirici istekleri için yalnızca ikinci kelime döndürülür. Bundan kaçınmanın yolları var.

Alaka düzeyini belirlemek için algoritma üzerindeki etkisi

Arama motorları, belgedeki anahtar kelimelerin yerini ve sıklığını kullandığınızdan emin olur. Bununla birlikte, alaka düzeyini artırmak için ek mekanizmalar her araç için farklıdır. Bu parametre, belirli bir makine için ne tür mekanizmaların bulunduğunu gösterir.

spam cezaları

Tüm büyük arama motorları, bir site, örneğin URL Ekle aracılığıyla tekrar tekrar kendini belirterek veya aynı anahtar kelimeyi birden çok kez bahsederek, vb. sıralamasını yükseltmeye çalıştığında "hoşlanmaz". Çoğu durumda, bu tür eylemler (spam, yığınlama) ) cezalandırılır ve sitenin reytingi tam tersine düşer.