Arama motoru nedir veya arama motoru nasıl çalışır? İnternet arama motorları

  • 14.06.2019

Arama motorları

Arama motorları, verilen konularla ilgili veya anahtar kelimeler veya bunların kombinasyonları ile sağlanan WWW belgelerini bulmanızı sağlar. Arama motorlarında arama yapmanın iki yolu vardır:

· Kavramlar hiyerarşisine göre;

· Anahtar kelimelere göre.

Arama sunucuları otomatik veya manuel olarak doldurulur. Arama sunucusunun genellikle diğer arama sunucularına bağlantıları vardır ve kullanıcının isteği üzerine onlara bir arama isteği gönderir.

İki tür arama motoru vardır.

1. "Tam metin" arama motorları, bir web sayfasındaki her kelimeyi, stop kelimeleri hariç indeksler.

2. Her sayfanın bir özetini oluşturan "Özet" arama motorları.

Web yöneticileri için, tam metin motorları daha kullanışlıdır, çünkü bir web sayfasında bulunan herhangi bir kelime, kullanıcı sorgularıyla alaka düzeyini belirlemek için analiz edilir. Ancak, soyut motorlar sayfaları tam metin olanlardan daha iyi indeksleyebilir. Bilgi çıkarma algoritmasına, örneğin aynı kelimeleri kullanma sıklığına bağlıdır.

Arama motorlarının temel özellikleri.

1. Arama motorunun boyutu, dizine eklenen sayfaların sayısına göre belirlenir. Ancak, herhangi bir zamanda, kullanıcı isteklerine yanıt olarak verilen bağlantılar farklı yaşta olabilir. Bunun olmasının nedenleri:

· bazı arama motorları, kullanıcının isteği üzerine sayfayı hemen indeksler ve ardından henüz indekslenmemiş sayfaları indekslemeye devam eder.

Diğerleri en popüler web sayfalarını daha sık dizine ekler.

2. İndeksleme tarihi. Bazı arama motorları, belgenin dizine eklendiği tarihi gösterir. Bu, kullanıcının belgenin ağda ne zaman göründüğünü belirlemesine yardımcı olur.

3.İndeksleme derinliği, arama motorunun belirtilen sayfadan sonra kaç sayfa indeksleyeceğini gösterir. Çoğu makinenin indeksleme derinliğinde sınırı yoktur. Tüm sayfaların dizine eklenememesinin nedenleri:

Çerçeve yapılarının yanlış kullanımı.

site haritasının düzenli bağlantılarla kopyalanmadan kullanılması

4. Çerçevelerle çalışın. Arama robotu çerçeve yapıları ile nasıl çalışacağını bilmiyorsa, indeksleme sırasında çerçeveli birçok yapı gözden kaçacaktır.

5. Bağlantıların sıklığı. Büyük arama motorları, bir belgenin popülerliğini, ne sıklıkta bağlantılandırıldığına göre belirleyebilir. Bazı makineler, bu tür verilere dayanarak bir belgenin dizine eklenmesi gerekip gerekmediğini "çıkarır".

6. Sunucu güncelleme sıklığı. Sunucu sık sık güncellenirse, arama motoru onu daha sık yeniden dizine ekler.

7. İndeksleme kontrolü. Arama motorunun kontrol edilebileceği yolları gösterir.

8.Yönlendir. Bazı siteler, ziyaretçileri bir sunucudan diğerine yönlendirir ve bu parametre, bunun bulunan belgelerle nasıl ilişkili olacağını gösterir.

9. Kelimeleri durdurun. Bazı arama motorları, belirli kelimeleri dizinlerine dahil etmeyebilir veya bu kelimeleri kullanıcı sorgularına dahil etmeyebilir. Bu kelimeler genellikle edat veya sık kullanılan kelimeler olarak kabul edilir.

10.Spam cezaları. Spam engelleme yeteneği.

11. Eski verileri silme. Sunucu kapatıldığında veya başka bir adrese taşındığında web yöneticisinin eylemlerini belirleyen bir parametre.

Arama motorlarına örnekler.

1. Altavista. Sistem Aralık 1995'te açılmıştır. DEC'e aittir. 1996 yılından beri Yahoo ile çalışmaktadır. AltaVista, özel arama için en iyi seçimdir . Ancak sonuçları kategoriye göre sıralama ya yürütülmez ve sağlanan bilgileri manuel olarak gözden geçirmeniz gerekir. AltaVista, aktif sitelerin, haberlerin veya diğer içerik arama yeteneklerinin listelerini elde etmek için bir yol sağlamaz.

2. Aramayı Heyecanlandırın. 1995'in sonunda başlatıldı. Eylül 1996 - WebCrawler tarafından satın alındı. Bu düğümün güçlü bir arama kürkü varnism, otomatik bireysel ayarlama imkanısağlanan bilgiler ve niteliklereğitimli personel tarafından düğüm kümesinin açıklamaları. Heyecanlandırmak diğer arama düğümlerinden farklıdır.haber servislerini aramanıza ve incelemeler yayınlamanıza olanak tanırİnternet sayfaları. Arama motoru kullanırstandart anahtar kelime arama ve buluşsaliçerik arama yöntemleri. Bu kombinasyon sayesinde,ilgili sayfaları bulabilirsiniz ağ, kullanıcı tanımlı bir anahtar içermiyorlarsa kelimeler çıktı. Excite'ın Dezavantajı biraz kaotik bir arayüz.

3.HotBot. Mayıs 1996'da piyasaya sürüldü. Sahipliği Wired'a aittir. Berkeley Inktomi arama motoru teknolojisine dayanmaktadır. HotBot, tam metin dizinli bir belge veritabanıdır ve Web'deki en kapsamlı arama motorlarından biridir. Boolean arama araçları ve aramayı herhangi bir alanla veya Web sitesiyle sınırlandırma yeteneği, kullanıcının ihtiyaç duyduğu bilgileri bulmasına yardımcı olurken, gereksiz bilgileri ayıklıyor. HotBot, açılır listelerden gerekli arama seçeneklerini seçme olanağı sağlar.

4.Bilgi Arama. 1995'ten önce piyasaya sürüldü, hazır. Şu anda yaklaşık 50 milyon URL içeriyor. Infoseek iyi düşünülmüş bir arayüze ve mükemmel arama araçlarına sahiptir. Çoğu sorgu yanıtına, her yanıtın ardından "benzer sayfalar" bağlantıları ile birlikte "ilgili konular" bağlantıları eşlik eder. Tam metin ile indekslenen sayfaların arama motoru veritabanı. Yanıtlar iki göstergeye göre sıralanır: bir kelimenin veya tümcelerin bir sayfada bulunma sıklığı tsah'ın yanı sıra sayfalardaki kelimelerin veya cümlelerin metopozisyonu. Aranabilecek yüzlerce alt kategoriyle 12 kategoriye ayrılmış bir Web Dizini vardır. Her katalog sayfası aşağıdakilerin bir listesini içerir: önerilen düğümler

5. Lycos. Mayıs 1994'ten beri faaliyet göstermektedir. Yaygın olarak bilinir ve kullanılır. Çok sayıda URL'ye sahip bir dizin içerir. ve tam metin indekslemenin aksine sayfa içeriğinin istatistiksel analizi için teknolojiye sahip Point arama motoru. Lycos, haberler, site incelemeleri, popüler sitelere bağlantılar, şehir haritaları ve adres bulmak için araçlar içerir, fermentler ve ses ve video klipler. Lycos cevapları eşleştirme derecesine göre düzenlerbir sorguyu çeşitli kriterlere göre, örneğin sayıya göre eşleştirmedokümanın ek açıklamasında bulunan arama terimleriment, arasındaki aralıkbelgenin belirli bir ifadesinde du kelimeler, konumbelgedeki terimler.

6. Web Tarayıcı. 20 Nisan 1994'te Washington Üniversitesi'nin bir projesi olarak açıldı. web tarayıcısı fırsatlar sağlar sorguları belirtmek için sözdizimi ve geniş bir seçim basit bir arayüz ile düğüm açıklamaları.


Her yanıtın ardından WebCrawler, istek için kaba bir eşleşme puanı içeren küçük bir simge içerecektir. Ayrıca, her yanıt için kısa bir özeti, tam URL'sini, tam eşleşme puanını ve kullanım alanlarını içeren bir sayfa görüntüler. sorgudaki bu yanıt, anahtar sözcükleri olarak desene göre.Sorguları ayarlamak için grafiksel arayüz Web tarayıcı numarası H buna izin verilmiyorjoker karakter kullanımı ve aynı zamanda imkansızanahtar kelimelere ağırlık atayın.Arama alanını sınırlama seçeneği yokbelirli bir alan.

7 Yahoo. Yahoo'nun en eski dizini 1994'ün başlarında piyasaya sürüldü. Yaygın olarak bilinen, sık kullanılan ve en çok saygı duyulan. Mart 1996'da çocuklar için Yahooligans dizini başlatıldı. Yahoo bölgesel ve üst dizinleri görünür. Yahoo, kullanıcı aboneliğine dayanmaktadır. Web'deki herhangi bir arama için bir başlangıç ​​noktası olarak hizmet edebilir, çünkü sınıflandırma sistemi ile kullanıcı iyi organize edilmiş bilgilere sahip bir site bulacaktır. Web içeriği, Yahoo! ana sayfasında listelenen 14 genel kategoride sınıflandırılır. Kullanıcının isteğinin özelliklerine bağlı olarak, alt kategoriler ve düğüm listeleri hakkında bilgi edinmek için bu kategorilerle çalışmak veya veritabanında belirli kelime ve terimleri aramak mümkündür. Kullanıcı ayrıca aramayı Yahoo!'nun herhangi bir bölümü veya alt bölümü içinde sınırlayabilir. Düğümlerin sınıflandırılmasının insanlar tarafından yapılması ve bir bilgisayar değil, bağlantıların kalitesi genellikle çok yüksektir. Ancak, başarısızlık durumunda aramayı hassaslaştırmak zor bir iştir. Yahoo'ya katıl ! arama motoru dahil AltaVista, yani Yahoo! otomatik olarak olur arama motorunu kullanarak tekrarlama AltaVista . Sonuçlar daha sonra şuraya aktarılır: Yahoo!. Yahoo! E-posta adreslerini bulmak için Usenet ve Fourl 1'i aramak için istek gönderme yeteneği sağlar.

Rus arama motorları şunları içerir:

1. Rambler Bu, Rusça bir arama motorudur. Rambler ana sayfasında listelenen bölümler, Rusça Web kaynaklarını kapsar. Bir bilgi sınıflandırıcı var. Çalışmanın uygun bir yolu, her biri için en çok ziyaret edilen düğümlerin bir listesini sağlamaktır. önerilen konu

2. Aport Arama. aport sertifikalı önde gelen arama motorlarından biridir Microsoft yerel arama motorları olarakRus versiyonu için sistemler Microsoft'un Internet Explorer'ı. Aport'un avantajlarından biri, Rusça İnternet kaynaklarında arama yapabileceğiniz çevrimiçi sorguların ve arama sonuçlarının İngilizce-Rusça ve Rusça-İngilizce çevirisidir. Rusça bilmeden bile. Üstelik bilgi arayabilirsin cümleler için bile ifadeler kullanarak ifade.Aport arama motorunun temel özellikleri arasında şunları yapabilirsiniz:aşağıdakileri paylaşın:

Sorgu ve arama sonuçlarının Rusça'dan İngilizce'ye çevirisiRus dili ve tersi;

İsteğin yazım hatalarının otomatik kontrolü;

Bulunan siteler için arama sonuçlarının bilgilendirici görüntüsü;

Herhangi bir gramer biçiminde arama yapabilme;


profesyoneller için gelişmiş sorgu dili gerçek kullanıcılar

Diğer arama özellikleri şunları içerir:beş ana kod sayfası tutan (farklı işletimsistemleri) Rus dili için, arama teknolojisini kullanarakkısıtlamalar yiyorum URL ve belgelerin tarihi, arama uygulamasıbaşlıklara, yorumlara ve başlıklara göreresimlere vb., arama parametrelerini kaydetme ve tanımlama sabit sayıda önceki kullanıcı istekleri, birlik farklı sunucularda bulunan belgenin kopyaları.

3. Liste. ru ( http://www.list.ru) Uygulamasında, bu sunucunun birçokİngiliz sistemiyle ortak Yahoo!. Sunucunun ana sayfasında en popüler arama kategorilerine bağlantılar vardır.


Kataloğun ana kategorilerine bağlantıların listesi merkezi kısmı kaplar. Katalogda arama, sorgulama sonucunda hem tek tek siteler hem de başlıklar bulunabilecek şekilde gerçekleştirilir. Başarılı bir arama durumunda, URL , başlık, açıklama, anahtar kelimeler görüntülenir. İzin verilen kullanım sorgu dili Yandex. İTİBARENBağlantı "Yapıkatalog", kataloğun tam değerlendirme listesini ayrı bir pencerede açarkayıt. Puanlayıcıdan seçilen herhangi bir alt kategoriye geçme yeteneği uygulandı. Daha detaylı tematik bölümmevcut değerlendirme listesi, bir bağlantı listesiyle temsil edilir. Dizin bu şekilde düzenlenmiştir tüm siteler yapının alt seviyelerinde yer alacak şekildeturlar başlıklar halinde sunulmuştur.Görüntülenen kaynak listesi alfabetik olarak sıralanmıştır, ancak şu sıralamayı seçebilirsiniz: zamana göre menü ekle, geçişlere göre, dizine eklendikleri sıradizine gelen ziyaretçiler arasında popülerlik.

4. Yandex'den. Yandex serisi yazılım ürünleri, Rus dilinin morfolojisini dikkate alarak tam metin indeksleme ve metin verilerinin aranması için bir dizi aracı temsil eder. Yandex, morfolojik analiz ve sentez, indeksleme ve arama modüllerinin yanı sıra bir belge analizörü, biçimlendirme dilleri, format dönüştürücüler ve bir örümcek gibi bir dizi yardımcı modül içerir.

Temel sözlüğe dayalı morfolojik analiz ve sentez için algoritmalar, kelimeleri normalleştirebilir, yani ilk biçimlerini bulabilir ve ayrıca temel sözlükte bulunmayan kelimeler için hipotezler oluşturabilir. Tam metin dizin oluşturma sistemi, kompakt bir dizin oluşturmanıza ve mantıksal operatörleri kullanarak hızlı bir şekilde arama yapmanıza olanak tanır.

Yandex, yerel ve küresel ağlardaki metinlerle çalışmak üzere tasarlanmıştır ve ayrıca diğer sistemlere bir modül olarak bağlanabilir.

Bu, elbette, popüler arama motorlarının listesini bitirmiyor - sayıları yüzlerce. Ancak, bunların İngilizce sitelerle çalışmanız için fazlasıyla yeterli olduğuna eminim.

Yukarıdaki arama motorlarının hemen hemen hepsinin Kiril alfabesiyle çalışabileceğine dikkat edilmelidir. Ancak Rusça bilgi aramak için hala yerel arama motorlarını öneriyorum:

Başka Rusça arama motorları da var, ancak bunlar en popüler olanları, özellikle ilk ikisi.

Pirinç. 4.1. Google arama motoru

İnternette Siyah PR ile Mücadele kitabından yazar Kuzin Alexander Vladimirovich

"Savaş" İnternet kaynaklarını teşvik etmek ve bunları içerikle doldurmak için araçlar olarak arama motorları ve dizinler Bu bölüm, "İnternet İstihbaratı: Eylem Rehberi" kitabından bazı materyaller kullanılarak yazılmıştır.

Blog kitabından. Oluşturun ve tanıtın yazar Yuşçuk Evgeny Vladimirovich

Bir blogu tanıtmak ve içerikle doldurmak için araçlar olarak arama motorları ve dizinler Bir blogun ilginç içerikle doldurulmasının otomatikleştirilmesinden, yani bir blog için materyalin diğer blog yazarlarından daha hızlı nasıl bulunacağından bahsedeceğiz. edebilecektir

İnternet İstihbaratı kitabından [Eylem Kılavuzu] yazar Yuşçuk Evgeny Leonidovich

Arama motorlarında firma ismi ile ilgili sorguların derlenmesi

Kitaptan Kendi ellerimizle bir bilgisayar topluyoruz yazar Vatamanyuk Aleksandr İvanoviç

5.2. Popüler işletim sistemleri Birçok işletim sistemi vardır ve her birinin kendi yaygınlık derecesi vardır. Bazı sistemler ağ için daha uygundur, diğerleri ise çevrimdışı çalışmaya daha uygundur, çünkü her şeyi hız kaybetmeden birleştirmek mümkündür ve

Win2K SSS kitabından (v. 6.0) yazar Shashkov Alexey

(6.10) Karışık bir ağ, netware ve NT, W2kPro ve W98 istemcileri vardır. W98 makineleri W2k makinelerinde oturum açamaz. Bu sorunu çözmek için, yalnızca Novell istemcisine IPX/SPX, yalnızca Microsoft istemcisine TCP/IP olmak üzere bir protokol bağlaması yapmanız gerekir. Bunu ağ bağlantısı özellikleri menüsünden yapabilirsiniz.

Özet kitabından, dönem ödevi, bilgisayarda diploma yazar

Arama motorları Daha spesifik ve spesifik bilgilerle ilgili bir malzeme seçimine ihtiyacınız varsa, arama motorlarını kullanmak daha iyidir. Arama motoru, Web'de arama yapmak için bir dizi özel programdır. Doğasında var olan dezavantajlardan yoksundurlar.

İnternet kitabından. Yeni fırsatlar. Hileler ve efektler yazar Balovsyak Nadezhda Vasilyevna

Arama motorları nasıl çalışır ve doğru sorgular nasıl oluşturulur Modern arama motorları, İnternette bilgi aramak için tasarlanmış bir dizi özel programdır.Çalışma prensibi şu şekildedir: zaman zaman

İnternet kitabından% 100. Ayrıntılı eğitim: "çaydanlıktan" - profesyonellere yazar Gladkiy Alexey Anatolievich

Popüler çevrimiçi sinemalar Popüler ücretsiz çevrimiçi sinemalardan biri http://vsekino.tv adresinde bulunmaktadır (Şekil 7.5). Pirinç.

İnternet kitabından - kolay ve basit! yazar Aleksandrov Yegor

Popüler dizinler Dünyadaki en popüler ve eksiksiz dizin, hiç şüphesiz İngilizce dilindeki Yahoo! (http://dir.yahoo.com) (Şek. 4.4). Pirinç. 4.4. Bağlantıların en popüler dizini Yahoo! Dizinlerin genellikle arama motorlarıyla birleştiğine dikkat edilmelidir.

Herkes için Yandex kitabından yazar Abramzon M.G.

1.11.3. Popüler girişler Popüler girişlerin listesi günde bir kez güncellenir. Bu tür birkaç düzine giriş seçilir, ancak en popüler olanlardan yalnızca birkaçı Arama bölümünün başlık sayfasına yerleştirilir. Geri kalanı Total Records bağlantısında görüntülenebilir.

Kitaptan İnternette herhangi bir dosya nasıl bulunur ve indirilir yazar Reitman M.A.

1.11.6. Popüler kategoriler Daha önce blog yazarlarının, hizmetlerin, en popüler girişlerin derecelendirmesinden bahsediyorsak, şimdi kategoriler hakkında konuşacağız. Gönderiler yazarlarına göre kategorilere ayrılır. Nasıl, neden, neden - konuya, modaya, ruh haline bağlıdır. Yine de

Windows 7'ye Başlarken kitabından. Yeni Başlayanlar Kılavuzu. yazar Kolisnichenko Denis N.

1.11.7. Öne çıkan haberler Diğer göstergeler arasında ayrı bir blok, Yandex hizmetinin haber derecelendirmesini vurgular. Haberler. Bunlar bloglarda en çok tartışılan haberler. Popüler haberlerin listesi her 5-10 dakikada bir güncellenir. Bağlantıyı takip ederseniz

Dizüstü Bilgisayarla Tanışın kitabından yazar Zhukov Ivan

Popüler İzleyiciler Dünyada kullanabileceğiniz birçok torrent izleyicisi vardır. Aşağıda en popüler izleyiciler var.? http://lostfilm.tv, TV şovlarında uzmanlaşmış bir izleyicidir. Kural olarak, profesyonel ses ve kalitede yayınlar

BT güvenliği kitabından: Bir şirketi riske atmaya değer mi? tarafından Linda McCarthy

10.2.1. Arama Motorları İnternet, zengin bir bilgi içerir. Sonuçta, herkes İnternette bir web sitesi oluşturabilir, bu nedenle her gün yeni sitelerin sayısı artıyor. Arama motorları İnternette arama yapmak için kullanılır.Arama motoru özel bir arama motorudur.

Yazarın kitabından

Popüler İnternet Uygulamaları ICQ (ICQ) ICQ, merkezi bir anlık mesajlaşma hizmetidir. Hizmetin kullanıcısı (yani siz), istemci programıyla ("haberci" olarak adlandırılır) çalışır. Mesajlar anında gönderilir. Ayrıca

Yazarın kitabından

Popüler Bugtraq Posta Listeleri Bu liste, UNIX güvenlik açıklarını, bunların nasıl istismar edilebileceğini ve bunların nasıl kapatılacağını anlatmaktadır. Amacı, sistemlerin nasıl hackleneceğini öğretmek değil, aksine, güvenlik açıklarının nasıl keşfedileceğini, bunlarla ilgili bilgilerin nasıl paylaşılacağını, nasıl

Bu ne

DuckDuckGo oldukça iyi bilinen bir açık kaynak arama motorudur. Sunucular ABD'de bulunmaktadır. Arama motoru kendi robotuna ek olarak diğer kaynakların sonuçlarını kullanır: Yahoo, Bing, Wikipedia.

Daha iyi

DuckDuckGo, kendisini nihai gizlilik ve gizlilik araması olarak konumlandırıyor. Sistem, kullanıcı hakkında herhangi bir veri toplamaz, günlükleri saklamaz (arama geçmişi yoktur), çerezlerin kullanımı mümkün olduğunca sınırlıdır.

DuckDuckGo, kullanıcılardan kişisel bilgi toplamaz veya paylaşmaz. Bu bizim gizlilik politikamızdır.

DuckDuckGo'nun kurucusu Gabriel Weinberg

Niçin buna ihtiyacın var

Tüm büyük arama motorları, monitörün önündeki kişi hakkındaki verilere dayanarak kişiselleştirmeye çalışır. Bu fenomene "filtre balonu" denir: kullanıcı yalnızca tercihleriyle tutarlı olan veya sistemin böyle değerlendirdiği sonuçları görür.

DuckDuckGo, Web'deki geçmiş davranışlarınıza bağlı olmayan objektif bir resim oluşturur ve isteklerinize göre Google ve Yandex tematik reklamlarından kurtulur. DuckDuckGo, yabancı dillerde bilgi aramayı kolaylaştırır: Google ve Yandex, sorgu başka bir dilde girilse bile varsayılan olarak Rusça siteleri tercih eder.


Bu ne

not Evil, anonim Tor ağını arayan bir sistemdir. Kullanmak için, örneğin aynı ada sahip özel bir ağ başlatarak bu ağa gitmeniz gerekir.

Evil değil, türünün tek arama motoru değil. LOOK (Tor tarayıcısında varsayılan arama, normal İnternet'ten erişilebilir) veya TORCH (Tor ağındaki en eski arama motorlarından biri) ve diğerleri vardır. Google'a yapılan açık ima nedeniyle Evil değil üzerinde karar verdik (başlangıç ​​sayfasına bakmanız yeterli).

Daha iyi

Prensipte Google, Yandex ve diğer arama motorlarının erişiminin reddedildiği yerleri arıyor.

Niçin buna ihtiyacın var

Tor ağında yasalara saygılı internette bulunamayan birçok kaynak var. Ve yetkililerin Web içeriği üzerindeki kontrolü sıkılaştıkça sayıları artacaktır. Tor, sosyal ağları, torrent izleyicileri, medyası, pazar yerleri, blogları, kütüphaneleri vb. ile Web içinde bir tür ağdır.

3. YaCy

Bu ne

YaCy, P2P ağları ilkesiyle çalışan merkezi olmayan bir arama motorudur. Ana yazılım modülünün kurulu olduğu her bilgisayar İnternet'i kendi başına tarar, yani bir arama robotunun analogudur. Elde edilen sonuçlar, tüm YaCy katılımcıları tarafından kullanılan ortak bir veri tabanında toplanır.

Daha iyi

YaCy aramayı organize etmek için tamamen farklı bir yaklaşım olduğundan, bunun daha iyi mi yoksa daha mı kötü olduğunu burada söylemek zor. Tek bir sunucunun ve sahibi şirketin olmaması, sonuçları kimsenin tercihlerinden tamamen bağımsız hale getirir. Her düğümün özerkliği sansürü hariç tutar. YaCy, derin web'de ve dizine eklenmemiş genel ağlarda arama yapabilir.

Niçin buna ihtiyacın var

Devlet kurumları ve büyük şirketlerden etkilenmeyen açık kaynaklı yazılım ve ücretsiz internetin destekçisi iseniz, o zaman YaCy sizin seçiminizdir. Ayrıca, kurumsal veya başka bir özerk ağ içindeki aramaları düzenlemek için de kullanılabilir. YaCy günlük hayatta pek kullanışlı olmasa da arama süreci açısından Google'a layık bir alternatif.

4. pipl

Bu ne

Pipl, belirli bir kişi hakkında bilgi aramak için tasarlanmış bir sistemdir.

Daha iyi

Pipl'in yazarları, özel algoritmalarının "normal" arama motorlarından daha verimli arama yaptığını iddia ediyor. Özellikle öncelikli bilgi kaynakları, sosyal medya profilleri, yorumlar, katılımcı listeleri ve mahkeme kararlarının veri tabanları gibi kişilerle ilgili bilgilerin yayınlandığı çeşitli veri tabanlarıdır. Pipl'in bu alandaki liderliği Lifehacker.com, TechCrunch ve diğer yayınlar tarafından onaylanmıştır.

Niçin buna ihtiyacın var

ABD'de yaşayan bir kişi hakkında bilgi bulmanız gerekiyorsa, Pipl Google'dan çok daha verimli olacaktır. Görünüşe göre Rus mahkemelerinin veritabanlarına arama motoru erişilemiyor. Bu nedenle, Rusya vatandaşlarıyla o kadar iyi başa çıkmıyor.

Bu ne

FindSounds başka bir özel arama motorudur. Açık kaynaklarda çeşitli sesleri (ev, doğa, arabalar, insanlar vb.) arar. Hizmet, Rusça istekleri desteklemiyor, ancak arayabileceğiniz etkileyici bir Rusça etiket listesi var.

Daha iyi

Sadece seslerin verilmesinde ve daha fazlası değil. Arama ayarlarında istediğiniz formatı ve ses kalitesini ayarlayabilirsiniz. Bulunan tüm sesler indirilebilir. Desene göre ses araması var.

Niçin buna ihtiyacın var

Bir tüfek atışının sesini, emen bir ağaçkakanın darbesini veya Homer Simpson'ın çığlığını hızlıca bulmanız gerekiyorsa, bu hizmet tam size göre. Ve bunu yalnızca mevcut Rusça dil sorgularından seçtik. İngilizce'de, spektrum daha da geniştir.

Ama cidden, uzmanlaşmış bir hizmet, uzmanlaşmış bir kitleyi ima eder. Ama sizin için de kullanışlı olacak mı?

Bu ne

Wolfram|Alpha, hesaplamalı bir arama motorudur. Anahtar kelime içeren makalelere bağlantılar yerine, kullanıcının isteğine hazır cevap verir. Örneğin, "New York ve San Francisco nüfusunu karşılaştırın" arama formuna İngilizce olarak girerseniz, Wolfram|Alpha hemen karşılaştırmalı tabloları ve grafikleri görüntüler.

Daha iyi

Bu hizmet, gerçekleri bulmak ve verileri hesaplamak için diğerlerinden daha iyidir. Wolfram|Alpha, bilim, kültür ve eğlence dahil olmak üzere çeşitli alanlardan Web'de bulunan bilgileri toplar ve düzenler. Bu veritabanı bir arama sorgusuna hazır cevap içeriyorsa sistem bunu gösterir, değilse sonucu hesaplar ve görüntüler. Bu durumda, kullanıcı yalnızca gerekli bilgileri görür, başka bir şey görmez.

Niçin buna ihtiyacın var

Örneğin bir öğrenci, analist, gazeteci veya araştırmacıysanız, faaliyetlerinizle ilgili verileri bulmak ve hesaplamak için Wolfram|Alpha'yı kullanabilirsiniz. Hizmet tüm istekleri anlamıyor, ancak sürekli gelişiyor ve daha akıllı hale geliyor.

Bu ne

Meta arama motoru Dogpile, Google, Yahoo ve diğer popüler arama motorlarından gelen sonuçların birleşik bir listesini görüntüler.

Daha iyi

İlk olarak, Dogpile daha az reklam görüntüler. İkincisi, hizmet, farklı arama motorlarından en iyi sonuçları bulmak ve göstermek için özel bir algoritma kullanır. Dogpile'ın geliştiricilerine göre, sistemleri tüm İnternet'teki en eksiksiz sorunu oluşturur.

Niçin buna ihtiyacın var

Google'da veya başka bir standart arama motorunda bilgi bulamazsanız, Dogpile'ı kullanarak aynı anda birkaç arama motorunda arayın.

Bu ne

BoardReader, forumlar, Soru-Cevap hizmetleri ve diğer topluluklar için bir metin arama sistemidir.

Daha iyi

Hizmet, arama alanını sosyal sitelere daraltmanıza olanak tanır. Özel filtreler sayesinde dil, yayın tarihi ve site adı gibi kriterlerinize uygun gönderileri ve kullanıcı yorumlarını hızlıca bulabilirsiniz.

Niçin buna ihtiyacın var

BoardReader, halkla ilişkiler uzmanları ve belirli konularda geniş bir kitlenin görüşüyle ​​ilgilenen diğer medya profesyonelleri için faydalı olabilir.

Nihayet

Alternatif arama motorlarının ömrü genellikle kısadır. Lifehacker, Yandex'in Ukrayna şubesinin eski CEO'su Sergey Petrenko'ya bu tür projeler için uzun vadeli beklentiler hakkında sorular sordu.


Sergey Petrenko

Yandex.Ukrayna'nın eski CEO'su.

Alternatif arama motorlarının kaderine gelince, basit: küçük bir kitleye sahip çok niş projeler olmak, bu nedenle, net ticari beklentiler olmadan veya tam tersine, yokluğunun tam netliği ile.

Makaledeki örneklere bakarsanız, bu tür arama motorlarının ya dar ama rağbet gören bir nişte uzmanlaştığını, belki de şimdiye kadar Google veya Yandex'in radarlarında farkedilecek kadar büyümediğini görebilirsiniz. veya sıralamada henüz geleneksel aramada geçerli olmayan orijinal bir hipotezi test ediyor.

Örneğin, Tor'da bir arama aniden talep görürse, yani Google kitlesinin en azından bir yüzdesi oradan sonuçlara ihtiyaç duyarsa, elbette sıradan arama motorları nasıl yapılacağı sorununu çözmeye başlayacaktır. onları bulun ve kullanıcıya gösterin. Kitlenin davranışı, önemli sayıda sorgudaki kullanıcıların önemli bir bölümünün daha alakalı sonuçlar olduğunu gösteriyorsa, kullanıcıya bağlı faktörleri hesaba katmadan veriler, o zaman Yandex veya Google bu tür sonuçları vermeye başlayacaktır.

Bu makale bağlamında “daha ​​iyi olmak”, “her şeyde daha iyi” anlamına gelmez. Evet, birçok açıdan kahramanlarımız Google ve Yandex'den (Bing'den bile uzakta) uzaktadır. Ancak bu hizmetlerin her biri, kullanıcıya arama endüstrisinin devlerinin sunamayacağı bir şey sunar. Elbette buna benzer projeleri de biliyorsunuzdur. Bizimle paylaşın - tartışalım.

Modern internetin ana unsuru, arama motorları veya arama motorları, Yandex, Rambler, Google ve diğerleri. İnternette çeşitli bilgiler denizi var ve kullanıcının gerekli bilgileri hızlı bir şekilde bulmasına yardımcı olan arama motorları.

Ders kitaplarında veya bilimsel kitaplarda önemli terimlerin bir listesi vardır - alfabetik bir dizin veya dizin. Dizin, bu kitaptaki en önemli terimleri (anahtar kelimeler) ve bunların geçtiği sayfa numaralarını listeler.

Arama motorlarının çalışması da benzer bir prensibe dayanmaktadır. Esasen, bir kullanıcı bir arama terimi (anahtar kelime) girdiğinde, İnternet'in konu indeksine veya indeksine - meydana geldikleri sayfalarla birlikte İnternet'in tüm anahtar kelimelerinin bir listesine - erişmektedir.

arama motoruİnternet konu indeksini (indeks) derleyen ve saklayan ve ayrıca içinde verilen anahtar kelimeleri bulan bir programdır.

Dizin derleme ve içinde arama aşamaları:

İnternette web sayfası adreslerinin toplanması

Site sayfası adreslerinin ilk listesi arama motoruna yüklenir. Ardından arama motoru veya daha doğrusu bileşeni - arama robotu, verilen sayfaların her birinden diğer sayfalara olan tüm köprü metni bağlantılarını toplar ve bağlantılarda bulunan adresleri orijinal adres listesine ekler. Böylece, ilk liste hızla büyüyor.

sayfalar indiriliyor

Bir arama robotu veya örümcek sayfaları tarar, bunlardan metin materyali indirir ve bilgisayarlarının disklerinde saklar, ardından indeksleme için bir indeks robotuna aktarır.

Dizin derleme

Başlangıç ​​olarak, dizine eklenen sayfanın metni, metin olmayan öğelerden (grafikler, HTML işaretlemesi, vb.) temizlenir. Ayrıca, metinden seçilen kelimeler köklerine veya yalın hallerine indirgenmiştir. Toplanan kelime tabanları alfabetik sıraya göre düzenlenmiştir. sayfa numaraları tabanın alındığı yer ve giriş numaraları, bu sayfanın temeli neredeydi?

Arama

Bir kullanıcı bir sorgu dizesine bir kelime girdiğinde, arama motoru dizine erişir. Verilen kelime ile ilgili tüm sayfa numaralarını bulur ve arama sonucunu (sayfa listesi) kullanıcıya gösterir.

arama motoru kalitesi

Arama kalitesi ile eş anlamlıdır alaka düzeyi. Arama motorları ile ilgili olarak, kelime ilgili(duruma ilişkin) - neredeyse ana terim. Arama motoru sonuçlarının alaka düzeyi, bu sonuçların arama sorgusunun amacı ile alakalı sayfaları içerdiği anlamına gelir. Alaka düzeyi veya arama kalitesi oldukça zor bir şeydir.

Arama motorunun kalitesi için bir diğer önemli kriter ise kesinlik.

Kesinlik döndürülen sonuçların kalitesinin bir ölçüsüdür, arama sonuçlarında döndürülen toplam sayfa hacmindeki ilgili sayfaların sayısı olarak hesaplanır. Ancak, yalnızca aramanın doğruluğu değil, aynı zamanda değişen Arama Sonuçları.

değişen- alaka düzeyine göre arama sonuçlarının konumu.

Hangi arama motorunun daha iyi olduğunu söylemek mümkün değil. Kullanıcı için daha iyi bir arama motoru, en alakalı ve doğru sonuçları üreten motordur. Site sahibi için en iyi makine, sitenin açıkça görülebildiği ve en fazla sayıda hedeflenen ziyaretçiyi getiren makinedir.