Načela tražilica. Tražilice na Internetu

Na Internetu, na raznim stranicama korisniku se nudi velika količina različitih informacija. Da biste dobili potrebne informacije, tražite odgovore na pitanja koja su stvorili tražilice. Nakon što ste čuli tu frazu, mnogi misle o Googleu, "Yandex". Međutim, tražilice na Internetu su mnogo veće.

Što je tražilica

Tražilica se smatra softverom koji se sastoji od baze podataka dokumenata. Korisnicima je omogućeno posebno sučelje koje omogućuje unos potrebnih upita i dobivanje veza s relevantnim informacijama. Na prvim pozicijama u rezultatima pretraživanja uvijek su dokumenti koji su dosljedni onome što određena osoba traži.


Izvršenje pretraživanja, koje se formira u skladu s unesenim upitom, obično sadrži različite vrste rezultata. Može sadržavati web stranice, video i audio datoteke, slike, pdf datoteke, određene proizvode (ako pretražujete putem internetske trgovine).

Klasifikacija tražilica

Postojeći pretraživači klasificirani su u nekoliko vrsta. Prije svega, treba tražiti tradicionalne tražilice. U takvim tražilicama, principi rada usmjereni su na pronalaženje informacija o velikom broju postojećih stranica. Tražilice su još uvijek na odvojenim internetskim resursima:
  • u internetskim trgovinama (kako bi pronašli pravu robu);
  • na forumima i blogovima (za traženje poruka);
  • nainformativne stranice (pronaći članke za željenu temu vijesti), itd.
  • Tražilice su i dalje podijeljene prema geografskom obilježju. U ovoj klasifikaciji postoje 3 skupine tražilica:


  • Globalno. Pretraživanje se provodi širom svijeta. Lider u ovoj grupi je Google tražilica. Prije su postojale takve tražilice kao što su Inktomi, AltaVista i drugi
  • Regionalni. Pretraživanje se provodi po zemlji ili skupini zemalja koje imaju jedan jezik. Regionalne tražilice su raširene. Njihov primjer u Rusiji je Yandex, Rambler.
  • Lokalno. Pretraživanje se provodi u određenom gradu. Primjer takve tražilice je Tomsk.ru.

    Sastojci tražilica

    U bilo kojoj tražilici možete odabrati 3 sastavna elementa koji definiraju načela tražilice:
  • rad (indekser, pauk, pisaljka);
  • baza podataka;
  • rukovatelj upita.
  • Robot je poseban program čija je svrha stvaranje baze podataka. Baza podataka pohranjuje i sortira sve prikupljene podatke. Procesor zahtjeva, nazvan klijent, koji radi s posebnim zahtjevima. On ima pristup bazi podataka. Klijent se ne nalazi uvijek na istom računalu. Upravitelj upita raspoređen je na nekoliko fizički nepovezanih računalnih sustava.

    Načela tražilica

    Svi postojeći sustavi djeluju na jednom načelu. Razmotrite, na primjer, funkcioniranje tradicionalnih tražilica dizajniranih za internet. Rad robota je sličan djelovanju korisnika. Ovaj programpovremeno zaobilazi sve stranice, dodaje nove stranice i internetske resurse u bazu podataka. Taj se proces naziva indeksiranje.
    Kada korisnik unese upit u okvir za pretraživanje, klijent počinje raditi. Program se odnosi na postojeću bazu podataka i generira ekstrakciju na ključne riječi. Referentna tražilica daje korisniku određeni slijed. Razvrstavaju se prema važnosti, tj. Uzima se u obzir relevantnost. Svaka tražilica ima svoj način određivanja relevantnosti. Ako korisnik pošalje određeni zahtjev različitim sustavima, on neće primiti isti izlaz. Algoritam za određivanje relevantnosti čuva se u tajnosti.

    Više o relevantnosti

    Jednostavnim riječima, relevantnost se naziva podudarnost riječi unesenih u pretraživanje ili kombinacija riječi specifičnih referenci u izdavanju. Položaj dokumenata na popisu utječe na nekoliko nijansi:
  • Prisutnost riječi unesenih u pretraživanje, u dokumentima. Ova nijansa je očita. Ako dokument sadrži riječi iz upita koji je unio korisnik, to znači da dokument odgovara pojmovima za pretraživanje.
  • Učestalost pojavljivanja riječi. Što se u dokumentu češće koriste ključne riječi, to će biti više na popisu isječaka. Međutim, nije sve tako jednostavno. Često korištenje riječi može biti znak nekvalitetnog sadržaja tražilice. Algoritam za određivanje relevantnosti je prilično kompliciran. Prije nekoliko godina u izdanju mogu biti uključene veze na relevantne ključne riječi, ali ne iodgovara njihovom sadržaju. Trenutno, principi tražilice su komplicirani. Sada rad može u potpunosti analizirati cijeli tekst. U radu tražilice zabilježen je veliki broj različitih čimbenika. Zbog toga se izručenje oblikuje iz najkvalitetnijih, relevantnih referenci.

    Kako ispravno organizirati zahtjeve

    Čak smo iu školi učili da ispravno postavljamo pitanja. To ovisi o tome koje ćemo odgovore dobiti. Međutim, ovo pravilo ne mora biti poštovano kada se koriste tražilice. Za moderne tražilice ne postoji uloga broja ili slučaja koje je osoba napisala u njegovu upitu. U svakom slučaju, pitanje će uključivati ​​iste rezultate. Za tražilice nije potrebna jasna formulacija. Korisnik samo treba ispravno odabrati ključne riječi. Razmotrite primjer. Trebamo pronaći tekst pjesme "Dan bez tebe" u izvedbi poznate ženske pop grupe "Via-Gra". Kada se prijavljujete na tražilicu, ne morate nužno nazvati grupu, naznačiti da je riječ o pjesmi. Dovoljno je napisati "dan bez tebe". Da biste zadržali registre, znakovi interpunkcije nisu potrebni. Ove nijanse ne računaju tražilice.

    Svjetski rang tražilica

    Google je vodeća tražilica u svijetu. Osnovana je 1998. Sustav je vrlo popularan, što potvrđuju i analitički podaci. Oko 70% zahtjeva koji stižu na internetu rješava Google. Baza pretraživača je ogromna. Indeksirano je više od 60 bilijuna različitih dokumenata. Google lako privlači korisnikesučelje. Glavna stranica sadrži logotip i traku za pretraživanje. Ova značajka omogućuje vam da nazovete Google jednim od minimalističkih tražilica.

    Na drugom mjestu na ljestvici popularnih tražilica je Bing. Pojavila se iste godine kao i Google. Tvorac ove tražilice je poznata međunarodna korporacija Microsoft. Baidu, Yahoo !, AOL, Excite, Ask zauzimaju niže položaje na ljestvici.

    Što je popularno u Rusiji

    Među tražilicama u Rusiji najpopularniji je Yandex. Ta se usluga pojavila 1997. godine. Prvi put su bili angažirani u ruskoj tvrtki CompTek International. Malo kasnije, tvrtka "Yandex", koji je nastavio da se uključe tražilice, pojavio. Tražilica je stekla ogromnu popularnost tijekom godina. Može pretraživati ​​na nekoliko jezika - ruskom, bjeloruskom, ukrajinskom, tatarskom, kazaškom, engleskom, njemačkom, francuskom, turskom. Iz statistike je poznato da je "Yandex" zanimljiv za više od 50% korisnika Runeta. Više od 40% ljudi preferira Google. Približno 3% korisnika odabralo je Mail.ru - internetski portal na ruskom jeziku.

    Zaštićeni tražilice

    Uobičajene tražilice koje su zajedničke nama nisu u potpunosti prikladne za djecu. Mladi korisnici Interneta mogu slučajno pronaći neke materijale za odrasle, informacije koje mogu naškoditi psihi. Zbog toga su stvoreni posebni sigurni tražilice. U njihove baze podataka pohranjuju se samo sigurni sadržaji za djecu.
    Primjer jedne takve tražilice -"Suputnyk.Dity". Ova usluga je prilično mlada. Stvorio ju je Rostelecom 2014. godine. Glavna stranica tražilice je svijetla i zanimljivo dizajnirana. Predstavlja širok raspon domaćih i stranih karikatura za djecu različite dobi. Osim toga, na glavnoj stranici nalaze se kognitivne reference koje se odnose na nekoliko naslova - "Sport", "Želim znati sve", "Uradi sam", "Igre", "Tehnologija", "Škola", "Priroda". Još jedan primjer zaštićenog djeteta tražilice - Agakids.ru. Ovo je apsolutno siguran resurs. Kako radi tražilica? Robot je konfiguriran na takav način da samo zaobilazi mjesta koja su povezana s dječjim temama ili su korisna roditeljima. U osnovi tražilice padaju resursi s karikaturama, knjigama, obrazovnom literaturom, igrama, bojama. Roditelji, koristeći Agakids.ru, mogu pronaći za sebe mjesta za odgoj, zdravlje djece.
    U zaključku, treba napomenuti da su tražilice složeni sustavi. Pred njima je mnogo problema - problemi spama, određivanje relevantnosti dokumenata, skeniranje lošeg sadržaja, analiza dokumenata koji ne sadrže tekstualne informacije. Iz tog razloga, programeri uvode nove pristupe, algoritme, koji su poslovna tajna za rad internetskih tražilica.
  • Povezane publikacije