Cum sa faci un site popular
Problema 207. „Cum de a crea un motor de căutare.“
Cum sa faci un site popular. Problema 207. „Cum de a crea un motor de căutare.“ Astăzi vom atinge ușor un astfel de subiect interesant, „Cum de a crea un motor de căutare.“ Scrierea motorului său de căutare, este o provocare, care este foarte convenabil la scară este împărțită în mod ideal în subactivități. Deci, doar o versiune de încercare, puteți crea încet câteva zile, și apoi dezvolta-l la un proiect mai serios. Munca nu se vor pierde în zadar. Chiar dacă a dezvolta în continuare proiectul nu are dorinta / nevoia, versiunea primară este bine și va rula pe orice zone locale înguste. Trei surse, trei componente de orice motor de căutare. Prima parte - un depozit de date, care stochează informațiile reale care este căutat. A doua parte - este Spider, și anume păianjen care se târăște aici și acolo, captarea informațiilor și punerea în spațiul de stocare. A treia parte - o interfață funcțională care răspunde la solicitările utilizatorilor, furnizează informațiile cele mai relevante din depozit.
Cum sa faci un site popular. Issue 207.
„Cum de a crea un motor de căutare.“
În ultima noastră problemă.
Suntem superficial familiarizați cu ferestre de sistem opperatsionnoy 8.1, cu utilizator tipic afișări primele. În această problemă, am învățat cum să apăsați pe butonul „Start“ pentru a goli ecranul, să nu se piardă în sălbăticia, pentru a stabili un mod convenabil și familiar pentru a comuta limbi etc.
Astăzi vom atinge ușor un astfel de subiect interesant, „Cum de a crea un motor de căutare.“
Cineva, probabil, susțin - de ce, spun ei, pierdem timpul pe o astfel de sarcină dificilă atunci când avem monștri, cum ar fi Google și Yandex, care se va gasi totul foarte repede.
Acest lucru este pentru mine la fel de mult ca și alte 3 obiecții.
În primul rând, în plus, de Google și Yandex, există câteva zeci de diferite motoare de căutare al doilea și al treilea nivel, care a fost destul de succes create, iar unele chiar funcționează foarte bine.
Oamenii au încercat să-și petreacă de energie, timp, energie, bani, atunci l-am văzut-un sens.
În al doilea rând, fiecare programator în viața mea de a scrie său „Tetris“, a crea propriul motor de căutare, precum și de a veni cu o protecție sigură împotriva site-ului hacking „Pentagon“. Cineva se gândea, „Nu cred că de protecție și hack-l în iad!“ Dar nu este destul de corect politic, iar sancțiunile deja torturat.
În al treilea rând, scrierea motorului de căutare, este o provocare, care este foarte convenabil la scară este împărțită în mod ideal în subactivități. Deci, doar o versiune de încercare, puteți crea încet câteva zile, și apoi dezvolta-l la un proiect mai serios. Munca nu se vor pierde în zadar. Chiar dacă a dezvolta în continuare proiectul nu are dorinta / nevoia, versiunea primară este bine și va rula pe orice zone locale înguste.
Trei surse, trei componente de orice motor de căutare.
Prima parte - este depozitul de date. în care este stocată informația corespunzătoare, se caută.
A doua parte - este Spider. și anume păianjen care se târăște aici și acolo, captarea informațiilor și punerea în spațiul de stocare.
A treia parte - este funcționalitatea de interfață. care, ca răspuns la solicitările utilizatorilor, furnizează informațiile cele mai relevante din depozit.
Ajutarea pentru a crea un magazin simplu, vom avea o mare Google în sine urmează.
După cum știți, desigur, Google recomandă păstrarea site-ul de serviciu special de fișier sitemap.xml. care ajută Google să indexeze site-ului. Desigur, aceasta este întrebarea mare, cât de mult prezența acestui fișier ajută site mai sus în clasament de căutare. Dar acum avem această dezbatere nu va duce pur și simplu la concluzia că cea mai grea a prezenței acestui fișier, probabil, nu va fi, deci acest lucru ar trebui să creeze un fișier, țineți site-ul și păstrați-l la zi.
Fișier Structura sitemap.xml înregistrare despre acest lucru:
Nu este o structură pic pentru a crea o pagină pentru o bază de date MySQL -
Vom descrie structura acestui tabel care face totul a devenit clar.
Acum scrie un program care trage informațiile din tabelul sitemap.xml `urls`. în cursul capturarea informațiilor pentru câmpurile `title`. `Description`. `Keywords`. `Content` pe paginile respective.
Apropo, apoi m-am dus de val, astfel încât, în același timp, „gramada sus“, a scris, de asemenea, un utilitar pentru rezolvarea problemei inverse: pentru a crea un fișier sitemap.xml pe baza informațiilor din tabelul `urls`.
motor de căutare pentru utilizator este foarte simplu, esența este următoarea SQL-cod:
Explicație: în cazul în care semnul. permutare efectivă se realizează prin interogarea de căutare a utilizatorilor cu obramleniyaem la stânga și la dreapta mărcile%.
instrucțiuni mici pentru motorul de căutare a utilizatorilor:
Introduceți șirul de căutare în limba engleză (în exemplul de lentile de contact. Ie „lentile de contact“) și faceți clic pe „Submit“ buton.
Introduceți un șir de căutare în limba engleză, apoi faceți clic pe „Submit“ buton.Ca rezultat, „Submit“ buton ar trebui să accepte statutul de „inactiv“ pentru a evita mai multe apăsări de taste accidentale, și ar trebui să fie afișate sub rezultatele căutării.
Afișarea rezultatelor căutării.Pentru a efectua o nouă căutare, ar trebui să stabilească butonul „Trimite“ prin apăsarea „Reparatii unui buton“ (încercuită în roșu ↑)
Pare să fie o lucrare funcțională destul de bine pentru un creator începător al motorului de căutare.
Aceeași funcționalitate poate fi bine utilizat pentru site-urile în limba rusă, este necesar doar pentru a strânge și să acorde o atenție deosebită codificării.
Funcționalitatea este ușor extensibil, extrem de flexibil, acesta poate fi folosit atât pentru un singur site sau multiplă.
Algoritmul clasament Primitive poate fi îmbunătățită în mai multe moduri. De exemplu, gândiți-vă la semnificația coeficienților, să zicem, `title` - 10,` description` - 5, `keywords` - 2,` content` - 1, etc. Puteți conta, de asemenea, numărul de apariții ale șirului, puteți împărți caseta de căutare pentru a căuta cuvinte și cuvintele. Pe scurt, există un câmp infinit pentru mintea iscoditoare.
Este necesar să se aibă în vedere, cu atât mai complexă a algoritmului, cu atât mai mare sarcina pe server, și aici este dacă un algoritm sofisticat pentru a lucra mai bine decât simplu - marea întrebare.
Asta e tot ce am vrut să vorbesc despre crearea unui motor de căutare. Vă doresc succes în acest domeniu și de a crea un nou Google sau Yandex.
Vă mulțumesc pentru atenție.
Ai două modalități de a răspunde la această problemă.
Trimite un mesaj pentru mine personal.