Vyhľadávanie na webe

Podobné dokumenty
Snímka 1

Matej Kendera - PDF, word, lucene, java

Dobývanie znalostí

Tomáš Jelínek - včely vyhľadávanie

Centrum vedecko-technických informácií, Odbor pre hodnotenie vedy, Oddelenie pre hodnotenie publikačnej činnosti Vyhľadávanie a práca so záznamami - C

IAB budicek - Branding Landscape & Research options_FINAL_Gregor.pptx

eKasa

portál scientia.sk

eKasa

Microsoft Word - prirucka_katedry_nova

CENNÍK REKLAMY NA WEBOCH MARKÍZA - SLOVAKIA, SPOL. S R.O. NA ROK 2015

Podpora metód operačného výskumu pri navrhovaní systému liniek doc. RNDr. Štefan PEŠKO, CSc. Katedra matematických metód, Fa

CitiManager - Migration Quick Reference Guide for Cardholders_Slovak_fin

SK01-KA O1 Analýza potrieb Zhrnutie BCIME tím Vyhlásenie: "Podpora Európskej komisie pre výrobu tejto publikácie nepredstavuje súhlas

sprievodca_exp.pdf

The16 th International Scientific Conference Trends and Innovative Approaches in Business Processes 2013 NEWSLETTER - OBĽÚBENÝ NÁSTROJ INTERNETOVÉHO M

Digitálne technológie v každodennom živote 3. ročník akademický rok 2019/2020 Harmonogram prednášok

Vyhľadávanie v CREPČ 2 (aktualizované dňa ) Centrum vedecko-technických informácií SR Odbor pre hodnotenie vedy Oddelenie pre hodnotenie pub

Portál VŠ a CEP

Microsoft Word - Priloha_1.docx

Porada Expert Search vyhľadávanie skúsených členov na fóre (Vyhľadávanie informácií - projekt) Bc. Martin Mihalovič november 2011

Identifikácia vyhladávacích epizód založená na aktivite používatela

Prezentácia programu PowerPoint

Distance search Ján Garaj Fakulta informatiky a informačných technológií Slovenská technická univerzita Školský rok: 2008/09 Popis problému a motiváci

User:tomas.melicher

Vyhodnotenie študentských ankét 2013

gis5 prifuk

Webové portály pre Hlavné mesto SR a Dopravný podnik Bratislava Ako sme Hlavnému mestu a Dopravnému podniku Bratislava zabezpečili väčší používateľský

MediatelYext

ONE TEAM. ONE PASSION.... Cenník reklamy na weboch MARKÍZA SLOVAKIA, spol. s r.o., na rok 2014

Marketingová stratégia Róbert Lelkes Operations Manager RIESENIA.com

Parsovanie MusicXML súborov Bc. Ondrej Grman Študijný program: Informačné systémy Predmet: Vyhľadávanie informácií Ak. rok: 2013/2014

Snímka 1

Trendy vývoja informatiky na ÚAMT

Efektívnosť využívania informačných zdrojov vo vedecko-výskumnom procese a výuke

AIRportal MEDIAKIT

EURÓPSKA KOMISIA V Bruseli C(2018) 6560 final ANNEX 1 PRÍLOHA k vyoknávaciemu rozhodnutiu Komisie, ktorým sa stanovuje metodika monitorov

Microsoft Word - 06b976f06a0Matice - Uzivatelska Dokumentacia

Style Sample for C&N Word Style Sheet

Vhodnosť lokálneho ohodnocovania grafu v sociálnej sieti obchodného registra SR Peter Vojtek Mária Bieliková Fakulta informatiky a informačných techno

Intellectual Property, Psychology and Sociology

eKasa

Chemical Business NewsBase

MANUAL_PRE_UVODNU_PRACU_S_AIS

Zásady spracovania a ochrany osobných údajov I. Základné ustanovenia 1. Správcom osobných údajov podľa čl. 4 bod 7 nariadenia Európskeho parlamentu a

iot business hub whitepaper isdd_em_New.pdf

Meno: Škola: Ekonomická olympiáda 2017/2018 Test krajského kola SÚŤAŽ REALIZUJE PARTNERI PROJEKTU

User:Michal.Palcek

Analýza sociálnych sietí Geografická lokalizácia krajín EU

Slovenská technická univerzita v Bratislave Fakulta informatiky a informačných technológií Ilkovičova 2, , Bratislava 4 Internet vecí v našich ž

Nová éra Microsoft Dynamics 365 v IT spoločnosti GAMO Vďaka dodanému riešeniu sme pomohli zlepšiť fungovanie kľúčových oblastí

Navigácia po úvodnej stránke elektronickej schránky Dátum zverejnenia: Verzia: 10 Dátum aktualizácie: Navigácia po úvodnej st

Insight Zosnulým odjakživa zvykneme venovať chvíľu ticha. Problém však nastáva, keď sa táto chvíľa ticha natiahne na dni, tyždne, mesiace, ba až roky.

Georeceive a Geoshopping

SLOVENSKÁ TECHNICKÁ UNIVERZITA V BRATISLAVE Fakulta informatiky a informačných technológií STU Ústav počítačových systémov a sietí ZADANIE SEMESTRÁLNE

Paralelné algoritmy, cast c. 3

Informačný systém pre externú časť a písomnú formu internej časti maturitnej skúšky Informačný systém pre EČ a PFIČ maturitnej skúšky Užívateľská prír

Klasická metóda CPM

Inteligentné rozhodovacie systémy Heuristické prehľadávanie SP Október, 2018 Katedra kybernetiky

Úvodná prednáška z RaL

Microsoft PowerPoint - CONNECT_R&A_76_sk

Mesačná kontrolná správa 2015 Štrukturálna štúdia Internetová populácia SR PC internetová populácia

sprievodca-priestor.pdf

Cenník inzercie

Pokrocilé programovanie XI - Diagonalizácia matíc

Aktion.NEXT Novinky vo verzii 1.9

Mesačná kontrolná správa 2015 Štrukturálna štúdia Internetová populácia SR PC intern

Dotazník spokojnosti zákazníka s produktmi a službami ŠÚ SR

manual.indd

Microsoft Word - visittrencin_analyza navstevnosti.docx

Mesačná kontrolná správa 2015 Štrukturálna štúdia Internetová populácia SR

VSDC Free Video Editor stručný návod na používanie Link na sťahovanie softvéru: K prog

Mesačná kontrolná správa Štrukturálna štúdia Internetová populácia SR

NSK Karta PDF

Axióma výberu

Prehľad oprávnených realizátorov Národný projekt: Podpora rozvoja kreatívneho priemyslu na Slovensku (NPPRKP) Kód projektu v ITMS 2014+: J874 Dá

Didaktické testy

eKasa

Kategória školenia Kurzy Project, Outlook obsahuje kurzy: Outlook základy Účastníci kurzu Outlook základy sa naučia využívať tento program na ov

Prehľad oprávnených realizátorov Národný projekt: Podpora rozvoja kreatívneho priemyslu na Slovensku (NPPRKP) Kód projektu v ITMS 2014+: J874 Dá

Používateľská príručka elektronických služieb pre žiadateľov o štatistické informácie október 2016

Agenda záverečnej práce pedagóg Celá agenda týkajúca sa záverečnej práce je dostupná v obrazovke Záverečná práca (menu Agenda pedagóga -> Záverečné pr

AGENTÚRA NA PODPORU VÝSKUMU A VÝVOJA Výzva v rámci programu Podpora výskumu a vývoja v malých a stredných podnikoch zameraná na podporu start-up a spi

Prezentácia programu PowerPoint

Paralelné algoritmy, cast c. 2

Katalóg služieb OTPdirekt-retail

Pokrocilé programovanie II - Nelineárne iteracné schémy, chaos, fraktály

Untitled

aplikácia do mobilého telefónu na stiahnutie digitálneho tachografu

Snímek 1

PowerPoint Presentation

Amazon Advertising

Výhľad Slovenska na najbližšie roky

PRAVIDLÁ POUŽÍVANIA WEBSTRÁNKY KANCELÁRIE RADY PRE ROZPOČTOVÚ ZODPOVEDNOSŤ INFORMÁCIE O POUŽÍVANÍ SÚBOROV COOKIE A INÝCH INTERNETOVÝCH TECHNOLÓGIÍ Pre

Prehľad oprávnených realizátorov Národný projekt: Podpora rozvoja kreatívneho priemyslu na Slovensku (NPPRKP) Kód projektu v ITMS 2014+: J874 Dá

Snímka 1

Marketingový mix: - komunikácia, komunikačné kanály - distribúcia, distribučné  kanály

Prehľad oprávnených realizátorov Národný projekt: Podpora rozvoja kreatívneho priemyslu na Slovensku (NPPRKP) Kód projektu v ITMS 2014+: J874 Dá

Prepis:

OBSAH PREDNÁŠKY Vyhľadávanie na webe Veľmi stručná história vyhľadávania na webe Architektúra crawler-indexer, základné požiadavky na crawler, jeho základná architektúra Typy používateľských dopytov, kategórie, znalostný graf Prezentácia výsledkov vyhľadávania - sumáre Ekonomické aspekty vyhľadávania, marketing založený na vyhľadávaní, spôsob fungovania Google Ads Vyhľadávanie s využitím štruktúry liniek algoritmus PageRank algoritmus HITS

Vyhľadávanie na webe veľmi stručná história Vyhľadávače využívajúce iba plno-textové indexovanie webových stránok (obdobie 994 997, napr. Infoseek od roku 994, Altavista a Excite od roku 995) Kategórie subjektov napĺňané odkazmi na webové stránky, napr. Yahoo! Directory 994-204, neskôr DMOZ, resp. Open Directory Project 998-207, resp. Google directory (do 20) Využitie štruktúry liniek pri vyhľadávaní (od roku 998, najskôr Google) Sponzorované vyhľadávanie (alebo aj search marketing fungujúci na princípe pay per click od r. 998 Yahoo!, neskôr aj Google AdWords od roku 2000) Sémantické vyhľadávanie napr. znalostný graf (202) Odpovedanie na otázky napr. WolframAlpha, alebo IBM Watson, nárast aplikácií využívajúcich chatboty 2

Vyhľadávacie stroje Väčšina vyhľadávacích strojov má centralizovanú architektúru typu crawler-indexer Crawlers sú programy ktorých cieľom je čo najrýchlejšie a najefektívnejšie získať stránky z webu, vrátane štruktúry ich prepojení Indexer má za úlohu indexáciu web stránok získaných a parsovaných crawlerom a ich uloženie vo vhodnej štruktúre (indexe) Môžete si pozrieť ako funguje vyhľadávanie v Google alebo pozrite si video 3

Architektúra crawler-indexer používateľ crawler indexer Search web indexy Ad indexy 4

Požiadavky na crawler Nutné požiadavky na crawler: Robustnosť (vedieť správne odhaliť pasce ) Ohľaduplnosť (dodržiavať implicitné a explicitné pravidlá regulujúce návštevy webových sídel) Ďalšie požiadavky na crawler: Distribuovanosť (škálovateľná architektúra crawlerov) Výkonnosť a efektívnosť (efektívne využitie systémových zdrojov procesor, pamäť, šírka pásma) Kvalita (schopnosť prioritne sťahovať užitočné stránky) Aktuálnosť (priebežné sťahovanie nových verzií web stránok) Rozšíriteľnosť (o nové typy formátov, protokolov...) 5

Základná architektúra crawlera DNS Doc FP s robots filters URL set WWW Fetch Parse Content seen? URL filter Dup URL elim URL Frontier 6

Typy používateľských dopytov Tri veľké skupiny:. Informačné dopyty používateľ hľadá všeobecné informácie na určitú oblasť ( knowledge management ). Typicky neexistuje jedna web stránka, ktorá by obsahovala všetky potrebné informácie. 45% 60% - Podrobnejšie informácie dostupné pre entity znalostného grafu - Prípadne priamo odpoveď na priamu otázku (featured snippet) 2. Navigačné dopyty používateľ hľadá domovskú web stránku nejakej entity ( TU v Košiciach ). Používateľ v tomto prípade očakáva hľadanú odpoveď na prvom mieste vo výsledkoch. 5% 25% - V prípade zadania adresy priamo jej zobrazenie na mape 3. Transakčné dopyty predchádzajú realizácii nejakej transakcie na webe (kúpa produktu, stiahnutie súboru, rezervácia a pod.). V tomto prípade je potrebné vrátiť zoznam služieb, ktoré poskytujú rozhranie pre žiadané transakcie. 25% 35% 7

Personalizácia vyhľadávania Existuje niekoľko aspektov tejto úlohy: Personalizačná stratégia Úprava dopytu (rozšírenie alebo preformulovanie) Spracovanie výsledkov vyhľadávania (ich preusporiadanie) Zdroj dát pre personalizačné rozhodovanie: Založené na obsahu (podobnosť medzi dokumentmi) Kolaboratívna filtrácia (podobnosť medzi používateľmi) Hybridné (kombinácia oboch prístupov) Časový interval, z ktorého sa berú dáta pre personalizáciu: Dlhodobé (celá história interakcií používateľa s vyhľadávačom) Krátkodobé (uvažuje iba posledné interakcie) 9

Prezentácia výsledkov vyhľadávania Systém IR vráti usporiadaný zoznam dokumentov (podľa miery relevancie) Preddefinovaný počet dokumentov s krátkym popisom sumárom (snippet) Obsah sumáru je dôležitý viac o sumároch pozri ďalej Platené odkazy na zadaný dopyt (Ads) Ale môžu to byť aj ďalšie užitočné odpovede: Napr. definícia z wikipédie, resp. uzol zo znalostného grafu, najnovšie už aj priamu odpoveď na zadanú otázku (featured snippet) 0

Sumáre vo výsledkoch IR systémov () Dva základné druhy sumárov: statické nezávislé na dopyte ktorý viedol k vyhľadaniu daného dokumentu, stále rovnaký dynamické prispôsobené konkrétnemu dopytu, snažia sa ukázať, prečo bol daný dokument vybraný ako relevantný k dopytu Statické sumáre typicky predstavujú časť dokumentu napr. prvých 50 slov, uložené do cache v čase indexácie výber reprezentatívnej množiny viet z dokumentu - použitie NLP pre skórovanie viet a výber najlepších sofistikované techniky sumarizácie textov používané v experimentálnych systémoch

Sumáre vo výsledkoch IR systémov (2) Dynamické sumáre Prezentujú jedno alebo viac okien v dokumente, ktoré obsahujú niekoľko termov z dopytu vyžaduje rýchle vyhľadanie okien v cache pamäti dokumentov Skórovanie nájdených okien vzhľadom na dopyt (príznaky ako veľkosť a poloha okna v dokumente) Aké sumáre používa vyhľadávač Google? 2

Ekonomické aspekty vyhľadávania () V minulosti dominovali najmä reklamné bannery na populárnych webových stránkach, typicky platené formou CPM (cost per mil, resp. impression) cena za tisíc zobrazení reklamného bannera Reklamné bannery majú však veľmi nízku mieru prekliku (CTR click through rate: rádovo desatiny percenta v priemere okolo 0,35%) počet kliknutí CTR = ----------------------- počet zobrazení Môžu byť však užitočné, ak cieľom marketingu je budovanie povedomia o značke (branding) 4

Optimalizácia pre vyhľadávače V rámci samotnej web stránky: Výber vhodných kľúčových slov Názov domény, použitie kľúčových slov v URL odkazoch Normalizácia URL Použitie kľúčových slov v názvoch, zvýrazneným textom Dôležité tagy: Title, Meta Mimo web stránky: Odkazy na web stránku z rôznych zoznamov, stránok partnerských organizácií, blogov, a pod. Zakázané techniky ( cloacking stránka vyzerá ináč pre ľudského používateľa a ináč pre crawler) 5

Marketing založený na vyhľadávaní Marketingová stratégia, kde hlavným nástrojom je vyhľadávač. Cieľom je dosiahnuť, aby sa daná web stránka ocitla vo výsledkoch pri hľadaní určitých kľúčových slov čo najvyššie. To sa dá dosiahnuť: a) Optimalizáciou web stránok pre vyhľadávače (SEO) v rámci stránky samotnej, alebo aj mimo nej b) Využitím platených služieb platenie za reklamu založené na princípe CPC (cost per click) napr. Google Ads, resp. Sponsored Search v Yahoo! 6

Ján Paralič (people.tuke.sk/jan.paralic) 7

Ako funguje Google Ads () Google Ads Reklama vo vyhľadávaní, Reklama v obsahovej sieti Videoreklama, Reklama na aplikáciu Definovanie marketingových kampaní: Názov, dátum ukončenia, denný rozpočet, BID (maximálne CPC) Distribučné preferencie (Google homepage, sieť partnerských vyhľadávačov, obsahová sieť partneri využívajúci AdSense) Výber cieľových jazykov, geografické zacielenie, Časové úseky dňa, kedy kampaň bude bežať Miesto zobrazenia reklamy (s tým súvisí cena) Demograficky závislé ponuky (len pre social media sites ) Výsledok dopytu v sekcii sponzorovaných liniek závisí od: BID (maximálna cena za klik, ktorú je ochotný zadávateľ zaplatiť) Quality Score (skóre kvality) Očakávaný vplyv dodatočných zdrojov k reklame (Ad extensions) a ďalších formátov reklamy (Ad formats) 8

Ako funguje Google Ads (2) Vypočíta sa odhad ceny CPC ponuky potrebnej pre dosiahnutie prvej pozície na daný dopyt Čím vyššie skóre kvality, tým nižšia odhadovaná cena CPC Tento model podporuje dobre navrhnuté marketingové kampane Usporiadanie marketingových ponúk pre dané kľúčové slovo dopytu podľa hodnoty Ad Rank Ad Rank = maximálne_cpc x skóre_kvality Víťazná ponuka sa zobrazí a zadávateľ reklamy za ňu zaplatí najnižšiu cenu, ktorá by mu ešte zabezpečila danú pozíciu Nie je možné zaistiť si stopercentne prvé miesto v zobrazených výsledkoch sponzorovaných liniek Systém vedie k optimalizácii kampaní takým spôsobom, aby dosiahli čo najvyššie skóre kvality 9

Google Ad Grants Online Marketing Challenge Študentské tímy (po 2-5 študentov), verifikované vysokoškolským učiteľom najprv absolvujú on-line vzdelávanie zakončené skúškou Google bude partnerom pri výbere neziskovej organizácie, pre ktorú pripravia marketingovú kampaň v rámci prideleného voľného limitu až do 0.000 USD na mesiac Marketingová kampaň: 4 súvislé týždne Analýza kampane po jej ukončení Viac informácií na: https://get.google.com/onlinechallenge/ 20

Využitie štruktúry liniek 2

Algoritmus PageRank () Vznikol v rámci projektu na univerzite Stanford a znamenal začiatok Google Lawrence Page, Sergey Brin, Rajeev Motwani, Terry Winograd: The PageRank Citation Ranking: Bringing Order to the Web. Technical Report. Stanford InfoLab. 999. Využíva štruktúru web liniek pre výpočet hodnotenia kvality (PageRank) jednotlivých web stránok Každá web stránka má unikátny PageRank, nezávislý na dopyte, ale iba na štruktúre prepojení PageRank teda nevyjadruje relevanciu stránky vzhľadom na daný dopytu 22

Algoritmus PageRank (2) PageRank je vlastne simuláciou náhodného používateľa Vychádza zo stránky na náhodnom URL Klikne náhodne na niektorú z liniek danej stránky Po chvíli sa začne nudiť a skočí na stránku s iným náhodným URL Alebo ináč: PageRank interpretuje linku zo stránky A na stránku B ako hlas, ktorý odovzdá stránka A stránke B Naviac je tento hlas vážený významnosťou stránky A, ktorá dáva svoj hlas stránke B, t.j. PageRank danej stránky sa zvyšuje tým viac, čím vyšší je PageRank stránok, ktoré sa na danú stránku odkazujú 23

Algoritmus PageRank (3) PR(A) ( d) d*( PR(T ) C(T )... PR(Tn ) C(T ) n ) d: tlmiaci faktor, nastavený na 0,85 0,9 T,, T n : stránky odkazujúce sa na stránku A PR(A): PageRank stránky A PR(T i ): PageRank stránky T i C(T i ): počet liniek vychádzajúcich zo stránky T i 24

Príklad výpočtu ohodnotení PageRank () Page A Page B Page C Page D 25

Príklad výpočtu ohodnotení PageRank (2) Page A *0,85 *0,85/2 *0,85/2 *0,85 Page B Page C *0,85 Page D Page A: 0,85 (od stránky C) + 0,5 (nepresunuté) = Page B: 0,425 (od stránky A) + 0,5 (nepresunuté) = 0,575 Page C: 0,85 (od stránky D) + 0,85 (od stránky B) + 0,425 (od stránky A) + 0,5 (nepresunuté) = 2,275 Page D: nezíska žiadne, ale nepresunuté 0,5 = 0,5 26

Príklad výpočtu ohodnotení PageRank (3) Page A Page B 0,575 Page C 2,275 Page D 0,5 Page A: 2,275*0,85 (od stránky C) + 0,5 (nepresunuté) = 2,08375 Page B: *0,85/2 (od stránky A) + 0,5 (nepresunuté) = 0,575 Page C: 0,5*0.85 (od stránky D) + 0,575*0,85(od stránky B) + *0,85/2 (od stránky A) + 0,5 (nepresunuté) =,925 Page D: nezíska žiadne, ale nepresunuté 0,5 = 0,5 27

Príklad výpočtu ohodnotení PageRank (4) Page A 2,03875 Page B 0,575 Page C,925 Page D 0,5 28

Príklad výpočtu ohodnotení PageRank (5) Po 20 iteráciách dostaneme: Page A,490 Page B 0,783 Page C,577 Page D 0,5 Stránka C má teda najväčší význam v danej sieti, za ňou nasleduje stránka A Viac iterácií algoritmu vedie ku konvergencii váh PageRank 29

Usporiadanie výsledkov vo vyhľadávači Google Používa algoritmus PageRank ako jedno z kritérií pre usporiadanie výsledkov na dopyt používateľa Kritérií, ktoré sa berú do úvahy pri usporadúvaní výsledkov je viac ako dvesto, medzi nimi napr.: Frekvencia termov Blízkosť termov Pozícia termov (názov, na začiatku stránky, a pod.) Charakteristiky termu (hrubé písmo, kapitálky, a pod.) Informácia z analýzy liniek (PageRank) Informácia o kategóriách... a mnohé ďalšie 30

Algoritmus HITS () HITS (Hypertext-Induced Topic Search) navrhnutý Jon Kleinbergom počas pobytu v IBM IBM rozšírila HITS v systéme Clever Clever nie je vyhľadávací stroj určený na prácu v reálnom čase Usporadúva stránky vzhľadom na ich relevanciu k používateľovmu dopytu (na rozdiel od PageRank) 3

Algoritmus HITS (2) Každá web stránka je hodnotená dvojicou váh: váha hub váha autorita Dobrý hub je web stránka, ktorá odkazuje na mnoho dobrých autorít Dobrá autorita je web stránka, na ktorú sa odkazuje mnoho dobrých hubov Výpočet váh autorít a hubov iteráciami konverguje k vlastným vektorom M T M a MM T, kde M je matica susednosti orientovaného podgrafu webu 32

Algoritmus HITS (3). Použitím dopytu sa získa tzv. jadro (root set) stránok z textového vyhľadávacieho stroja (napr. Google alebo Yahoo) Jadro 33

Algoritmus HITS (4) 2. Jadro sa rozšíri na základnú množinu (base set) web stránok zahrnutím všetkých stránok na ktoré sa odkazujú stránky z jadra všetkých stránok ktoré sa odkazujú na nejakú stránku z jadra 3. Typická základná množina obsahuje 000-5000 stránok Základná množina Jadro 34

Algoritmus HITS (5) 4. Algoritmus pracuje iteratívne s váhami autority a(p) a váhami hub h(p) Nastav váhy a(p) = a váhy hub h(p) = pre všetky p Opakuj nasledovné 2 operácie h(v ) v v a(v ) h(v 2 ) v 2 p p v 2 a(v 2 ) h(v 3 ) v 3 v 3 a(v 3 ) a ( p) h( q) q p h ( p) a( q) p q a napokon znormalizuj a a h na jednotkovú veľkosť 35

Príklad výpočtu algoritmu HITS () 36 X Y Z h h h H z y x a a a A z y x A M H i i * H M A i T i * H M M H T i i * A M M A i T i * * 0 0 0 M X Y Z X Y Z

Príklad výpočtu algoritmu HITS (2) 37 0 0 0 M 0 0 0 M T 2 0 2 0 2 3 M M T 2 2 2 2 2 M T M H A 4 5 5 4 2 6 8 24 24 20 8 28 0,46 0,63 0,63 84 4 4 0,57 0,2 0,79 96 36 32 Iterácia 0 2 3 X Y Z X je najlepší hub X a Y sú najautoritatívnejšie stránky 5. Výstupom algoritmu je zoznam najlepších autorít a niekoľko najlepších hubov.

Porovnanie PageRank a HITS PageRank (Google) Vypočítava váhy pre všetky web stránky v databáze ešte pred zadaním dopytu Vypočítava len autority Triviálny a rýchly výpočet HITS (CLEVER) Výpočet prebieha na množine stránok vrátených pre každý dopyt Vypočítava autority a huby Ľahký výpočet, ale ťažko realizovateľný v reálnom čase 38