Dobývanie znalostí

Podobné dokumenty
Úlohy: Inteligentné modelovanie a riadenie model MR mobilný robot s diferenciálnym kolesovým podvozkom 1. Vytvorte simulačnú schému pre snímanie tréno

Tomáš Jelínek - včely vyhľadávanie

WP summary

Trendy vývoja informatiky na ÚAMT

Informačné technológie

Vyhľadávanie na webe

1 Portál pre odborné publikovanie ISSN Heuristický adaptívny PSD regulátor založený na miere kmitavosti Šlezárová Alexandra Elektrotechnika

User:tomas.melicher

User:Michal.Palcek

GEODETICKÝ A KARTOGRAFICKÝ ÚSTAV BRATISLAVA Chlumeckého 4, Bratislava II Obsah 1. Export údajov ZBGIS do CAD formá

SocialInsects

Manažment v Tvorbe Softvéru 2018/2019

Inteligentné rozhodovacie systémy Heuristické prehľadávanie SP Október, 2018 Katedra kybernetiky

Novinky programu MSklad

The16 th International Scientific Conference Trends and Innovative Approaches in Business Processes 2013 NEWSLETTER - OBĽÚBENÝ NÁSTROJ INTERNETOVÉHO M

Jednotkový koreň (unit root), diferencovanie časového radu, unit root testy Beáta Stehlíková Časové rady, FMFI UK, 2011/2012 Jednotkový koreň(unit roo

Microsoft Word - 06b976f06a0Matice - Uzivatelska Dokumentacia

Informačný systém pre externú časť a písomnú formu internej časti maturitnej skúšky Informačný systém pre EČ a PFIČ maturitnej skúšky Užívateľská prír

Microsoft Word - 6 Výrazy a vzorce.doc

Smernica č. 88 /2010 Žilinský samosprávny kraj str. 1 Úplne znenie S m e r n i c e Úradu Žilinského samosprávneho kraja č. 88/2010 o postupe pri vznik

VZOR Dátum doručenia žiadosti: (miesto pre úradný záznam) Žiadosť o poskytnutie dotácie na podporu projektu rozvoja cestovného ruchu v roku 2019 Názov

Microsoft Word - prirucka_katedry_nova

Aktion.NEXT Novinky vo verzii 1.9

SK_mTransfer_Okamzita_notifikacia_ indd

Systém uznávania kvalifikácií v Slovenskej republike

Príloha č

Microsoft Word - Marček.Milan.doc

Microsoft Word - Zmeny v dlhodobom majetku.docx

Manuál pre nastavenie tlače z VRP elio m500 Elio m500 Manuál pre nastavenie tlače -1-

Hardwarové prerušenie Nasledujúci kód ukazuje inštaláciu obsluhy časovača vrátane jeho inicializácie // inicializace časovače, přerušení každou milise

(Microsoft PowerPoint - TESCO - v\341\232 partner pre praktick\351 vyu\350ovanie.ppt)

Písomný test k predmetu Tvorba informačných systémov, pondelok, 16.januára 2012, čas: 120 minút. Odpovede píšte priamo k otázkam, ak potrebujete viac

Matej Kendera - PDF, word, lucene, java

Používateľská príručka POUŽÍVATEĽSKÁ PRÍRUČKA Generátor XML dávok pre Informačný systém kontrolných známok z MS Excel šablóny Dátum: Verzia

SK01-KA O1 Analýza potrieb Zhrnutie BCIME tím Vyhlásenie: "Podpora Európskej komisie pre výrobu tejto publikácie nepredstavuje súhlas

Numerické riešenie všeobecnej (klasickej) DMPK rovnice.

T R N A V S K Á U N I V E R Z I T A V T R N A V E Fakulta zdravotníctva a sociálnej práce Univerzitné námestie 1, Trnava METODICKÉ USMERNENIE v

PowerPoint Presentation

Podpora metód operačného výskumu pri navrhovaní systému liniek doc. RNDr. Štefan PEŠKO, CSc. Katedra matematických metód, Fa

Príklad 5 - Benzén 3. Bilančná schéma 1. Zadanie príkladu n 1 = kmol/h Definovaný základ výpočtu. Na základe informácií zo zadania si ho bude v

Diapositiva 1

Prezentácia programu PowerPoint

2007_01_R

PRAVIDLÁ POUŽÍVANIA WEBSTRÁNKY KANCELÁRIE RADY PRE ROZPOČTOVÚ ZODPOVEDNOSŤ INFORMÁCIE O POUŽÍVANÍ SÚBOROV COOKIE A INÝCH INTERNETOVÝCH TECHNOLÓGIÍ Pre

SLOVENSKÁ TECHNICKÁ UNIVERZITA V BRATISLAVE Fakulta informatiky a informačných technológií STU Ústav počítačových systémov a sietí ZADANIE SEMESTRÁLNE

Vyhľadávanie v CREPČ 2 (aktualizované dňa ) Centrum vedecko-technických informácií SR Odbor pre hodnotenie vedy Oddelenie pre hodnotenie pub

PRODUKTOVÉ PODMIENKY PRE SEO SLUŽBY účinné od platné od dohodnuté ako súčasť Všeobecných obchodných podmienok spoločnosti Mediate

MediatelYext

SLOVENSKÁ GOLFOVÁ ASOCIÁCIA v spolupráci s Golfovým klubom Borša vyhlasuje Medzinárodné majstrovstvá Slovenska mužov a žien v hre na rany 2018 podporo

Microsoft Word - mnohouholnik.doc

NSK Karta PDF

Identifikačný štítok TIMSS & PIRLS 2011 Dotazník pre žiaka 4. ročník Národný ústav certifikovaných meraní vzdelávania Pluhová 8, Bratislava IEA

SK MATEMATICKA OLYMPIADA 2010/ ročník MO Riešenia úloh domáceho kola kategórie Z4 1. Doplň do prázdnych políčok čísla od 1 do 7 každé raz tak,

Manuál pre nastavenie tlače z VRP Bluetooth, USB tlačiarne Bluetooth, USB tlačiarne Manuál pre nastavenie tlače -1-

NSK Karta PDF

Tue Oct 3 22:05:51 CEST Začiatky s jazykom C 2.1 Štruktúra programu Štruktúra programu by sa dala jednoducho popísať nasledovnými časťami, kto

Snímka 1

O možnosti riešenia deformácie zemského povrchu z pohladu metódy konecných prvkov konference pro studenty matematiky

FAQ

Style Sample for C&N Word Style Sheet

Aplikácie ekonomickej a finančnej matematiky

Centrum vedecko-technických informácií, Odbor pre hodnotenie vedy, Oddelenie pre hodnotenie publikačnej činnosti Vyhľadávanie a práca so záznamami - C

C-Monitor WIN klient pre verziu 2.8

FIFA2018

Matematický model činnosti sekvenčného obvodu 7 MATEMATICKÝ MODEL ČINNOSTI SEKVENČNÉHO OBVODU Konečný automat predstavuje matematický model sekvenčnéh

Decision of the European Central Bank of 18 April 2019 on the total amount of annual supervisory fees for 2019

PM C-03 Prostredie riadenia ¾udských zdrojov

Didaktické testy

Komunikácia deklarantských SW s IS CEP Bratislava OPIS je spolufinancovaný z ERDF

Viacnásobne použitelné oblasti spolahlivosti pre viacrozmernú kalibráciu

Poloautomatická anotácia stránok internetových obchodov Dávid Varga 4Ib, Abstrakt. Bakalárska práca sa zaoberá vytvorením metód na indukciu

Porada Expert Search vyhľadávanie skúsených členov na fóre (Vyhľadávanie informácií - projekt) Bc. Martin Mihalovič november 2011

Pokrocilé spracovanie obrazu - Fourierová transformácia

PowerPoint Presentation

ETITRAFO Jednofázové bezpečnostné a izolačné transformátory Technické údaje ETITRAFO Jednofázové bezpečnostné a izolačné transformátory Energi

SVETELNÁ ENERGIA SOLÁRNY ČLÁNOK ZALOŽENÝ NA UMELEJ FOTOSYNTÉZE 15. mája ODPOVEĎOVÝ HÁROK 1 - Krajina a družstvo:.. Meno: Meno:. Meno:.

Lukáš Thomka Horná Strieborná 4, Banská Bystrica Tel. / fax: URL: Rodinné domy, obec Hronsek, okres Banská Bystrica

Finančné riaditeľstvo Slovenskej republiky 9/ORP/2019/IM Stiahnutie identifikačných a autentifikačných údajov pri ORP - rola Administrátor/Technik Inf

Slide 1

(Microsoft Word - Registr\341cia \372\350tu Hik-Connect.docx)

Navigácia po úvodnej stránke elektronickej schránky Dátum zverejnenia: Verzia: 10 Dátum aktualizácie: Navigácia po úvodnej st

STRUČNÝ NÁVOD KU IP-COACHU

Microsoft Word - Priloha_1.docx

Chemical Business NewsBase

Microsoft Word - typ_S_1_Priklad.doc

Analýza sociálnych sietí Geografická lokalizácia krajín EU

Príloha č. 4 Údaje tranzitného vyhlásenia spolu s údajmi PCV o vstupe / výstupe V prípade, ak bude spolu s elektronickým tranzitným vyhlásením predlož

Ako hrat Burlesque Queen V 1.4

Akreditácia vzdelávacích programov – projekt MVP

Katalóg služieb OTPdirekt-retail

Blood Glucose Monitoring System Copyright Ascensia Diabetes Care Holdings AG. All rights reserved. diabetes.ascensia.com

Finančné riaditeľstvo Slovenskej republiky 15/ORP/2019/IM Práca s dostupnými reportami - rola Administrátor/Účtovník Informácia je určená pre podnikat

Detekcia anomálií

FINANČNÉ RIADITEĽSTVO SLOVENSKEJ REPUBLIKY

TS - Budúcnosť autobusovej dopravy SAD Žilina je samozrejmá súčasť našich životov ǀ Žilina ǀ Tlačová správa SAD Žilina, a.s. Spoločnosť Slov

Synthesis and properties of M. Tuberculosis phospholipid Werkbespraking

Prepis:

Dobývanie znalostí Vranec Maroš, Lučanský Ján

Zadanie Predikcia pozície internetových stránok na kľúčové slovo vo vyhľadávači Google* * www.google.cz * site:cz

Využitie Pri SEO (Search Engine Optimization) Konkrétne pri odhadoch o koľko sa stránka môže posunúť nahor po jej úprave. Z tohto odhadu potom ľahko určiť ako sa zvýši návštevnosť a tým pádom aj predaj daného produktu či služby Čím lepší odhad, tým lepšie (z hľadiska poskytnutia SEO služieb)

Čo ovplyvňuje pozíciu stránky Onpage faktory Kľúčové slovo v adrese, v title a v Hx elemente stránky Veľkosť stránky Pomer zdrojového kódu ku obsahu Obsah kľúčových slov v obsahu Vek stránky... Offpage faktory Počet spätných linkov PageRank, Srank Kvalita spätných linkov... Niektoré atribúty sa dajú zistiť ľahko, niektoré ťažšie a niektoré sa nedajú zistiť vôbec

Kľúčové slová Pri získavaní dát sme sa zamerali na kľúčové slová, ktoré súvisia s oborom cestovný ruch Vybrali sme 16 jednoslovných frázi Šlo o slová: Dovolená, letenky, exotika, ubytování, cestování, Djerba, Tunisko, Maroko, Řecko, Rhodos, Kréta, Kypr, Mallorca, Bodrum, Egypt, Hurghada,

Zvolené atribúty kľúčového slova Počet nalezených odpovedí v Google Číslo Konkurenčnosť slova. Informácia z Google AdWords Hodnoty 0-5 Popularita slova Informácia z Google AdWords Hodnoty 0-5 Počet vyhľadávaní slova Informácia zo stránky seznam.cz

URL adresy Vybrali sme prvých 80 adries, ktoré Google na dané kľúčové slovo zobrazil Pre každú z adries sme ako atribút použili: Pozíciu PageRank S-Rank Veľkosť stránky (html dokumentu) Pomer html dokument / obsah Hustota kľúčového slova Vek domény Prepínače, ktoré indikujú prítomnosť kľúčového slova v názve domény, tagu title a h1

Samotné získanie dát Celkovo sme mali 1004 záznamov Atribúty kľúčových slov boli získane ručne (len 16 slov) URL stránok a atribúty stránok boli získané pomocou voľne prístupných služieb a nami napísaných parserov Problémy: Získanie vzorku dát trvalo asi 4 hodiny Parser mal veľa chýb a preto bolo potrebné, ktoré vyšli najavo až po získaní dát

Metóda predikcie Použili sme techniku neurónových sietí, konkrétne algoritmus spätného učenia Sieť dostane na vstup atribúty slova a stránky a pozíciu Sieť vypočíta výstup a na základe odchýlky od skutočnej hodnoty upraví hodnota synaptických spojov

Predpríprava dát Normalizácia dát do intervalu [0;1] Každý atribút bol vydelený maximálnou hodnotou v jeho stĺpci Riadky matice sú náhodne preusporiadané

Rozdelenie dát Tréningová skupina 60% dát Vzory sú predkladané neurónovej sieti počas tréningu a sieť sa im prispôsobuje. Validačná skupina 20% dát Používa sa na kontrolu, či sa ešte sieť zlepšuje. Zabraňuje preučeniu. Testovacia skupina 20% dát Neznáme dáta na otestovanie výkonu siete.

Topológia neurónovej sieti 13 vstupných parametrov 20 skrytých neurónov 1 výstupný neurón

Ďalšie parametre siete Prechodové funkcie: logsig Trénovacia funkcia: trainlm Adaptačná funkcia: trains Výkonnostná funkcia: mse

Tréning Tréning siete skončil po 14 epochách

Výsledok Strednú kvadratickú odchýlku na testovacích dátach sme mali 0,008

Záver Vzhľadom k množstve záznamov a sofistikovaným indexovacím nástrojom spoločnosti Google považujeme výsledok za dobrý Zaujímavejšie výsledky by prišli po rozšírení množstva atribútov a skúmaných kľúčových slov