Parsovanie MusicXML súborov Bc. Ondrej Grman Študijný program: Informačné systémy Predmet: Vyhľadávanie informácií Ak. rok: 2013/2014

Podobné dokumenty
Centrum vedecko-technických informácií, Odbor pre hodnotenie vedy, Oddelenie pre hodnotenie publikačnej činnosti Vyhľadávanie a práca so záznamami - C

Matej Kendera - PDF, word, lucene, java

(Microsoft Word - Poradie stupn\355c.doc)

User:tomas.melicher

Detail správy a súvisiace prvky Dátum zverejnenia: Verzia: 5 Dátum aktualizácie: Detail správy a súvisiace prvky UPOZORNENIE

test z informatiky - hardvér Test vytvoril Stanislav Horváth Vstupno - výstupné zariadenia Otázka č.1: Aké zariadenie je na obrázku? (1 bod) a) vstupn

Georeceive a Geoshopping

Používateľská príručka POUŽÍVATEĽSKÁ PRÍRUČKA Generátor XML dávok pre Informačný systém kontrolných známok z MS Excel šablóny Dátum: Verzia

SLOVENSKÁ TECHNICKÁ UNIVERZITA V BRATISLAVE Fakulta informatiky a informačných technológií STU Ústav počítačových systémov a sietí ZADANIE SEMESTRÁLNE

eKasa

Digitálne technológie v každodennom živote 3. ročník akademický rok 2019/2020 Harmonogram prednášok

Vyhľadávanie v CREPČ 2 (aktualizované dňa ) Centrum vedecko-technických informácií SR Odbor pre hodnotenie vedy Oddelenie pre hodnotenie pub

Matematický model činnosti sekvenčného obvodu 7 MATEMATICKÝ MODEL ČINNOSTI SEKVENČNÉHO OBVODU Konečný automat predstavuje matematický model sekvenčnéh

Snímka 1

Slide 1

Manuál aplikácie eoev

Style Sample for C&N Word Style Sheet

Microsoft Word - 18.doc

Microsoft Word - Manažment_tagov_tim24_tema12_2017.docx

eKasa

NSK Karta PDF

gis5 prifuk

Prezentace aplikace PowerPoint

Didaktické testy

sprievodca_exp.pdf

Navigácia po úvodnej stránke elektronickej schránky Dátum zverejnenia: Verzia: 10 Dátum aktualizácie: Navigácia po úvodnej st

Snímka 1

Snímka 1

sprievodca-priestor.pdf

Microsoft PowerPoint - CONNECT_R&A_76_sk

Externé mediálne karty Používateľská príručka

SK01-KA O1 Analýza potrieb Zhrnutie BCIME tím Vyhlásenie: "Podpora Európskej komisie pre výrobu tejto publikácie nepredstavuje súhlas

30435_M_Pracovny.indd

Použitie počítačov (1)

Slovenská technická univerzita v Bratislave

Prezentácia programu PowerPoint

Prezentácia programu PowerPoint

Microsoft Word - pouzivatelska_prirucka.doc

Prioritne Doporučene

Používateľská príručka elektronických služieb pre žiadateľov o štatistické informácie október 2016

PowerPoint Presentation

(Microsoft Word Zadanie na s\372\235a\236 KROS DESIGN AWARD .doc)

manual.indd

Datova_struktura_evidencie_zaznamov_o_konverzii_v1-2

Start of the Week Call

Rozvrh hodín, školský rok 2019/20,

30440_Enek_szlovak_2016._ofi.indd

Snímek 1

(Microsoft Word - manu\341l - ostr\341.doc)

(Microsoft Word - \212kVP -Hra na bic\355ch n\341strojoch - pr\355pravn\375 ro\350n\355k.doc)

Portál VŠ a CEP

Efektívnosť využívania informačných zdrojov vo vedecko-výskumnom procese a výuke

Tomáš Jelínek - včely vyhľadávanie

portál scientia.sk

Príručka používateľa elektronickej služby

GEODETICKÝ A KARTOGRAFICKÝ ÚSTAV BRATISLAVA Chlumeckého 4, Bratislava II Obsah 1. Export údajov ZBGIS do CAD formá

Microsoft Word - prirucka_katedry_nova

ROZTOKY 2019 Okresná postupová súťaž a prehliadka hudobného folklóru Vyhlasovateľom a odborným garantom súťaže je Národné osvetové centrum z poverenia

iot business hub whitepaper isdd_em_New.pdf

Metrické konštrukcie elipsy Soňa Kudličková, Alžbeta Mackovová Elipsu, ako regulárnu kužeľosečku, môžeme študovať synteticky (konštrukcie bodov elipsy

User:Peter.Michalec

Žiadosť o licenčnú zmluvu na podujatie Na adrese v sekcii hlavného menu kliknete na položku Používatelia. Zobrazí sa blokové menu,

Používateľská príručka Obsah Používateľská príručka... 1 Administrácia servera... 2 FTP... 2 Remote Desktop... 3 Administrácia databáze:... 3 Spusteni

Dňa sa začalo na Slovensku medzirezortné pripomienkové konanie (ďalej len MPK) ku návrhu zákona, ktorým sa mení a dopĺňa zákon č. 190/2003

Prezentácia programu PowerPoint

SADZOBNÍK PRODUKTOV A SLUŽIEB ÚNMS SR PLATNÝ OD Bratislava, máj

PAGER V3.0

2

Študijný program (Študijný odbor) Školiteľ Forma štúdia Téma Elektronické zbraňové systémy (8.4.3 Výzbroj a technika ozbrojených síl) doc. Ing. Martin

Rozvrh2018_pm_ef_ _v2.xlsx

eKasa

Návod na vytvorenie kvalifikovaného elektronického podpisu prostredníctvom občianskeho preukazu s čipom Dátum zverejnenia: Verzia: 1 Dátu

Prezentácia programu PowerPoint

Prezentácia programu PowerPoint

Riesenie_zasielkovna

TVVP INV -4 rocnik

Akreditácia vzdelávacích programov – projekt MVP

Republika Srbsko MINISTERSTVO OSVETY, VEDY A TECHNOLOGICKÉHO ROZVOJA ÚSTAV PRE HODNOTENIE KVALITY VZDELÁVANIA A VÝCHOVY VOJVODINSKÝ PEDAGOGICKÝ ÚSTAV

Kategória školenia Kurzy Project, Outlook obsahuje kurzy: Outlook základy Účastníci kurzu Outlook základy sa naučia využívať tento program na ov

SLOVENSKÁ TECHNICKÁ UNIVERZITA V BRATISLAVE FAKULTA INFORMATIKY A INFORMAČNÝCH TECHNOLÓGIÍ Metodika archivácie verzií HW Tímový projekt Stratos FIIT M

eKasa

Nová éra Microsoft Dynamics 365 v IT spoločnosti GAMO Vďaka dodanému riešeniu sme pomohli zlepšiť fungovanie kľúčových oblastí

ZBIERKA ZÁKONOV SLOVENSKEJ REPUBLIKY Ročník 2018 Vyhlásené: Časová verzia predpisu účinná od: Obsah dokumentu je právne záväzný

Zápisnica č

Microsoft Word - skripta3b.doc

Pomoc pri práci s Online katalógom 1. Prihlásenie do konta používateľa v OPACu Jednoduché vyhľadávanie Rozšírené vyhľadávanie Zob

HARMONOGRAM školského roku 2010/2011 na HTF VŠMU

Microsoft Word Nextra_ADSLink.doc

AM_Ple_LegReport

Snímka 1

Časovo tematický plán z predmetu Telesná výchova pre 4

Digitálne mesto kam smerujú elektronické služby a moderné technológie pre samosprávu Ing. Ľuboš Petrík

Informačné technológie

Testovacie scenáre Verzia : 1.3 Dátum vydania : Zodpovedný : Michal Palatinus 1. NÁSTROJ NA AUTOMATIZOVANÉ TESTOVANIE Na zabezpečenie autom

UNIVERZITA KOMENSKÉHO V BRATISLAVE FAKULTA MATEMATIKY, FYZIKY A INFORMATIKY Informačný systém pre materské školy Bakalárska práca 2019 Monika Vlčková

SKPOS

Privátna zóna pre prevádzku Obsah Privátna zóna pre prevádzku 1 Obsah 1 Webová stránka 2 Úvodná stránka 2 Registrácia prevádzka/penzión

Novinky programu MSklad

Prepis:

Parsovanie MusicXML súborov Bc. Ondrej Grman Študijný program: Informačné systémy Predmet: Vyhľadávanie informácií Ak. rok: 2013/2014

Obsah 1 Úvod... 3 2 Prehľad súčasných riešení... 3 2.1 Aplikácie pre prácu s notovým zápisom... 3 2.2 Aplikácie pre vyhľadávanie... 3 3 MusicXML... 4 3.1 Definícia... 4 3.2 Štruktúra... 4 4 Reprezentácia hudobnej melódie... 6 5 Opis riešenia... 6 5.1 Indexácia... 6 5.1.1 Vstup... 6 5.1.2 Výstup... 6 5.1.3 Transformačná metóda... 6 5.2 Vyhľadávanie... 7 5.2.1 Vstup... 7 5.2.2 Výstup... 7 5.3 Implementácia... 7 5.3.1 Opis programu... 7 6 Dáta... 8 7 Vyhodnotenie... 8 8 Zdroje... 8 2

1 Úvod Ľudia majú radi hudbu, radi ju počúvajú, spievajú, či len tak pískajú. Niekedy im však na um príde len časť piesne, na ktorej názov ani autora si nevedia spomenúť. Určite by uvítali pomoc nástroja, ktorý by im danú skladbu na základe nimi vyjadrenej melódie našiel. Takisto to je aj medzi skúsenými hudobníkmi, ktorí si spomenú na časť partitúr, ktoré by radi získali. Oblasť dolovania hudobných informácií, ktorá v súčasnosti kvôli jej komplikovanosti zaostáva za získavaním textových informácií, je predmetom intenzívneho výskumu. Projekt sa zaoberá touto problematikou a jeho cieľom je vytvorenie aplikácie na vyhľadanie notového zápisu v MusicXML formáte podľa zadanej melódie. Na trhu sa vyskytuje značné množstvo aplikácií, ktoré sa venujú problematike skladieb v notovom zápise. Väčšina z nich však poskytuje funkcionalitu na ich tvorbu, úpravu, prehliadanie, prehrávanie či tlač notového zápisu, ale vyhľadávanie je často umožnené iba na základe metadát. Vyhľadávanie hudobného diela podľa melódie, či už formou hry na virtuálnom klavíri alebo spevu do mikrofónu alebo cez notový zápis je často zanedbávané. Ak sa daná aplikácia venuje vyhľadávaniu obmedzuje užívateľa napr. pri zadávaní melódie len na jeden tón alebo je vyhľadávanie možné len v rámci jedného súboru alebo pracuje s menej rozšíreným hudobným formátom. Aplikácie sú rôzne náročné, určené konkrétnemu typu používateľov. 2 Prehľad súčasných riešení 2.1 Aplikácie pre prácu s notovým zápisom Sibelius - http://www.sibelius.com Finale - http://www.finalemusic.com MuseScore - http://musescore.org Capella - http://www.capella-software.com Guitar PRO - http://www.guitar-pro.com Tieto programy (platené aj voľne dostupné) sú zamerané na tvorbu notových zápisov a ich úpravy. Vyhľadávanie je možné maximálne v rámci jedného súboru a hľadať sa môže určitá sekvencia nôt. 2.2 Aplikácie pre vyhľadávanie Wikifonia - http://wikifonia.org MusiPedia - http://www.musipedia.org Midomi - http://www.midomi.com DoDoSoSo - http://www.dodososo.com Jedná sa o webové portály a ak výsledky hľadania sú notové zápisy, hľadať je možné pomocou metadát. Vyhľadanie pomocou melódie väčšinou vráti linky na skladby v rôznych online službách. 3

3 MusicXML 3.1 Definícia MusicXML je elektronický hudobný formát založený na jazyku XML. Vyvinula ho spoločnosť Recordare LLC a čerpá niekoľko kľúčových konceptov z iných formátov (napr. MuseData od Waltera B. Hewletta či Humdrum od Davida Hurona). Bol navrhnutý pre zobrazovanie hudobného notového zápisu, jeho archiváciu v digitálnej forme, či zdieľanie a vymeniteľnosť hudobných dát. Verzia 1.0 bola uvedená v januári 2004, v máji 2005 vyšla verzia 1.1 s pokročilejšou podporou formátovania. Verzia 2.0 bola uvoľnená v júni 2007 a zahrňovala štandardný komprimovaný formát. Všetky z týchto verzií boli definované sériou Document type definitions (DTDs). Implementácia XML Schema Definition (XSD) verzie 2.0 bola vydaná v septembri 2008. Verzia 3.0 bola vydaná v auguste 2011 so zlepšenou podporou virtuálnych nástrojov v oboch DTD a XSD verziách [1,2]. 3.2 Štruktúra Na obrázku Obr.1 je znázornený notový zápis, ktorý v štruktúre MusicXML súboru, vyzerá ako na Obr. 2. Obr. 1 Notový zápis Analýza uvedeného príkladu: - jeden hudobný nástroj (<part>) - jeden takt (<measure>) - nultá pozícia v kvintovom kruhu (<key>) -> C DUR - metrum (rytmus ) 4/4 -> 1 takt = 4 doby, 1 štvrťová nota = 1 doba (<time>) - husľový kľúč (G-kľúč) (<clef>) - jedna nota C1 (<pitch>), s dĺžkou 4 doby(<duration>) [3] 4

Obr. 2 Štruktúra MusicXML 5

4 Reprezentácia hudobnej melódie Matematická reprezentácia hudby je navrhnutá formou vektorov. Melódia je transformovaná do výškových intervalov, ktorým sú priradené čísla podľa dĺžky intervalu. Každý typ intervalu má definovaný okrem dĺžky aj smer- nahor(+) alebo nadol (-). Výškové intervaly určujú melodický vektor [4]. Melodický vektor pre skladbu na Obr. 3 (0,-2,-3,-4,+11,-4,+4,-4,0) Obr. 3 Zápis jednoduchej melódie 5 Opis riešenia 5.1 Indexácia Proces indexácie zahŕňa parsovanie jednotlivých súborov a vytvorenie indexov pre rýchlejšie vyhľadávanie. 5.1.1 Vstup Vstupom sú samotné MusicXML súbory. 5.1.2 Výstup Výstupom súbory indexu vytvorené lokálne v počítači používateľa 5.1.3 Transformačná metóda Metóda ktorá zo získanej melódie vytvorí matematický vektor je veľmi dôležitou súčasťou a funguje nasledovne: 1. najskôr si vytvorí tabuľku priradení číselných hodnôt tónom (Tab. 1). 2. získa sa rozdiel hodnôt oktáv 3. získa sa rozdiel hodnôt výšok tónov podľa tabuľky 4. vypočíta sa hodnota pre vektor podľa vzorca: rozdielvysok + (rozdieloktav * 12) 5. hodnota sa pridá do vektora Tón C Cis D Dis E F Fis G Gis A Ais H Hodnota 0 1 2 3 4 5 6 7 8 9 10 11 Konkrétny príklad máme melódiu, ktorú tvoria dva tóny C4 a D5. Čísla 4 a 5 označujú oktávu. Výstupná hodnota pre vektor by bola 14. Názornú ukážku práce metódy možno vidieť na Obr. 4. 6

Obr. 4 Schéma fungovania transformačnej metódy 5.2 Vyhľadávanie Druhou časťou aplikácie je vyhľadávanie MusicXML súborov podľa melodického vstupu. 5.2.1 Vstup Vstupom tejto časti je melodický vektor zadaný používateľom v textovej forme alebo pomocou virtuálneho klavíru. 5.2.2 Výstup Výstupom je zoznam nájdených súborov zoradený podľa percenta zhody. Zoznam obsahuje dostupné metadáta zo súborov a názov súboru. 5.3 Implementácia Prostredie.NET Visual Studio 2013 Programovací jazyk C# 5.3.1 Opis programu Aplikácia využíva objektovo-orientovaný prístup a poskytuje niekoľko formulárov grafického používateľského rozhrania. Použité technológie boli Collections (pre uchovávanie údajov), Forms (vykresľovanie GUI), XmlTextReader (spracovanie xml súborov), Threading (pre vytváranie vláken), IO (vstupno-výstupné operácie), Midi (pre odosielanie MIDI správ zvukovej karte), knižnica Lucene.NET (pre indexáciu a vyhľadávanie medzi dokumentami). 7

6 Dáta Dataset je tvorený súbormi typu MusicXML, z ktorých väčšina pochádza z dump-u wikifonie, niektoré sú získané zo súkromných zbierok iných ľudí a niektoré vytvorené len pre účely tohto projektu. 7 Vyhodnotenie Nakoľko neexistuje softvér s takým istým zameraním, vyhodnotenie porovnaním výsledkov nie je možné. Aplikácia však javí známky stability a pri všetkých testoch našla podľa zadanej melódie notové súbory podľa očakávania. 8 Zdroje [1] Wikipedia. Hudobné formáty. (2011-10-04) http://en.wikipedia.org/ [2] MakeMusic.MusicXML (2012-05-05) http://www.makemusic.com/musicxml/ [3] Habudová, Nikoleta: Music Information Retrieval. (2011-10-04) http://www2.fiit.stuba.sk/~hruskova/vyscin.html [4] Hrušková, Nikoleta - Hvolka, Juraj: Representing, comparing and evaluating of music files. Proceedings of the International Conference on E-learning and the Knowledge Society, ASE Publishing House, 2011. - ISBN 978-606-505-459-2. - S. 213-218. 8