slovko.sxw

Podobné dokumenty
Pozvánka na VS2016 a Prehliadku prác mladých

TECHNICKÁ UNIVERZITA VO ZVOLENE, ÚSTAV TELESNEJ VÝCHOVY A ŠPORTU usporiada 7. ročník vedeckej konferencie s medzinárodnou účasťou TELESNÁ VÝCHOVA A ŠP

Kritériá Právnická fakulta

XXVI b 07 Navrh VZN granty spojene.pdf

Študijný program (Študijný odbor) Školiteľ Forma štúdia Téma Elektronické zbraňové systémy (8.4.3 Výzbroj a technika ozbrojených síl) doc. Ing. Martin

Datova_struktura_evidencie_zaznamov_o_konverzii_v1-2

Pozvanka na Laboralim 2009

Prezentácia programu PowerPoint

Pozvanka na laboralim 2012

Podmienky prijímacieho konaniapre šk. rok

Komplexný informa ný a monitorovací systém Monitorovanie biotopov a druhov európskeho významu Používate ská dokumentácia KIMS modul Mobilná aplikácia

SMART_GOVERNANCE_Ftacnik

Hospodarska_informatika_2015_2016a

č VaV- Publikačná činnosť

Kritériá Právnická fakulta

design-manual-umb-2015 copy

INTERPOLIS 2016

Formulár žiadosti o grant Ekonomickej univerzity v Bratislave pre mladých učiteľov, vedeckých pracovníkov a doktorandov v dennej forme štúdia Názov na

Prezentácia ústavu

Univerzita Pavla Jozefa Šafárika v Košiciach Právnická fakulta Návrh habilitačnej komisie Uchádzačka: JUDr. Renáta Bačárová, PhD., LLM. Študijný odbor

NSK Karta PDF

Platný od: OPIS ŠTUDIJNÉHO ODBORU EKONOMIKA A RIADENIE PODNIKOV

geografia.pdf

Microsoft Word - ŠTATÚT RADY ŠKOLY

Nariadenie Komisie (EHS) č 2454_93 zoznam príloh.pdf

Jazykom riadená vizuálna pozornosť - konekcionistický model Igor Farkaš Katedra aplikovanej informatiky / Centrum pre kognitívnu vedu Fakulta matemati

Odkiaľ a kam kráča slovenská demografia po roku 1993

UNIVERZITA PAVLA JOZEFA ŠAFÁRIKA V KOŠICIACH VZDELÁVACÍ PROGRAM Moderná didaktická technika v práci učiteľa Aktualizačné vzdelávanie prof. MUDr. Ladis

Gymnázium, Park mládeže 5, Košice Umiestnenie žiakov maturitných ročníkov šk. roka 2016/2017 na vysokých školách a univerzitách Košice,

Vnútorný predpis Číslo: 2/ Výzva na predkladanie žiadostí o Inštitucionálne projekty MTF STU Vypracovala: doc. Ing. Kristína Gerulová

ISO Systémy manažérstva proti korupcii Svetový deň normalizácie 2018 Miroslav HRNČIAR Žilinská univerzita v Žiline

Správa o činnosti organizácie SAV

Microsoft Word - Argumentation_presentation.doc

Czêœæ+informatyczna+po+korekcie.pdf

Bez názvu-7

Platný od: OPIS ŠTUDIJNÉHO ODBORU MOLEKULÁRNA BIOLÓGIA

Zápis zo zasadnutia Akademického senátu FHV INIZA Dátum konania: Miesto konania: AD 312 Čas: 13,00 hod. Prítomní členovia AS FHV UNIZA: Paed

Ministerstvo životného prostredia Slovenskej republiky Slovenská agentúra životného prostredia Výskumný ústav vodného hospodárstva vás pozývajú na med

Platný od: OPIS ŠTUDIJNÉHO ODBORU ANTROPOLÓGIA

Platný od: OPIS ŠTUDIJNÉHO ODBORU SOCIÁLNA PSYCHOLÓGIA A PSYCHOLÓGIA PRÁCE

CHUDOBA KOSICE Program konferencie

Platný od: OPIS ŠTUDIJNÉHO ODBORU FILOZOFIA

vizualna_identita_au_manual_final.indd

Gymnázium, Park mládeže 5, Košice Umiestnenie žiakov maturitných ročníkov šk. roka 2017/2018 na vysokých školách a univerzitách Košice,

Francúzsko-slovenský paralelný korpus Dorota Vasilišinová, Radovan Garabík Jazykovedný ústav Ľ. Štúra SAV Bratislava, Slovakia

POZVÁNKA na 6. vedeckú konferenciu s medzinárodnou účasťou HODNOTENIE GENETICKÝCH ZDROJOV RASTLÍN PRE VÝŽIVU A POĽNOHOSPODÁRSTVO máj 2010 Hote

Prezentácia programu PowerPoint

000____OBAL1-ZZ s Eurom.vp

Strana 5526 Zbierka zákonov č. 590/2003 Čiastka NARIADENIE VLÁDY Slovenskej republiky zo 17. decembra 2003 o skúškach odbornej spôsobilosti pr

Paralelné algoritmy, cast c. 2

Uvod do slovenskeho jazyka

Filozofická fakulta Univerzity Mateja Bela v Banskej Bystrici VERBÁLNA MANIPULÁCIA Eva ulenová 2015

Čiastka 205/2004

BRATISLAVSKÁ VYSOKÁ ŠKOLA PRÁVA

Platný od: OPIS ŠTUDIJNÉHO ODBORU

Platný od: OPIS ŠTUDIJNÉHO ODBORU MOLEKULÁRNA CYTOLÓGIA

Platný od: OPIS ŠTUDIJNÉHO ODBORU ŠPORTOVÁ KINANTROPOLÓGIA

Snímka 1

Zaverecna sprava

nadpis

Akú úlohu zohráva materinský jazyk pri diagnostike komunikačnej kompetencie dieťaťa?

EURÓPSKA KOMISIA V Bruseli COM(2018) 366 final ANNEXES 1 to 2 PRÍLOHY k návrhu NARIADENIA EURÓPSKEHO PARLAMENTU A RADY ktorým sa ustanovuj

Zásady akreditačnej komisie na posudzovanie spôsobilosti fakúlt uskutočňovať habilitačné konanie a konanie na vymenovanie profesorov

1

Matematický model činnosti sekvenčného obvodu 7 MATEMATICKÝ MODEL ČINNOSTI SEKVENČNÉHO OBVODU Konečný automat predstavuje matematický model sekvenčnéh

Prenosový kanál a jeho kapacita

NSK Karta PDF

MZ.pdf

ECDL Syllabus V50 SK-V01

448pr1.vp

PREHĽAD PUBLIKAČNEJ ČINNOSTI

seminarna_rocnikova_a_bakalárska práca

Platný od: OPIS ŠTUDIJNÉHO ODBORU

Centrum vedecko-technických informácií, Odbor pre hodnotenie vedy, Oddelenie pre hodnotenie publikačnej činnosti Vyhľadávanie a práca so záznamami - C

Snímka 1

ITMS kód Projektu: DODATOK Č. 10 K ZMLUVE O POSKYTNUTÍ NENÁVRATNÉHO FINANČNÉHO PRÍSPEVKU uzatvorený v zmysle 269 ods. 2 zákona č. 513/1991

POZVÁNKA NA XII. MEDZINÁRODNÚ VEDECKÚ KONFERENCIU MLADÝCH VEDECKÝCH PRACOVNÍKOV A DOKTORANDOV MLADÁ VEDA 2015 Veda a krízové situácie októbra

Microsoft Word - pe453195_sk.doc

Čiastka 3/2013

ST RUO

fadsgasga

SLOVENSKÝ JAZYK A LITERATÚRA NIŽŠIE STREDNÉ VZDELÁVANIE ISCED 2 VYUČOVACÍ JAZYK SLOVENSKÝ JAZYK VZDELÁVACIA OBLASŤ JAZYK A KOMUNIKÁCIA PREDMET SLOVENS

Microsoft Word - Podmienky_prijímacieho_konania-Bc._19-20.doc

Fórum cudzích jazykov (Časopis pre jazykovú komunikáciu a výučbu jazykov) 3/2014 VYSOKÁ ŠKOLA DANUBIUS ISSN

Oponentský posudok na vymenúvacie konanie doc. PhDr. Márie Šmidovej, PhD. za profesorku v odbore Sociálna práca vypracovaný v súlade s Vyhláško

Našej škole bol v roku 2018 úspešne schválený projekt Erasmus+ pod názvom Učenie sa a využívanie nových metód a technológií vo vyučovaní Čo to znamena

EN

Microsoft Word - manual_ESS_2010

Microsoft Word - prirucka_katedry_nova

rk_dp1_struktura_2019

Style Sample for C&N Word Style Sheet

MESTO STARÁ ĽUBOVŇA Mestský úrad, Obchodná č. 1, Stará Ľubovňa P O Ž I A D A V K A na verejné obstarávanie tovarov, stavebných prác a služieb v

Platný od: OPIS ŠTUDIJNÉHO ODBORU ANDRAGOGIKA

Microsoft Word - DEOV.doc

Formulár na zverejňovanie informácií o habilitačnom konaní

Prepis:

SLOVEN INA A EŠTINA V PO ÍTA OVOM SPRACOVANÍ Zborník referátov zo seminára, Bratislava 26. 27. októbra 2001, Veda, Vydavate stvo Slovenskej akadémie vied, Bratislava 2001, 194 s. lánok bol publikovaný v Jazykovednom asopise (2003, ro ník 54,. 1-2, s. 91 95). Zdá sa, že problematika po íta ovej a korpusovej lingvistiky sa posúva oraz viac do stredobodu pozornosti odborných lingvistických a informatických sfér aj v našich zemepisných šírkach. Prejavom toho bola aj konferencia o po íta ovom spracovaní sloven iny a eštiny, ktorá sa uskuto nila v Bratislave polovicou jesene roku 2001. Zámerom organizátorov bolo zvýšenie vzájomnej informovanosti medzi slovenskými odbornými kruhmi zaoberajúcimi sa po íta ovou lingvistikou, ale aj prezentácia výsledkov práce v po íta ovom spracovaní eštiny prostredníctvom vedúcich eských odborníkov z tejto oblasti. O interdisciplinarite po íta ového spracovania prirodzeného jazyka sved í aj široký záber a polia pôsobnosti v ktorých pracujú ú astníci tejto konferencie. Príspevky z nej vyšli v zborníku, ktorý je predmetom prítomnej recenzie. Zborník otvára štúdia Jana Haji a (Ústav formální a aplikované lingvistiky, Matematickofyzikální fakulta UK, Praha) Statistické modelování a automatická analýza p irozeného jazyka (s. 11 33). Jej názov do istej miery odzrkad uje aj prevládajúci trend v sú asnej po íta ovej lingvistike. Štatistické a pravdepodobnostné modelovanie má v sú asnosti mnoho praktických aplikácií, z ktorých známejšie sú napr. OCR (Optical Character Recognition), iže optické rozpoznávanie naskenovaného textu, alebo analýza a syntéza akustického re ového signálu. Haji sa v príspevku zameriava na automatickú morfologickú analýzu a dezambiguáciu, jej prepojenie na (polo-) automatickú syntaktickú analýzu a automatický preklad medzi geneticky príbuznými jazykmi. V procese automatickej morfologickej analýzy je východiskom morfologický slovník, ktorý obsahuje informácie o prípustných lexikálnych a rela ných morfémach v danom jazyku, alej súbor zna iek (angl. tagset), ktoré reprezentujú morfologické kategórie a matematický model, pod a ktorého analýza prebieha. Nevyhnutným predpokladom je aj tzv. trénovací korpus, iže súbor textov, ktorý bol predtým ru ne morfologicky analyzovaný pod a vopred zvoleného tagsetu. Na tomto korpuse sa program, ktorý je implementáciou daného štatistického modelu, nau í pravdepodobnostné vz ahy medzi slovnými tvarmi a ich možnými morfologickými interpretáciami. Ke že je výsledok takejto analýzy v dôsledku tvarovej homonymie pomerne nejednozna ný (napr. politika N. sg. ž. r. aj G. sg. m. r.), aplikuje sa proces dezambiguácie, ktorý takisto pracuje na 1

štatistickom základe. Úspešnos takejto analýzy sa pre eštinu a iné slovanské jazyky pohybuje okolo 94 %. Automatickú morfologickú analýzu Haji využíva aj v strojovom preklade vo fáze analýzy a syntézy slovných tvarov východiskového a cie ového jazyka. Výsledky strojového prekladu medzi geneticky (a štruktúrne) príbuznými slovanskými jazykmi sú pomerne dobré pre sloven inu a eštinu (okolo 90%), horšie pre eštinu a po štinu (asi 75%). V príspevku Identifikácia paradigmatických a syntagmatických vz ahov v texte (s. 34 48) sa Karol Furdík (Juvier, s. r. o, Košice) venuje popisu teoretického modelu, ktorý by bol schopný identifikova a reprezentova paradigmatické a syntagmatické vz ahy v texte. Tento model je založený na algoritme induktívneho inkrementálneho u enia. Takýto algoritmus by pozostával z viacerých modulov, ktoré by vedeli vstupný text segmentova, identifikova a explicitne reprezentova jazykové jednotky pomocou vhodne zvoleného formálneho jazyka. lánok Eduarda Kostolanského a Jany Hašanovej (Laboratórium po íta ovej lingvistiky, Pedagogická fakulta UK, Bratislava) Spracovanie morfologickej roviny sloven iny po íta om (s. 49 87) predstavuje opis modelu morfologickej analýzy a generovania slovných tvarov v sloven ine. Hlavnou myšlienkou je možnos generovania slovných tvarov sloven iny pomocou virtuálneho slovníka, ktorý nesie komplexné údaje o vzoroch ohýbania, tvarotvorných základoch a ich zmenách, súbore ohýbacích prípon, pravidlách formovania jednotlivých slovných tvarov a údaje o konkrétnych ohýbaných slovách. Všetky tieto údaje sa získali z textového materiálu Krátkeho slovníka slovenského jazyka a boli uložené vo forme referen nej morfologickej databázy. Výskumný tím Milan Rusko Sachia Daržágín Marián Trnka z Ústavu informatiky SAV prezentuje výsledky svojho výskumu v lánku Databázy pre rozpoznávanie a analýzu re i v sloven ine (s. 88 97). Takéto databázy majú v komer nej sfére aplikácie v hlasových telefonických službách, ktoré poznáme z každodenného života (napr. informácie o odchode dopravných spojení, teleshopping, telebanking, voice mail at.). Autori sa zamýš ajú nad sú asnými teoretickými prístupmi v rozpoznávaní re i (skryté markovovské modely a neurónové siete) a predstavujú priebeh a výsledok tvorby prvej slovenskej telefonickej re ovej databázy SpeechDat-e. Jozef Ivanecký (IBM Voice Systems, European Speech Research; Katedra kybernetiky a umelej inteligencie, Fakulta elektrotechniky a informatiky, Technická univerzita, Košice) sa v dvoch príspevkoch venuje automatickej fonetickej transkripcii v po íta ovom rozpoznávaní re i. V prvom, nazvanom SAMPA v sloven ine a jej význam z poh adu viacjazy ných systémov na rozpoznávanie re i (s. 98 116), autor prezentuje vlastné skúsenosti pri vývine 2

fonetickej abecedy SAMPA (Speech Assesment Methods Phonetic Alphabet) pre sloven inu. Vo viacjazy ných systémoch na rozpoznávanie re i je hlavnou požiadavkou vzájomná kompatibilita jednotlivých transkrip ných systémov. Pod a Ivaneckého sú výhodami kódovania SAMPA práve vhodnos a rozšírenos použitia vo viacjazy ných systémoch. V druhom príspevku s názvom Automatická transkripcia sloven iny v po íta ovom rozpoznávaní re i (s.117 120) sa Ivanecký venuje problematike automatickej fonetickej transkripcie v teoretickej rovine a predstavuje možný spôsob riešenia tohto problému v sloven ine. Pre sloven inu volí autor transkrip né pravidlá vychádzajúce z prác A. Krá a, výstupnou abecedou je autorom navrhovaná SAMPA. Ako problematický jav sa Ivaneckému ukázal rozdiel v spisovnej a hovorovej výslovnosti. Ke že systém pracuje primárne s pravidlami pre spisovnú výslovnos, bolo nutné do ho implementova pre nespisovnú výslovnos, pretože ich zanedbanie by mohlo vies v transkripcii. aj pravidlá k chybným výstupom Ukážkou, že peniaze európskych da ových poplatníkov sa prostredníctvom európskych inštitúcii môžu niekedy prerozde ova aj zmysluplne, je projekt COP-58 ONOMASTICA, ktorý vznikol v rámci programu COPERNICUS. Jeho výsledky prezentuje slovenský ú astník projektu Peter ur o (Akadémia policajného zboru, Bratislava) v príspevku Viacjazy ný výslovnostný slovník vlastných mien a názvov lokalít. V rámci tohto projektu boli vytvorené jazykové zdroje obsahujúce okolo 1,8 milióna vlastných mien v siedmich jazykoch strednej a východnej Európy ( eština, sloven ina, po ština, estón ina, litov ina a ukrajin ina). Autor sa v príspevku venuje technickým aspektom (kódovanie textov, používate ské rozhranie) využitia týchto textových databáz a poukazuje (ak nie rovno nabáda) na možnos týchto hodnotných dát na alší výskum v po íta ovej a korpusovej lingvistike. použitia Dva príspevky pražských korpusových lingvistov z Ústavu eského národného korpusu sú prezentáciou aktuálneho stavu zatia najrozsiahlejšieho a úrov ou spracovania najkvalitnejšieho korpusu textov v slovanských jazykoch. V teoreticko-metodologickej štúdii eský národní korpus: Stav v roce 2001 (s. 121 135) sa vedúci eského korpusového projektu, František ermák, vracia k základným pojmom z oblasti korpusovej lingvistiky (korpus, reprezentatívnos, štandardizácia, zna kovanie, konkordancie), predstavuje fázy budovania a sú asnú štruktúru eského národného korpusu a nazna uje aspekty práce a využitia korpusových dát v lingvistickej ako aj nelingvistickej sfére. Michal K en sa zase v príspevku eský národní korpus po íta ová demonstrace (s. 136 141) zameriava na popis technických aspektov budovania a využitia NK (získavanie textov, skenovanie, prevod textov do jednotného formátu, externá anotácia, používanie korpusového manažéra) a 3

problémom s tým spojeným. Vlasta K e ková (Fakulta humanitných vied UMB, Banská Bystrica) v príspevku Informácie v terminologických databázach a ich využívanie pri preklade odborných textov (s. 142 149) predstavuje aspekty tvorby terminologických databáz z rozli ných oblastí (sociálna ochrana, vodohospodárstvo, ochrana životného prostredia, knižni ná a informa ná veda) v slovenskom aj európskom kontexte. K e ková popisuje štruktúru položiek terminologickej databázy, ktoré môžu nies lingvistické aj encyklopedické informácie. Zvy ajne terminologický záznam v lingvistickej rovine obsahuje okrem termínu v základnej gramatickej forme aj jeho synonymá, varianty, symboly, skrátené formy, inojazy né ekvivalenty, kolokácie, grafické reprezentácie, hyponymá a hyperonymá. alej sú tu technické informácie o identifikátore termínu, symbole jazyka, dátume vytvorenia záznamu, identifikátori tvorcu záznamu, kóde inštitúcie, informáciach o zdrojoch a pod. Autorka propaguje myšlienku využitia (a pravdaže aj budovania) takto informa ne bohatej databázy v prekladate skej innosti a podáva stru nú sondu o používate ských návykoch prekladate ov s terminologickými databázami (naj astejšie vyh adávané položky a pod.). Ojedinelým a pozoruhodným je projekt slovníka štúrovskej sloven iny a jeho po íta ovej podpory, ktorý vo svojom rovnomennom lánku (s. 150 154) predstavuje ubomír Kral ák (Katedra slovenského jazyka Filozofickej fakulty UKF Nitra). Ústredným problémom v tomto projekte je pod a autora otázka periodizácie textov štúrovského obdobia, ktorú nazýva vertikálnou rovinou vymedzenia inventára textov. V záujme zachytenia vzácnych jazykových javov sa prihovára za jej maximalizáciu. Hornú a dolnú asovú hranicu pre výber štúrovských textov zatia nekonkretizuje, iba uvádza rozdielne chápanie štúrovského obdobia u viacerých jazykovedcov (Pauliny, Furdík). alšími problematickými okruhmi sú otázky vhodnosti zaradenia textov pod a kritéria publikovanosti/rukopisnosti textového materiálu a lexikálne okazionalizmy, kalky a výpoži ky štúrovských autorov. Z informatického h adiska podpory projektu Kral ák uvádza naliehavos vytvorenia efektívneho vyh adávacieho softwaru a cie vybudova textový korpus štúrov iny v rozsahu 15 miliónov slovných tvarov. Nevyhnutnos existencie nového reprezentatívneho slovníka sú asnej eštiny zdôraz uje Karel Pala (Katedra informa ních technologií, Fakulta informatiky, MU Brno). Jazykovou materiálovou základ ou pre jeho vznik by mala by eská lexikálna databáza (CLD), ktorej koncepciu Pala predstavuje v príspevku Návrh eské lexikální databáze (s. 155 167). Databáza by mala obsahova približne 60 000 heslových slov a 105 000 významov. Z tohto po tu až 20 000 jednotiek by tvorili slovesá, ktoré Pala považuje za základné rela né prvky v jazyku, viažuce na seba iné slovné druhy (hlavne substantíva). Základnými jednotkami 4

v databáze by mali by lémy (slovo v základnom, slovníkovom gramatickom tvare), resp. štandardné kolokácie (napr. telefónny zoznam, vysoká škola a pod.). Lingvistické informácie, ktoré sa v databáze pod a návrhu majú ocitnú sú: fonologická (fonetická) informácia, morfologická informácia, významy, sémantické rysy, hypero/hyponymické vz ahy, sémantické triedy, synonymické rady, syntaktické informácie, lokálne kontexty, typické použitie, kolokácie, pragmatické informácie, pôvod, logický typ a encyklopedická informácie. Tieto položky sa v databáze reprezentujú ako polia, zapísané vo formáte XML. Na konci príspevku sa uvádzajú aj konkrétne príklady možných slovných záznamov v databáze. Na Palov príspevok obsahovo nadväzuje Pavel Smrž (Fakulta informatiky, MU Brno) v lánku Slovníková data ve formátu XML (s. 168 180). Zdôraz uje výhody použitia zna kovacieho jazyka XML (extensible Markup Language) na reprezentáciu zložito štruktúrovaných dát, akými sú práve slovníkové dáta. Medzi tie by mali patri schopnos validácie formy a obsahu dokumentu pomocou defini ného jazyka XML Schema, možnos transformácie dokumentu a jeho elementov do ubovo ného formátu pomocou formátovacieho jazyka XSLT (extensible Stylesheet Language), výkonný mechanizmus zadávania vyh adávacích otázok XQuery, štandardy pre definíciu odkazov medzi XML dokumentmi mechanizmom Xlink at. Okrem zdôraz ovania výhod XML uvádza Smrž ako najznámeší projekt slovníkového využitia XML anglický výkladový slovník Oxford English Dictionary Online a popisuje aj priebeh prevodu Slovníka spisovného slovníka jazyka eského do XML formátu. Získané skúsenosti formuluje ako odporú ania pre obdobné projekty. Zborník uzatvára retrospektívny poh ad Vladimíra Benka (Laboratórium po íta ovej lingvistiky, Pedagogická fakulta UK, Bratislava) na po íta ovú podporu lexikografických projektov na Slovensku (s. 181 194). Autor spomína na za iatky svojej práce v oblasti elektronizácie slovníkových dát, ktorá sa ukázala by vo svojom ase (1987) nevyhnutnou (a poslednou) možnos ou záchrany 1. vydania Krátkeho slovníka slovenského jazyka. V priebehu jej uskuto ovania Benko navrhol zna kovací jazyk MOM (My Own Markup), ktorým sa zaznamenávajú informácie o štruktúre slovníka z typografického h adiska (kurzíva, (polo)tu né písmo, rôzne ve kosti písma a pod.). Táto forma slovníkovej reprezentácie sa ukázala by nato ko efektívna z h adiska práce lexikografov i kvality slovníka, že sa uplatnila aj v 3. a 4. zväzku Historického slovníka slovenského jazyka (1992) a (1993), Synonymickom slovníku sloven iny (1995) a 3. vydaní Krátkeho slovníka slovenského jazyka (1997). Alexander Horák 5