Hlavní obsah

Nářečí Česka zmapuje unikátní fonotéka, na webu bude do čtyř let

Žádné z malebných nářečí Čech, Moravy a Slezska nezůstane pro budoucnost zapomenuto. Pilně na tom pracují vědci z řad odborníků na jazyk český a informační technologie. Do čtyř let zpřístupní veřejnosti na internetových stránkách jamap.cz unikátní nářeční fonotéku ČR. Každý si v ní bude moci poslechnout nářečí z vybrané oblasti. Snem vědců je technicky náročné vytvoření chatbota, tedy systému schopného komunikovat nářečím.

Foto: archiv Akademie věd ČR

Nahrávky nářečí pro nářeční fonotéku vznikají již od 50. let minulého století.

Článek

Tým češtinářů od poloviny 50. let minulého století shromáždil již přes 2000 zvukových nahrávek, což je zhruba 700 až 800 hodin povídání. Nejstarší audia se pořizovala na kotoučové magnetofony.

Všechny nahrávky se podařilo zdigitalizovat. Pro lepší práci s nimi je ale nyní nutné je dále roztřídit, což už je úkol pro tým IT specialistů.

Putování nářečími i dějinami

Vznikne unikátní fonotéka nářečí, kterou se v Evropě zatím nemůže žádná jiná země pochlubit.

Petr Čichoň: Konec nářečí v Kunderově kině. Literární reportáž z cyklu České bolesti

SALON

„Budete chtít vědět, jak se kdysi na Hané, tedy na střední Moravě, pekl chleba? No tak si to najdete podle tématu v internetové fonotéce a poslechnete si to v originále. Putovat bude možné nářečími i dějinami. Máme zajímavé vzpomínky na druhou světovou válku a jiné historické události,“ řekla Novinkám za vědecký tým Marta Šimečková z Ústavu pro jazyk český Akademie věd ČR.

Fonotéka dostupná zdarma pro širokou veřejnost na webu bude vyvrcholením mnoha desetiletí práce. Protože se bude stále doplňovat, nepůjde o pouhý historický archiv.

Nářečí Česka rozdělují vědci do čtyř základních skupin: české, středomoravské, východomoravské a slezské. Ty se pak dále štěpí na podoblasti. Někdy jsou rozdíly jen ve výslovnosti slova, v jiných případech mají dané regiony i své specifické výrazy. Pomůckou k tomu, jak dialekty rozlišit mezi sebou, je výslovnost písmen U a I.

Foto: archiv Akademie věd ČR

Marta Šimečková z Akademie věd ČR při nahrávce nářečí

Samotný přepis nářečí z audionahrávky do textu je technicky mimořádně náročný, odborníci si pro něj dokonce museli vymyslet speciální značky. Jen s jejich pomocí lze pak nářečí z textu správně přečíst.

Příkladem je tzv. obalované písmeno L, typické pro jih Moravy a Jablunkovsko. Píše se jako písmeno U s podivným háčkem dole. Vědci dále rozlišují tvrdé L, dále dlouhé L a měkké L.

Tým Martina Karafiáta z Fakulty informatiky brněnského Vysokého učení technického (VUT) se nyní snaží vytvořit systém, který bude schopen zvuková data automaticky přepisovat do textu i se všemi odbornými „klikyháky“, detailně popisujícími výslovnost.

Nářečí se učí neuronová síť

„Pro výzkumníky z Akademie věd ČR to bude obrovská pomoc. Jde o to, že nahrávky jsou velice specifická data a klasické přepisovače od Googlu či Microsoftu u nářečí prostě selhávají,“ vysvětlil Karafiát.

Největší překladový slovník v češtině je po padesáti letech celý online

Věda a školy

Tím ale možnosti nově vyvíjené fonotéky nekončí. Systém bude schopen nahrávky tematicky třídit a sám bude schopen rozeznávat dialekty; např. na Moravě jazyk Moravského Slovácka od Valašska, nářečí z Horácka anebo z Hané.

Tým už loni na podzim vytvořil první verzi systému pro identifikaci dialektu. „Ten je momentálně schopen zhruba na 90 procent rozlišit čtyři hlavní nářeční skupiny. Když je ale rozdělíme na 13 podskupin, tak už je úspěšnost jen okolo 60 procent. Bude se to zdokonalovat. Naše neuronová síť je sice trénovaná na 106 cizích jazycích, ale český jazyk se všemi jeho dialekty je pro ni zatím velkou neznámou,“ doplnil Karafiát.

Ve vyhledávání pamětníků, kteří ještě dobová nářečí ovládají, pomáhají výzkumníkům obecní úřady, školy i folklorní spolky.

„Většinou se nám podaří v každé obci nahrát alespoň čtyři mluvčí. Dokumentujeme zejména promluvy seniorů, kteří jsou často rádi, že je někdo ochotný jejich vyprávění naslouchat. A navíc tím pomůžou dobré věci, totiž uchování jazykového kulturního dědictví příštím generacím,“ dodala Šimečková.

Staň se superdialektologem, vyzývají školáky vědci

Věda a školy

Související články

Výběr článků

Načítám