Hlavní obsah

Olomoučtí vědci přišli s technologií, která určí autora textu i jeho psychické rozpoložení

Olomouc
Aktualizováno

Vědci z Filozofické fakulty Univerzity Palackého v Olomouci vyvinuli technologii, která dokáže pomocí rozboru textu určit jeho autora, jeho psychické rozpoložení či sociální prostředí. Při svém výzkumu analyzovali frekvenci slov v textech spisovatelů, politiků i vrahů a získané poznatky využili při tvorbě postupu pro profilování osob.

Foto: Univerzita Palackého

Filozofická fakulta UP (ilustrační foto).

Článek

Technologii lze využít v přizpůsobení internetového obsahu konkrétnímu uživateli, reklamě, personalistice, psychologii, kriminalistice i v oblasti bezpečnosti státu. Novinku už eviduje patentový úřad Spojených států, jak sdělil v úterý novinářům Dan Faltýnek z katedry obecné lingvistiky FF UP.

Odborníci z dané katedry se frekvenčními analýzami textu zabývají už několik let, metoda se používá kupříkladu při určení autorství psaného slova. Dosud se vědci zaměřovali na slova s vyšší frekvencí výskytu, autoři nové metody zvolili odlišný postup.

„S kolegy jsme zjistili, že podle nízko frekventovaných, ale pravidelně rozmístěných, opakujících se slov lze autora poznat také. A co víc, ještě s vyšší mírou jistoty. Už několik let se tedy zaměřujeme na opačné spektrum, na zvláštní skupinu slov v dané slovní zásobě konkrétního člověka,“ popsal Faltýnek.

Nový nanomateriál pomůže odhalit a likvidovat těžké kovy ve vodě. Je navíc recyklovatelný

Věda a školy

Při analýze výzkumníci pracovali s texty spisovatelů, jako je Jack Kerouac nebo Joanne K. Rowlingová, zkoumali písemné projevy Karla Marxe, Silvia Berlusconiho či Václava Havla, texty masových vrahů (Elliot Roger či Theodore Kaczynski), dále i vzorky textů podnikatele a miliardáře Elona Muska.

Havel kladl důraz na „konečně“

Metoda je podle lingvistky Martiny Benešové založená na tom, že odborníci v textu hledají jakýsi slovní otisk, který lze použít při analýze a určení autora textu. Třeba z rozboru mnoha Havlových textů vyplynulo, že kladl důraz na slovo „konečně“.

„Postupem času jsme vyvinuli technologii, která nám umožňuje najít nízko frekventovaná klíčová slova, která jsou společně s důrazem na postoj řečníka k určitému tématu otiskem autora,“ podotkl Faltýnek.

S výukou občanské výchovy pomůže umělá inteligence DigiHavel

Věda a školy

Objev je podle něj převratný, neboť dosavadní metody takto vysokou jistotu autorství textu nepřinášely. Olomouckým vědcům nyní díky nové technologii stačí analyzovat pouze 200 až 500 slov, aby mohli s určitou mírou přesnosti dokázat autorství.

Pokud mají k dispozici přibližně 1500 slov, tak jsou schopni autorství zaručit s velmi vysokou mírou pravděpodobnosti. Dříve si byli jisti až po analýze 6000 slov.

Odhalit motiv?

Nová technologie podle Benešové dokáže extrahovat profil lidí. Opakování určitých slov může poukázat na psychických stav člověka nebo jeho sociální prostředí. Vědce např. šokovaly výsledky analýzy manifestu amerického vraha, ze které vyplynul jeho motiv i místo následného násilného činu.

Novou technologii lze využít v personalistice, online psychoterapii, soudnictví nebo při komunikaci s ohroženými skupinami. Své místo najde také v personalizované reklamě i v boji proti extremismu, terorismu či dezinformacím, jelikož umožňuje určit inkriminované osoby. Lze ji využít i na obranu proti personalizaci člověka na internetu.

„Nejjednodušší variantou využití naší technologie bude v dohledné době aplikace, která lidem umožní dozvědět se něco o sobě a pomůže jim v seberozvoji,“ řekla Benešová.

Olomoucká technologie s názvem „System and method for adapting text-based data structures to text samples“ je v tuto chvíli již pod patentovou ochranou.

Forenzní genetička Halina Šimková: Všude, kde se pohybujete, zůstává vaše DNA

Móda a kosmetika

Výběr článků

Načítám