Back to top

Mednarodno sodelovanje

Članica UL UL Filozofska fakulteta
Šifra N6-0099
Naziv projekta Jezikovna krajina sovražnega govora na družbenih omrežjih
Obdobje 1.3.2019 - 28.2.2023
Letni obseg 1,29 FTE
Vodja dr. Darja Fišer
Veda Humanistične vede
Sodelujoče RO

sicris

Institut "Jozef Stefan"

Vsebinski opis projekta  

Projekt LiLaH – Jezikovna krajina sovražnega govora na družbenih omrežjih je bilateralni raziskovalni projekt med Univerzo v Ljubljani in Univerzo v Antwerpnu, ki poteka od 2019 do 2022.

Namen projekta je (1) izdelati celovit jezikoslovni opis slovenskega in flamskega sovražnega govora na družbenih omrežjih, (2) izluščiti skupne značilnosti sovražnega govora ter (3) izsledke uporabiti pri razvoju računalniških modelov za samodejno prepoznavo sovražnega govora na družbenih omrežjih.

V projektu bosta zgrajena in nadgrajena flamski in slovenski korpus sovražnega govora, ki bosta vključevala komentarje na objave medijskih hiš na platformi Facebook, in sicer na temo migrantov in LGBT-skupnosti. Korpusa bosta primerljiva, bogato jezikoslovno označena in dopolnjena s sociodemografskimi podatki. Analiza bo vključevala in prepletala kvantitativne in kvalitativne metode raziskovanja, pri čemer bomo analizirali tako površinske značilnosti (npr. oblikoskladenjske lastnosti, besedišče) kot globinske značilnosti sovražnega govora (npr. vpliv konteksta). Izsledki iz posameznih korpusov bodo uporabljeni za primerjalno analizo med jezikoma. Na ta način želimo izluščiti univerzalne značilnosti sovražnega govora, ki presegajo eno jezikovno in kulturno okolje. Drugi poudarek projekta je na uporabi strojnega učenja za razvoj modelov, ki bodo služili za prepoznavo neposrednega in posrednega sovražnega govora na družbenih omrežjih.

Sestava projektne skupine SICRIS
Faze projekta in njihova realizacija  

DS 1 – Zbiranje, označevanje in obogatitev korpusa sovražnega govora (M1–M12)

Cilj prvega delovnega sklopa sta izgradnja flamskega korpusa in nadgradnja slovenskega korpusa družbeno nesprejemljivega govora, ki bosta služila kot osnova za raziskave v DS 2 in DS 3. Flamski korpus bo vseboval komentarje na objave medijskih hiš na platformi Facebook in bo tako v največji meri primerljiv s slovenskim korpusom, ki je bil zgrajen v okviru projekta FRENK. Visoka primerljivost bo zagotovljena tudi na ravni vsebovanih metapodatkov in različnih ravni oznak, ki bodo dodane obema korpusoma.

DS 2 – Analiza površinskih značilnosti sovražnega govora (M13–M30)

V tem DS bo poudarek na kvantitativni analizi površinskih jezikovnih značilnosti, ki jih je mogoče računalniško analizirati. Kjer se bo to izkazalo za smiselno, bomo rezultate kvantitativne analize dopolnili s kvalitativno interpretacijo. Delo bo obsegalo analizo pravopisne in oblikoskladenjske podobe komentarjev ter uporabljenega besedišča. Izvedli bomo tudi primerjalno analizo rezultatov, pridobljenih iz flamskega in slovenskega korpusa. Najizrazitejše značilke bodo uporabljene pri razvoju napovednih modelov za zaznavanje sovražnega govora.

DS 3 – Analiza globinskih značilnosti sovražnega govora (M25–M45)

Sovražni govor je pogosto izražen posredno, zato je tretji DS posvečen analizi globinskih jezikovnih značilnosti. Analiza diskurza se bo posebej posvetila raziskovanju jezikovnih praks za ustvarjanje drugega (ang. othering) in metafor, ki se uporabljajo pri tvorbi sovražnega govora. Poleg tega bo poudarek tudi na analizi jezikovne dinamike sovražnega govora, pri čemer se bomo osredotočili na sprožilce, razvoj diskurza, samoregulacijo komentatorjev, ipd. Izvedli bomo tudi primerjalno analizo rezultatov, pridobljenih iz flamskega in slovenskega korpusa. Najbolj izstopajoče ugotovitve bomo uporabili pri razvoju napovednih modelov za zaznavanje sovražnega govora.

DS 4 – Diseminacija (M13–M45)

Izsledki raziskav bodo objavljeni v relevantnih znanstvenih publikacijah in predstavljeni na konferencah. Viri in tehnologije, razvite v okviru projekta, bodo v skladu s pravilnikom o zasebnosti podjetja Facebook, Inc., dani na razpolago drugim raziskovalcem za nadaljnje analize, s čimer želimo spodbujati prizadevanja za odprto znanost. Dosežki projekta bodo v okviru zmožnosti predstavljeni tudi širši zainteresirani javnosti.

Bibliografske reference SICRIS

 

Univerza v Ljubljani, Filozofska fakulteta Institut Jozef Stefan

 

Javna agencija za raziskovalno dejavnost
Raziskovalni projekt je (so)financiran s strani Javne agencije za raziskovalno dejavnost.