Hello, world! Rasizam u mašineriji obrade prirodnog jezika - Zvanična blog stranica multidisciplinarnih Studija pri Univerzitetu u Beogradu

Hello, world! Rasizam u mašineriji obrade prirodnog jezika

Autor:
Tijana Radović
Tijana Radović

Među brojnim događajima, ovu godinu je nažalost obeležila smrt Afroamerikanca Džordža Flojda, koji je ubijen usled posledica policijske brutalnosti. Njegova smrt dovela je do pobune protiv sistemskog rasizma i pokrenula seriju antirasističkih protesta pod parolom #BlackLivesMatter. Zainteresovalo me je kakav je generalni sentiment koji je iskazan prema ljudima crne rase, u kojim temama se javljaju Afroamerikanci, kao i da li je rasizam uprkos aktuelnim protestima ostao jednako prisutan u kulturološkoj i društvenoj paradigmi američkog društva, te sam odlučila da primenom postupaka iz oblasti analize teksta pokušam da dam odgovor na ova pitanja.

Ukoliko ste se, kao ja, zaljubljeni u lingvistiku, ili neku drugu društvenu nauku, a slutite da je vreme da je sagledate iz neke druge perspektive, i dodate joj malo računarske magije, verujem da će vam ovaj tekst u kojem će biti predstavljen put diplomirane lingvistkinje koja je konačno uspela sa tehničkim i prirodnim naukama da “pređe na ti“, biti od pomoći.

Ovu temu sam odabrala za svoj master rad jer sam želela da spojim jezik, koji je za mene bio i ostao najintrigantniji predmet istraživanja budući da predstavlja sposobnost koja ljudsku vrstu razlikuje od svake druge, sa novim stečenim znanjima iz oblasti računarstva. Uz smernice koje sam dobijala od sjajnih profesora na programu naišla sam na savršen spoj jezika i računarskih metoda u oblasti obrade prirodnog jezika (eng. Natural Language Processing – NLP) i analize teksta (eng. text mining) u kojima se primenom različitih statističkih i računarskih tehnika iz velike količine nestruktuiranih tekstualnih podataka modelira šira slika i dobija jasan prikaz onoga što tekst predstavlja i o čemu se u njemu govori. U prevodu na jezik filologa ove tehnike će vam pomoći da odgonetnete “šta je pisac hteo da kaže?“.

Kako bih adekvatno odgovorila na gore pomenuta pitanja otvorila sam vrata izuzetno velikom broju novih istraživačkih izazova: od preuzimanja tekstualnih podataka sa društvenih mreža, preko pretprocesiranja teksta koje je uključivalo redukciju niskofrekventnih reči, znakova interpunkcije, simbola i sličnog “šuma“ u tekstu, do analiza na osnovu čijih rezultata sam mogla da donesem odgovarajuće zaključke. Takođe, različite mogućnosti vizualizacije omogućile su mi da na kretivan i pregledan način predstavim rezultate najčešće generisanjem oblaka reči (eng. word cloud) u kojem su bile predstavljene najfrekventnije reči iz teksta. Na korpusu tvitova američkih stanovnika sprovela sam analizu sentimenata pomoću koje sam odredila dominant polaritet teksta, dok mi je tehnika modelovanja tema omogućila da strukuriram nestruktuirani tekst i jasnije ga sagledam pomoću detektovanja tema.

Rezultati ovih dveju analiza pokazali su da se u tekstu izdvajaju 4 teme: superiornost ljudi bele rase i diskriminatorna ponašanja nad Afroamerikancima, osnovne ideje i koncepti na kojima se zasniva antirasistički pokret #BlackLivesMatter, ubistvo Džordža Flojda kao protesti na ulicama Amerike nastali kao reakcija na ovaj događaj. Pokazano je da je dominantan polaritet teksta negativan, odnosno da su američki stanovnici u svojim tvotovima kroz svaku od ovih tema iskazivali negativan sentiment.

Naime, iako primarno zakleti društvenjak, zaintrigirana pojmom interdisciplinarnosti sa kojim sam se upoznala u Petnici, želela sam da svom istraživačkom duhu i fasciniranosti jezikom priđem iz nekog drugog ugla i u tom pravcu nastavim svoje akademsko obrazovanje. To je bio razlog zbog kojeg sam odlučila da se okušam u do tada potpuno nepoznatim vodama upisavši se na master program Računarstvo u društvenim naukama, za koji sam na osnovu opisa pretpostavila da će biti baš ono što mi je u tom trenutku bilo potrebno. Iako nisam bila do kraja sigurna u šta se upuštam, znala sam da neću pogrešiti, i nisam. Sada, godinu dana kasnije, pored mnoštva stečenih novih znanja i veština sa ovog master programa nosim jedno retko divno iskustvo koje mi je pomoglo da se oslobodim, proširim vidike i upoznam niz stručnjaka u oblasti koji su mi strpljivo i revnosno otkrivali čari sveta računarstva.

Kao potpuni početnik u oblasti analize teksta i upotrebe programskih jezika bila sam pozitivno iznenađena količinom dostupnih i jako korisnih materijala na interentu uz pomoć kojih sam savladavala nedoumice. Takođe, od neizmernog značaja bila je pomoć koju sam dobijala od svoje mentorke, doktorke Jelene Jovanović, koja je, kao i drugi profesori na programu, u potpunosti razumevala moje početničke strahove i poteškoće i svojim stručnim komentarima i smernicama pružala objašnjenja i podršku koja je bila potrebna da uspešno završim master rad.

Za kraj, kako bih jasnije sagledala iskustvo koje sam stekla na ovom master programu, u skladu sa ciljevima svog master rada, izdvojiću teme i generalan sentiment koji je preovladao u ovoj godini ovih studija: pregršt novih praktičnih znanja, saradnja sa izuzetnim profesorima, organizovanost, kreativnost, interdisciplnarnost i pozitivan sentiment koji se provlači kroz svaku od ovih tema koji je značajno obogatio i doveo do razvitka moj akademskog, a svakako i životnog puta.


Računarstvo u društvenim naukama

Studijski program Računarstvo u društvenim naukama osmišljen je kao program u kome bi studenti koji su završili osnovne akademske studije u nekoj od oblasti društvenih nauka (pravne nauke, ekonomske nauke, filozofija, psihologija, sociologija, demografija…), savladali korišćenje savremenih računarskih tehnologija u društvenim naukama. Studenti stečena znanja mogu primeniti uz korišćenje savremenih Internet tehnologija i servisa, raznih softverskih alata, kao i na način koji je obogaćen kvantitativnim analizama.

Potreba za studijskim programom proističe iz činjenice da je sve veća potražnja za stručnjacima iz oblasti društvenih nauka koji u svom poslu intenzivno koriste savremene tehnologije. Ponuda poslova, kretanja na tržištu, kao i trendovi u privredi, društvu, organima državne uprave i drugim javnim institucijama, nedvosmisleno ukazuju na tu činjenicu. Studije su akreditovane za izvođenje na srpskom i engleskom jeziku.

Završetkom studija kandidati stiču akademski naziv Master računarstva u društvenim naukama.