Hello, world! Расизам у машинерији обраде природног језика - Званична блог страница мултидисциплинарних Студија при Универзитету у Београду

Hello, world! Расизам у машинерији обраде природног језика

Autor:
Tijana Radović
Tijana Radović

Међу бројним догађајима, ову годину је нажалост обележила смрт Афроамериканца Џорџа Флојда, који је убијен услед последица полицијске бруталности. Његова смрт довела је до побуне против системског расизма и покренула серију антирасистичких протеста под паролом #BlackLivesMatter. Заинтересовало ме је какав је генерални сентимент који је исказан према људима црне расе, у којим темама се јављају Афроамериканци, као и да ли је расизам упркос актуелним протестима остао једнако присутан у културолошкој и друштвеној парадигми америчког друштва, те сам одлучила да применом поступака из области анализе текста покушам да дам одговор на ова питања.

Уколико сте се, као ја, заљубљени у лингвистику, или неку другу друштвену науку, а слутите да је време да је сагледате из неке друге перспективе, и додате јој мало рачунарске магије, верујем да ће вам овај текст у којем ће бити представљен пут дипломиране лингвисткиње која је коначно успела са техничким и природним наукама да “пређе на ти“, бити од помоћи.

Ову тему сам одабрала за свој мастер рад јер сам желела да спојим језик, који је за мене био и остао најинтригантнији предмет истраживања будући да представља способност која људску врсту разликује од сваке друге, са новим стеченим знањима из области рачунарства. Уз смернице које сам добијала од сјајних професора на програму наишла сам на савршен спој језика и рачунарских метода у области обраде природног језика (енг. Natural Language Processing – NLP) и анализе текста (енг. text mining) у којима се применом различитих статистичких и рачунарских техника из велике количине неструктуираних текстуалних података моделира шира слика и добија јасан приказ онога што текст представља и о чему се у њему говори. У преводу на језик филолога ове технике ће вам помоћи да одгонетнете “шта је писац хтео да каже?“.

Како бих адекватно одговорила на горе поменута питања отворила сам врата изузетно великом броју нових истраживачких изазова: од преузимања текстуалних података са друштвених мрежа, преко претпроцесирања текста које је укључивало редукцију нискофреквентних речи, знакова интерпункције, симбола и сличног “шума“ у тексту, до анализа на основу чијих резултата сам могла да донесем одговарајуће закључке. Такође, различите могућности визуализације омогућиле су ми да на кретиван и прегледан начин представим резултате најчешће генерисањем облака речи (енг. word cloud) у којем су биле представљене најфреквентније речи из текста. На корпусу твитова америчких становника спровела сам анализу сентимената помоћу које сам одредила доминант поларитет текста, док ми је техника моделовања тема омогућила да струкурирам неструктуирани текст и јасније га сагледам помоћу детектовања тема.

Резултати ових двеју анализа показали су да се у тексту издвајају 4 теме: супериорност људи беле расе и дискриминаторна понашања над Афроамериканцима, основне идеје и концепти на којима се заснива антирасистички покрет #BlackLivesMatter, убиство Џорџа Флојда као протести на улицама Америке настали као реакција на овај догађај. Показано је да је доминантан поларитет текста негативан, односно да су амерички становници у својим твотовима кроз сваку од ових тема исказивали негативан сентимент.

Наиме, иако примарно заклети друштвењак, заинтригирана појмом интердисциплинарности са којим сам се упознала у Петници, желела сам да свом истраживачком духу и фасцинираности језиком приђем из неког другог угла и у том правцу наставим своје академско образовање. То је био разлог због којег сам одлучила да се окушам у до тада потпуно непознатим водама уписавши се на мастер програм Рачунарство у друштвеним наукама, за који сам на основу описа претпоставила да ће бити баш оно што ми је у том тренутку било потребно. Иако нисам била до краја сигурна у шта се упуштам, знала сам да нећу погрешити, и нисам. Сада, годину дана касније, поред мноштва стечених нових знања и вештина са овог мастер програма носим једно ретко дивно искуство које ми је помогло да се ослободим, проширим видике и упознам низ стручњака у области који су ми стрпљиво и ревносно откривали чари света рачунарства.

Као потпуни почетник у области анализе текста и употребе програмских језика била сам позитивно изненађена количином доступних и јако корисних материјала на интеренту уз помоћ којих сам савладавала недоумице. Такође, од неизмерног значаја била је помоћ коју сам добијала од своје менторке, докторке Јелене Јовановић, која је, као и други професори на програму, у потпуности разумевала моје почетничке страхове и потешкоће и својим стручним коментарима и смерницама пружала објашњења и подршку која је била потребна да успешно завршим мастер рад.

За крај, како бих јасније сагледала искуство које сам стекла на овом мастер програму, у складу са циљевима свог мастер рада, издвојићу теме и генералан сентимент који је преовладао у овој години ових студија: прегршт нових практичних знања, сарадња са изузетним професорима, организованост, креативност, интердисциплнарност и позитиван сентимент који се провлачи кроз сваку од ових тема који је значајно обогатио и довео до развитка мој академског, а свакако и животног пута.












Рачунарство у друштвеним наукама

Студијски програм Рачунарство у друштвеним наукама осмишљен је као програм у коме би студенти који су завршили основне академске студије у некој од области друштвених наука (правне науке, економске науке, филозофија, психологија, социологија, демографија…), савладали коришћење савремених рачунарских технологија у друштвеним наукама. Студенти стечена знања могу применити уз коришћење савремених Интернет технологија и сервиса, разних софтверских алата, као и на начин који је обогаћен квантитативним анализама.

Потреба за студијским програмом проистиче из чињенице да је све већа потражња за стручњацима из области друштвених наука који у свом послу интензивно користе савремене технологије. Понуда послова, кретања на тржишту, као и трендови у привреди, друштву, органима државне управе и другим јавним институцијама, недвосмислено указују на ту чињеницу. Студије су акредитоване за извођење на српском и енглеском језику.

Завршетком студија кандидати стичу академски назив Мастер рачунарства у друштвеним наукама.