Kuidas muudab suurandmed igapäevaelu kogu Ameerikas?

„Suurandmete” idee on muutunud üldlevinud, kuid mis see on ja kuidas see meie eluviisi muudab? Istusime koos andmeteadlase, Harvardi doktorikraadi ja riikliku raamatuauhinna nominendi Cathy O'Neiliga seda teada saada.

CT: Alustame põhitõdedest - mis täpselt on “suurandmed”?

CO: Suurandmed on uus lähenemisviis asjade ennustamiseks. Täpsemalt öeldes on „suurandmed” juhuslikult kogutud andmete kasutamine - näiteks see, kuidas otsite oma brauseri kaudu või mida teete Facebookis -, et järeldada teie kohta asju, näiteks seda, mida kavatsete osta või mis on teie poliitiline kuuluvus. See on kaudne viis inimeste kujutamiseks. Näiteks meid küsitlev kaamera ei küsi: „Mida sa teed?“ - tuleb lihtsalt vaadata, mida me teeme.

CT: Ja mis on algoritm?

CO: Algoritmid on arvutused, mis ennustavad teie kohta kogutud andmeid [tõlgendavad]. Mõelge sellele nagu matemaatiline võrrand, mis üritab vastata küsimusele, mis on sõnastatud ennustamisena, näiteks: "Kas see inimene kavatseb midagi osta?" või "Kas see inimene hakkab hääletama kellegi poolt?"

CT: Miks ma praegu sellest nii palju kuulen?

CO: Enne „suurandmeid” teeksid statistikud tuleviku väljamõtlemiseks kalleid asju, näiteks küsitleksid inimesi. Näiteks esitades inimestele otseküsimusi, näiteks: „Kelle poolt te hääletate?” Nüüd tugineme üha enam nn andmete ammendumisele, mida ma nimetan andmeteks, mida teie kohta pidevalt kogutakse, et teie kohta asju järeldada.

Enne „suurandmeid” oli ettevõtetel vaja teha vaid metsikuid oletusi. Nüüd on meil parem kui metsikud arvamised. Üllatav on see, et enamik suurandmete algoritme on metsikult ebatäpsed ja pole põhjust arvata, et neil on õigus. Kuid need on paremad kui metsikud arvamised. Ja sellepärast on suurandmed arenenud nii, nagu ta on.

CT: Kui nad on ebatäpsed, siis mida nad kajastavad?

CO: puudulikud andmekogumid, mida me neile toidame. Algoritmid ei tea midagi muud, kui me neile ütleme. Nii et kui meil on andmeid ebaühtlaselt ja sisestame selle algoritmi või erapoolikute andmetega, siis arvatakse, et see on reaalsus.

Ailsa Johnson / © kultuurireis

CT: Mis on selle reaalmaailma näide?

CO: Näiteks võib tuua selle, et USA-s vahistatakse mustanahalisi viis korda tõenäolisemalt pott-suitsetamise eest kui valgeid. Seda mitte sellepärast, et mustad inimesed suitsetaksid potti sagedamini - mõlemad rühmad suitsetavad potti sama kiiresti. Mustanahalised arreteeritakse selle tõttu palju tõenäolisemalt. Kui annate selle algoritmile, mida me teeme, järeldab see õigesti, et mustanahalisi arreteeritakse tulevikus palju tõenäolisemalt poti suitsetamise eest. Ja siis annab see mustanahalistele kõrgemad kriminaalsuse riskiskoorid, millel on mõju kriminaalkaristustele.

Teine näide on mõtteeksperiment. Ma kasutan Fox News'i, sest Fox Newsil on olnud purskeid, mis on hiljuti seotud seksismi sisemise kultuuriga. Katse on järgmine: "Mis juhtuks, kui Fox News prooviks tulevikus kasutada inimeste palkamiseks masinõppe algoritmi loomiseks nende enda andmeid?"

Oletame, et otsime inimesi, kes on näiteks Fox News'is edukad olnud. See sõltub sellest, kuidas te edu määratleksite, kuid tavaliselt vaataksite inimeste poole, kes saavad tõste, edutamise või jäävad pikaks ajaks. Ükskõik millise nende meetmete abil peegeldaksid andmed, et naised ei saa Fox News'is edu. Kui seda kasutatakse rentimisalgoritmidena, levitab see seda probleemi. See vaatleks kandidaatide kogumit ja ütleks: "Ma ei taha ühtegi naist palgata, sest nad pole siin edukad. Nad ei ole head palkajad. Ja see ei pea olema ainult Fox News - igas ettevõttekultuuris on eelarvamusi. Kui sisestate algoritmi andmeid, levib algoritmi nihe edasi. See tugevdab jätkuvalt ühiskonnas juba olemasolevaid eelarvamusi.

CT: kas kallutatus on tahtlik?

CO: Ma ei usu, et andmeteadlased üritavad teha seksistlikke või rassistlikke algoritme. Kuid masinõppe algoritmid on erakordselt head suhteliselt nüansirikaste mustrite korjamiseks ja nende levitamiseks. See pole midagi, mida teadlased teadlikult teevad, kuid see on siiski erapoolik.

CT: Millist rolli täidavad ebatäpsed algoritmid meie igapäevaelus?

CO: Neid kasutatakse inimeste elu igasugustes otsustes - alates kolledži sisseastumisest kuni töö saamiseni.

On olemas algoritme, mis otsustavad, kuidas politsei naabruses politseid korraldab, ja ka algoritme, mis otsustavad, kuidas kohtunikud süüdistatavaid karistavad. On olemas algoritme, mis otsustavad, kui palju maksate kindlustuse eest või millise krediidi kulukuse aastamäära (intressimäära) saate krediitkaardilt. Palgatõusu määramiseks kasutatakse algoritme, mis otsustavad, kuidas teil oma tööl läheb. Igal sammul on algoritme, alates sünnist kuni surmani.

CT: Kuhu see siis meid jätab?

CO: Oleme hüpanud suurandmete ajastusse ja lasknud algoritme lahendada kõigi probleemide korral, eeldades, et need algoritmid peavad olema õiglasemad kui inimesed - kuid tegelikult on nad sama ebaõiglased kui inimesed. Peame paremini tegema.

Klõpsake siin, et lugeda meie intervjuu dr O'Neiliga teist osa. Tema raamat "Matemaatika hävitamise relvad: kuidas suured andmed suurendavad ebavõrdsust ja ohustavad demokraatiat" on nüüd saadaval.