RJESPM_17.indb

revista de jornalismo ESPM | cJR 65 isso de alguma forma. “OUber temum deverdeprestarumserviçoigualitário?” Essa é a limitação de trabalhar com dados fornecidosporumalgoritmosem entender como ele funciona. A ProPublica verificou o preço dos cursos preparatórios online para o SAT para todos os CEPs nos Estados Unidos. Apartir daí, analisou os dados paraverificarquais fatores contribuíam para as diferenças de preço. Isso é dife- rente dos métodos usados na maioria das análises de dados, como o censo naquele país ou cálculo de taxas de desemprego. Nesses casos, você sabe onde os dados foramcoletados e como. Isso permite avaliar a importância dos próprios dados e entender até onde a análisepode ir. Comos resultados apre- sentados por algoritmos, mesmo com as análisesmais sofisticadas, omáximo que se consegue é explicar que alguma coisa está acontecendo, mas não como. ParaJeff Larson, editordaProPublica e autor damatéria sobre os preços dos cursinhosparaas famílias asiáticas, isso não é necessariamente ruim. A parte importante da matéria é o resultado, ou seja, alguém ou algum grupo está sendoafetadopor algumapolítica, ape- sar de sua intenção original. “Nemtodasashistórias têmumvilão”, dizLarson. Para termos uma boahistó- ria, não precisamos de alguémmaqui- nando alguma maldade. É claro que trabalhar com os resultados não é a única estratégia possível. Emvezdesimplesmenteolhar para os efeitos dos algoritmos e ten- tar voltar até o ponto de partida para entender o que acontece, os repórte- res deveriamse concentrar na própria caixa-preta (lembrem-se que essa é a “cara” do algoritmo). Ter acesso ao código fonte ou ao seu projeto cria um ponto de vista com- pletamente novo. Isso fica claro coma reportagemdoMarshall Project sobre os algoritmos usados pelos departa- mentos de polícia. Em uma matéria chamada “Policing the future” (“Patru- lhando o futuro”, em tradução livre), Chammah e Hansen falaram sobre o HunchLab, um programa parecido com o PredPol, mas com uma dife- rença marcante: ele é um software de código aberto. Por dentro da caixa-preta Amatérianãoentraemdetalhes sobreo funcionamentodosoftware,masmesmo assim fala sobre como o HunchLab e os departamentos de polícia que estão usando o programa lidam com as pre- ocupações sobremisturar computado- res e segurançapública. Por exemplo, o HunchLab sómapeia crimes violentos, e não os delitos ligados a drogas. Acon- tece que os crimes de drogas são consi- deradosumaáreadedesigualdaderacial sistêmica na Justiça criminal. A vantagem do acesso ao código aberto, segundo Chammah, é permi- tir debater questões, e não ficar só na discussão rasa sobre transparência. “A matéria se desenvolveu para explorar as questões filosóficas emtornodouso de algoritmos na segurança pública”, ele conta. Mas a caixa-preta é difícil de acessar, emsentido literal e conceitual. Amaio- ria dos algoritmos são proprietários, tanto os usados por empresas quanto os usados por governos. Não está claro que tipo de códigos-fonte podem ser consultados pormeio de leis de acesso à informação. Muitos casos já foram parar na Justiça, para acessar códigos ou documentos relativos a eles, mas a maioria dessas informações acaba pro- tegidapor razõesdesegurançaoucomo segredo industrial. Emumcasodas leis de acesso à infor- mação,aElectronicPrivacyInformation Center (Epic), uma ONGdeWashing- tonDC, solicitoudocumentosdeumsis- tema que classifica viajantes nos Esta- dosUnidos conforme seu potencial de ameaça.OAnalyticFrameworkof Inte- lligence (QuadroAnalíticode Informa- ção, emtradução livre) reúne dados de fontes governamentais e não governa- mentais, incluindo a atividadedousuá- rio na internet, e então dá uma “nota de risco”. Após uma sentença judicial, a agência que gerencia o sistema, o DepartamentodeAduanaeControlede Fronteiras, divulgou vários documen- tos para a Epic, todos completamente editados. Página por página, todas as capturas de tela estavam cobertas por tarjas pretas. A alegação da Agência é que “alguém com conhecimento em sistemas de computador” poderia usar os screenshots para invadir o sistema. A Epic ainda briga na Justiça para conse- guir a versão integral dos documentos. Depois que o problema do acesso em sentido literal for resolvido, chega a hora de decifrar o código. Analisar um código pode depender de um conhe- cimento de algoritmos, o que não faz parte do repertório atual dos jornalis- tas. Isso vai requerer colaboração com especialistas em matemática e outros formatos criativos. Cientistas da computação, diz Han- sen, “estão transformando a ética e os valoresdenossasociedadeemcódigos”, e esse processo temque estar aberto à participação do público. Qualquer que seja o formato adotado, escrever sobre o tema provavelmente vai virar umahabilidadenecessária. Os jornalistasprecisamdarum up nas suas técnicas, tantoparapedir transparência nos algoritmos, quanto para aumentar o repertório de habilidades jornalísti- cas, para podermos lidar com a inteli- gência aumentada da humanidade. ■ chava gourarie é bolsista do Delacorte Center na CJR . Seu Twitter é@ChavaRisa. sobre a relação entre jornalismo e responsabilização de algoritmos. Imperdível. 3 - Certifying and Removing Disparate Impact : O guia do cientista da computação para localizar e corrigir prejulgamentos em algoritmos, por Suresh Venkatasubramanian e colaboradores. Envolve matemática, mas dá para pular essa parte. 4 - The Curious Journalist’s Guide to Data : O guia fácil de Jonathan Stray para pensar em dados como comunicação, que também serve para algoritmos. Texto originalmente publicado no site www.cjr.org em 14 de abril de 2016.

RkJQdWJsaXNoZXIy NDQ1MTcx