RJESPM_17.indb
revista de jornalismo ESPM | cJR 65 isso de alguma forma. “OUber temum deverdeprestarumserviçoigualitário?” Essa é a limitação de trabalhar com dados fornecidosporumalgoritmosem entender como ele funciona. A ProPublica verificou o preço dos cursos preparatórios online para o SAT para todos os CEPs nos Estados Unidos. Apartir daí, analisou os dados paraverificarquais fatores contribuíam para as diferenças de preço. Isso é dife- rente dos métodos usados na maioria das análises de dados, como o censo naquele país ou cálculo de taxas de desemprego. Nesses casos, você sabe onde os dados foramcoletados e como. Isso permite avaliar a importância dos próprios dados e entender até onde a análisepode ir. Comos resultados apre- sentados por algoritmos, mesmo com as análisesmais sofisticadas, omáximo que se consegue é explicar que alguma coisa está acontecendo, mas não como. ParaJeff Larson, editordaProPublica e autor damatéria sobre os preços dos cursinhosparaas famílias asiáticas, isso não é necessariamente ruim. A parte importante da matéria é o resultado, ou seja, alguém ou algum grupo está sendoafetadopor algumapolítica, ape- sar de sua intenção original. “Nemtodasashistórias têmumvilão”, dizLarson. Para termos uma boahistó- ria, não precisamos de alguémmaqui- nando alguma maldade. É claro que trabalhar com os resultados não é a única estratégia possível. Emvezdesimplesmenteolhar para os efeitos dos algoritmos e ten- tar voltar até o ponto de partida para entender o que acontece, os repórte- res deveriamse concentrar na própria caixa-preta (lembrem-se que essa é a “cara” do algoritmo). Ter acesso ao código fonte ou ao seu projeto cria um ponto de vista com- pletamente novo. Isso fica claro coma reportagemdoMarshall Project sobre os algoritmos usados pelos departa- mentos de polícia. Em uma matéria chamada “Policing the future” (“Patru- lhando o futuro”, em tradução livre), Chammah e Hansen falaram sobre o HunchLab, um programa parecido com o PredPol, mas com uma dife- rença marcante: ele é um software de código aberto. Por dentro da caixa-preta Amatérianãoentraemdetalhes sobreo funcionamentodosoftware,masmesmo assim fala sobre como o HunchLab e os departamentos de polícia que estão usando o programa lidam com as pre- ocupações sobremisturar computado- res e segurançapública. Por exemplo, o HunchLab sómapeia crimes violentos, e não os delitos ligados a drogas. Acon- tece que os crimes de drogas são consi- deradosumaáreadedesigualdaderacial sistêmica na Justiça criminal. A vantagem do acesso ao código aberto, segundo Chammah, é permi- tir debater questões, e não ficar só na discussão rasa sobre transparência. “A matéria se desenvolveu para explorar as questões filosóficas emtornodouso de algoritmos na segurança pública”, ele conta. Mas a caixa-preta é difícil de acessar, emsentido literal e conceitual. Amaio- ria dos algoritmos são proprietários, tanto os usados por empresas quanto os usados por governos. Não está claro que tipo de códigos-fonte podem ser consultados pormeio de leis de acesso à informação. Muitos casos já foram parar na Justiça, para acessar códigos ou documentos relativos a eles, mas a maioria dessas informações acaba pro- tegidapor razõesdesegurançaoucomo segredo industrial. Emumcasodas leis de acesso à infor- mação,aElectronicPrivacyInformation Center (Epic), uma ONGdeWashing- tonDC, solicitoudocumentosdeumsis- tema que classifica viajantes nos Esta- dosUnidos conforme seu potencial de ameaça.OAnalyticFrameworkof Inte- lligence (QuadroAnalíticode Informa- ção, emtradução livre) reúne dados de fontes governamentais e não governa- mentais, incluindo a atividadedousuá- rio na internet, e então dá uma “nota de risco”. Após uma sentença judicial, a agência que gerencia o sistema, o DepartamentodeAduanaeControlede Fronteiras, divulgou vários documen- tos para a Epic, todos completamente editados. Página por página, todas as capturas de tela estavam cobertas por tarjas pretas. A alegação da Agência é que “alguém com conhecimento em sistemas de computador” poderia usar os screenshots para invadir o sistema. A Epic ainda briga na Justiça para conse- guir a versão integral dos documentos. Depois que o problema do acesso em sentido literal for resolvido, chega a hora de decifrar o código. Analisar um código pode depender de um conhe- cimento de algoritmos, o que não faz parte do repertório atual dos jornalis- tas. Isso vai requerer colaboração com especialistas em matemática e outros formatos criativos. Cientistas da computação, diz Han- sen, “estão transformando a ética e os valoresdenossasociedadeemcódigos”, e esse processo temque estar aberto à participação do público. Qualquer que seja o formato adotado, escrever sobre o tema provavelmente vai virar umahabilidadenecessária. Os jornalistasprecisamdarum up nas suas técnicas, tantoparapedir transparência nos algoritmos, quanto para aumentar o repertório de habilidades jornalísti- cas, para podermos lidar com a inteli- gência aumentada da humanidade. ■ chava gourarie é bolsista do Delacorte Center na CJR . Seu Twitter é@ChavaRisa. sobre a relação entre jornalismo e responsabilização de algoritmos. Imperdível. 3 - Certifying and Removing Disparate Impact : O guia do cientista da computação para localizar e corrigir prejulgamentos em algoritmos, por Suresh Venkatasubramanian e colaboradores. Envolve matemática, mas dá para pular essa parte. 4 - The Curious Journalist’s Guide to Data : O guia fácil de Jonathan Stray para pensar em dados como comunicação, que também serve para algoritmos. Texto originalmente publicado no site www.cjr.org em 14 de abril de 2016.
Made with FlippingBook
RkJQdWJsaXNoZXIy NDQ1MTcx