O tema da redação do ENEM, no domingo passado (04/11), foi “Manipulação do comportamento do usuário pelo controle de dados na internet.” Para quem pesquisa esse tema, é muito positivo vê-lo sendo discutido nos jornais e redes sociais. Ao incluir o debate em uma prova nacional feita por milhões de estudantes, ele ganha legitimidade e se expande. Ainda que o recorte tenha sido específico e potencialmente desafiador para estudantes com formação do ensino médio, é uma forma de incluir a discussão sobre dados nas escolas.
O uso dos dados é uma questão que afeta o cotidiano e as subjetividades de todos os usuários. No entanto, o termo “manipulação”, usado na proposta de redação, pode ser considerado simplista. Seu uso faz parecer que o usuário é passivo e dá um tom moralista ao uso de dados. Pela perspectiva sociotécnica do LED, preferimos falar de condução de condutas.
A redação pode ser uma abertura para que o debate sobre tecnologia no ambiente escolar seja feito para além da proibição dos celulares em sala de aula. Cada vez mais, discutir as mudanças sociais ligadas a ela se faz urgente entre a juventude. A escola deve ser um espaço de conversa sobre o uso consciente da internet e suas formas de capitalizar dados dos usuários.
Os textos de apoio disponíveis na prova tratam do papel dos algoritmos, cada vez mais presentes em processos decisórios da nossa vida. Por mais que os textos se foquem no cotidiano da linha do tempo do Facebook, os pesquisadores da área enxergam problemáticas mais complexas, como por exemplo, a influência algorítmica nas eleições, o caso das lawtechs e o racismo estrutural, que passa a ser reproduzido (e revalidado) pelos algoritmos. Ainda que fazendo uso de abordagens distintas, as questões centrais se mantém: até onde vamos dar poder de decisão às máquinas? Que riscos estamos correndo?
O tema se apresentou de forma ampla, porém faz um recorte atual e necessário de uma questão nacional: hoje em dia todos usamos internet e estamos sujeitos ao controle de dados. Ser visto como um debate distante por muitos dos críticos ao tema, reforça o caráter de urgência do assunto, pois a mediação algorítmica está presente em cada vez mais esferas da nossa sociedade e tem afetado cada vez mais nosso comportamento. Desta forma, instigar a reflexão sobre esse campo é necessário, justamente para aproximar a população do debate acadêmico-jornalístico que está cada vez mais efervescente - e influenciando a vida de todos.
Somos os consumidores e o produto
O modelo atual de internet tende a concentrar os usuários em plataformas administradas por grandes empresas que nos oferecem serviços supostamente gratuitos permeando todo o nosso cotidiano. Descobrimos a agenda de eventos no Facebook, convidamos o crush do Tinder pelo Messenger, chamamos os amigos pelo WhatsApp, conferimos a previsão do tempo pelo aplicativo do celular, procuramos por músicas no YouTube, conferimos o trajeto pelo Google Maps e, se tudo deu certo, vamos conferir as fotos do dia anterior no Instagram.
Essa rotina comum, que muitos que estão lendo já vivenciaram, envolve uma grande questão: todo o seu planejamento e comportamento passaram pelos servidores e bancos de dados de algumas empresas sem que você tenha controle do que vai ser feito com eles. Com essa rotina simples, entregamos à Google onde pretendemos ir (através dos aplicativos de mobilidade), onde fomos realmente (localização dos aparelhos), e o que gostamos de ouvir (pelo YouTube); entregamos ao Facebook o tipo de evento em que temos interesse, além de fornecer ao Tinder nossas preferências de parceiros. O cruzamento desses - e mais tantos! - dados possibilita a formação de um perfil do usuário, que é alimentado a partir de cada curtida, comentário, compartilhamento ou busca feitos. Esse processo é a grande fonte de renda dessas empresas - então o serviço, que é gratuito, tem um preço para os internautas: seus dados.
Esses dados, através de um longo e contínuo (visto que eles não param de ser produzidos) processamento mediado por computadores (algo conhecido como limpeza e mineração de dados), resultam em previsões de outros comportamentos, conferindo às informações um valor de mercado. Uma das formas de capitalizar esses dados é aplicá-los à publicidade, que passa a alcançar nuances de comportamento mais precisas do que nunca para grupos específicos. Essa forma de propaganda pode também ser usada para a política, como nos mostra a atuação da Cambridge Analytica na eleição do Trump e no Brexit. O tema é fake news?
Muito foi falado sobre uma possível confusão acerca do tema, pela qual em vez de dissertarem sobre a medição algorítmica na vida cotidiana, muitos candidatos podem ter tratado da faceta do tema que ficou em evidência no mais recente processo eleitoral: as fake news.
Uma boa definição do termo é: “histórias falsas que, ao manterem a aparência de notícias jornalísticas, são disseminadas pela Internet (ou por outras mídias), sendo normalmente criadas para influenciar posições políticas, ou como piadas (...) deliberadamente veiculando conteúdos falsos, sempre com a intenção de obter algum tipo de vantagem, seja financeira (mediante receitas oriundas de anúncios), política ou eleitoral.”
Desta forma fica nítido que o debate das notícias falsas se relaciona ao tema, mas não é precisamente a proposta do ENEM. Para entender a relação entre fake news e algoritmos, podemos usar o recente caso das eleições presidenciais, no qual houve automação do envio de mensagens pelo WhatsApp para usuários classificados segundo seus dados. Os não-humanos foram grandes atores no processo eleitoral, e o #Caixa2doBolsonaro está muito ligado aos algoritmos e à condução de conduta a partir de dados. Enquanto o detalhado estudo do ITSRio corrobora o uso de bots ou ciborgues nos grupos de WhatsApp de motivação política, a matéria do Intercept nos mostra como funciona um programa de disparo de mensagens, que permite não apenas disparar mensagens para muitos grupos, como monitorá-los de forma a registrar um perfil de cada participante, quais são os temas bombando em cada grupo e como eles reagem às mensagens disparadas. Com as informações, é possível influenciar o sentimento das pessoas em relação a determinado candidato na disputa política através de um experimento científico psicológico. Segundo a reportagem, ele funciona da seguinte forma: “Um emissor lança um estímulo em um grupo (um post histérico sobre a mentirosa fraude nas urnas eletrônicas, por exemplo). As reações a essa postagem são analisadas e classificadas entre positivas, negativas ou neutras. Quem reage bem continuará recebendo informações parecidas. Quem reage mal receberá outros tipos de mensagens”. A matéria também mostra que quem é classificado como neutro em relação ao candidato adversário passa a receber notícias falsas sobre ele, e quem já se mostra contrário passa a receber mensagens com temas cada vez mais caros à pessoa, como o valor da religião e da família. Para montar os perfis individuais, além dos conteúdos dos grupos monitorados, as empresas desse ramo estão também envolvidas em um comércio de bancos de dados de empresas privadas, dos quais extraem informações. Fazem parte dessas empresas a Visa e a Serasa.
Ao compreendermos essa estrutura, fica clara a relação: os dados dos eleitores, dos mais diversos tipos, através de mediação algorítmica serviram como base para a campanha, que teve como estratégia a disseminação de fake news para determinados perfis que, segundo os cálculos computadorizados em conjunção com teorias psicológicas, estariam mais dispostos a aceitá-las. Essa é uma das formas pelas quais o usuário tem sua conduta conduzida a partir de seus dados, mas não a única.
E o que está sendo feito?
Além da mobilização de pesquisadores e jornalistas para escancarar o tema, foi aprovada pelo Senado, em Julho de 2018, a Lei Geral de Proteção de Dados Pessoais (LGPDP), que visa proteger a privacidade dos dados e informações pessoais dos cidadãos brasileiros. O projeto contou com consultas públicas e contribuições de diferentes atores do cenário nacional e internacional durante um período de dois anos. A aprovação do projeto foi acelerada pela aprovação do General Data Protection Regulation (GDPR), a lei da União Europeia sobre proteção de dados, que pela internacionalização dos mercados afeta empresas no Brasil.
A lei foi sancionada pelo atual presidente Michel Temer, porém o mesmo vetou um parte muito importante do projeto: a criação da Autoridade Nacional de Proteção de Dados – a ANPD, um órgão independente, que, no projeto, funcionaria como uma agência reguladora responsável pela aplicação da LGPDP. Temer também vetou punições mais duras previstas no projeto, desta forma, sancionando uma lei mais branda. Um texto que aprofunda bem o tema pode ser encontrado no Jota.
Conclusão
O tema é amplo e ainda pouco conhecido e justamente por isso deve ser cada vez mais debatido, portanto foi uma escolha muito interessante para o ENEM. As projeções distópicas precisam ser evitadas, mas isso não será feito por nenhum ente mercadológico, já que esses têm interesse no comércio desses dados. De outro lado, o jogo político claramente se aproveita do caos para conduzir os votantes nas urnas.
Projetos como o GDPR e a LGPDP são um bom indício de como podemos escapar dessa situação, porém precisam ser aplicados com rigor e se adaptar às mudanças sociotécnicas. As discussões sobre esse campo não estão esgotadas, e ainda falaremos muito dos dados e algoritmos no futuro, assim sendo, vale ler, conferir os hiperlinks e ler os outros textos do blog, para que então possamos ter um debate cada vez mais qualificado sobre o tema.