Pesquisa, Desenvolvimento e Extensão
Plataforma Data Zoom Amazônia, da Economia, disponibiliza visualizações dinâmicas e estimula correlação de dados e produção científica e jornalística sobre a Amazônia Legal
O Data Zoom Amazônia, maior pacote de extração de dados sobre a região disponível em R, proporciona insights valiosos sobre a Amazônia e impulsiona pesquisas - na foto, o professor Gustavo Gonzaga, da Economia, arquivo pessoal
Uma plataforma inovadora que permite democratizar o acesso a todas as fontes de dados sociais, econômicos e ambientais da Amazônia Legal tem se revelado um eficiente laboratório de programação e experimentação para alunos de graduação e pós-graduação. O Data Zoom Amazônia, projeto do Departamento de Economia lançado em 2022, permite a visualização de dados da região de forma acessível, interativa e parametrizada.
De acordo com seu coordenador, professor Gustavo Gonzaga, o projeto tem enorme potencial para impactar a formulação de políticas públicas e formar uma nova geração de pesquisadores e estudantes. O professor já coordenava, desde 2011, a equipe do projeto que deu origem à versão para a Amazônia, o Data Zoom.
– Eu e o Juliano Assunção, também da Economia, começamos a trabalhar no Data Zoom por volta de 2011, com financiamento da FINEP. A ideia era ter um facilitador para os dados lançados pelo IBGE, como os Censos e as PNADs, mas a plataforma só cresceu desde então. O desafio do Data Zoom era se tornar o padrão, ser a referência, o dicionário dominante para abrir os dados do IBGE. Antes dele era preciso ser especialista para organizar os dados, entender o que as variáveis significavam. A plataforma os colocou prontos para usar, esclarece o pesquisador.
Segundo Gonzaga, quando eram liberados os dados do Censo, por exemplo, todos os pesquisadores e usuários precisavam escrever um dicionário para tratá-los, então o objetivo foi o de disponibilizar gratuitamente os dicionários que tornam o dado pronto para ser usado. O Data Zoom foi todo desenvolvido com algoritmos em português e em inglês seguindo a filosofia de dados e códigos abertos: se um usuário não gostar de alguma decisão tomada pelos programadores em relação aos dados, pode alterar o código.
– O Data Zoom é um grande sucesso, mas sempre tivemos ideias de criar outros braços, como educação, meio ambiente. Então, com base no projeto Amazônia 2030, coordenado pelo Juliano e pelo Beto Veríssimo, pesquisador da Imazon, surgiu a oportunidade de criar o Data Zoom Amazônia, braço dedicado à Amazônia Legal. No início, o projeto era um portal para divulgação dos resultados do próprio Amazônia 2030, mas, aos poucos, fomos identificando outros temas relacionados ao meio ambiente, como economia, saúde, desenvolvimento, violência, energia...
Com o apoio operacional do pós-doutorando Francisco Cavalcanti, o projeto desenvolveu robôs de busca para possível ‘raspar’ todas as bases de dados públicos disponíveis e tornar esse acesso ainda mais fácil e atualizado. “Trata-se do maior pacote de dados da Amazônia escrito em R, uma linguagem de programação estatística e gráfica, que é também open source. São mais de 200 dados e o programa foi registrado no CRAN, o repositório oficial de pacotes R. Mais de 5 mil downloads de dados já foram feitos na plataforma”, informa Gonzaga.
Além de facilitar o acesso aos dados, o Data Zoom Amazônia dispõe de uma parte de visualização para motivar os usuários a ‘brincar’ com eles: será que os locais que mais desmataram são os que mais cresceram em termos econômicos? Qual é a relação entre criação de gado e desmatamento?
– A ideia do Data Zoom Amazônia é atrair o usuário. No menu, estão disponibilizadas as visualizações por tipo, por tema, desenvolvemos uma bacia infográfica onde a pessoa passa o cursor e visualiza uma série de dados. A ideia é que tenhamos um rio cheio de afluentes de dados. O que fazemos, na verdade, é contar histórias ilustradas com visualizações. Os dados são inter-relacionados e são elaborados gráficos interativos. As pessoas que consultam esses dados podem aproveitar os cruzamentos oferecido pela plataforma, mas também podem fazer outros cruzamentos de dados. Queremos chamar a atenção desde o aluno do ensino médio, passando pelo jornalista, o formador de opinião pública, o estudante de ensino superior, até o pesquisador que vai se inspirar com as visualizações.
Para Gonzaga, o conceito de dados abertos tornou o Data Zoom Amazônia um grande laboratório acadêmico, que já contou com 12 alunos de graduação e de pós trabalhando ao mesmo tempo no projeto:
– Os alunos aprendem a programar, a organizar os códigos no GitHub (plataforma interativa de hospedagem de código-fonte e arquivos com controle de versão). Fizemos todos os desenvolvimentos no GitHub com alunos de pós-doutorado, doutorado, mestrado, sob orientação dos professores. O usuário mais avançado acessa o GitHub, uma das principais ferramentas de compartilhamento de códigos, com toda a descrição do projeto, orientação para instalação, todas as bases – IBAMA, MapBiomas, DETER, DataSUS, etc. Qualquer usuário do mundo pode fazer críticas ao nosso programa, apontar problemas, apresentar inovações. Rodamos as inovações e, se forem interessantes, incorporamos a contribuição ao nosso código. As plataformas de dados abertos funcionam dessa forma. Isso é muito interessante para os alunos aprenderem porque já estarão trabalhando com ferramentas de ponta.
O coordenador comenta que a seção de Histórias é a parte que mais precisa ser desenvolvida no portal. “A ideia é ilustrar o potencial dos dados com histórias curtas produzidas em cima de dados obtidos. As histórias são escritas pela própria equipe para demonstrar como trabalhar os dados, mas é um conceito que queremos expandir para que pesquisadores da região contem histórias, elaborem, inclusive, releases para jornalistas especializados, que escreveriam reportagens ancoradas pelos especialistas do Data Zoom”.