Embora o ato de recolher e armazenar grandes quantidades de informações para eventual análise de dados não seja novo, só mais recentemente essa prática ganhou a relevância devida. Hoje, o chamado Big Data tem importância estratégica para tomada de decisões em áreas tão diversas quanto a educação e a geopolítica, o mundo coorporativo e os sistemas de saúde.

A explicação vem da enorme quantidade de dados que estão sendo criados e armazenados em nível global. São informações que chegam das redes sociais, dos aplicativos instalados em dispositivos móveis, de tecnologia de georreferenciamento e outros tantos canais que fazem crescer as possibilidades de análises e aplicações dessas informações.

Um bom exemplo é a experiência da Operação Serenata de Amor, uma iniciativa de jovens de Brasília especializados no uso de dados e tecnologia para estratégias de mercado e que desenvolveram uma ferramenta que cruza informações de bancos de dados públicos, como o da Câmara e o da Receita Federal, para identificar ilegalidades nos reembolsos feitos aos parlamentares a partir da chamada Cota para Exercício da Atividade Parlamentar.

Analisando notas fiscais relacionadas à alimentação, transporte, hospedagem e até assinaturas de TV dos deputados federais, a Operação Serenata de Amor conseguiu fazer nada menos que 629 denúncias à Câmara dos Deputados relacionadas a gastos suspeitos. 

Um dos criadores da Operação é Pedro Vilanova, um jovem formado em comunicação e que é sócio da Niña, startup especializada no uso de ciência de dados e tecnologia para estratégias de mercado. O Blog da Apex-Brasil conversou com Pedro para entender melhor o uso do Big Data, as implicâncias dessa ciência sobre o nosso cotidiano, os limites éticos na coleta de dados e o impacto dessa tecnologia no universo das empresas. Para Pedro, reunir milhares de dados não basta para uma empresa se tornar inovadora. Para isso, a criatividade é fundamental. Justamente dois dos pilares da campanha Be Brasil, que promove um Brasil competitivo, inovador, criativo e sustentável no mundo dos negócios. Confira nossa entrevista!

Como você explicaria o que é Big Data a um leigo?
O conceito de Big Data é bem abrangente, na verdade. Chamamos de Big Bata todo grande conjunto de dados. Os dados que geramos nas redes sociais são Big Data. Nossas pesquisas no Google são Big Data. Os registros de uma grande montadora de carros sobre seus clientes são Big Data. Na realidade, os próprios registros sobre os carros, como rodagem e revisões feitas também são Big Data. Pense em um momento ou qualquer informação que seja registrada: isso é um dado. Quando você multiplica isso milhares de vezes, com um grande volume de dados, que se atualizam com frequência, pronto. Você tem Big Data. 

Existe uma frase no seu cartão de apresentação que diz: “Descobertas a partir de dados”. Os profissionais de Big Data podem descobrir qualquer coisa a partir dos dados que hoje circulam livremente nas redes?
Agora estamos falando de um dado específico: os dados de redes sociais, que atualmente têm crescido bastante em relevância. Olha, não vou dizer que podemos descobrir qualquer coisa a partir daí, mas as aplicações são muitas. Com nossos registros de comportamento, nós mostramos quem somos, e as descobertas nesse campo são riquíssimas. É possível entender os padrões de comportamento relacionados a pessoas e com isso a gente já consegue descobrir quase tudo. 

Você costuma dizer que as técnicas e análises do Big Data são sexy. Pode explicar isso?
Na verdade, costumo dizer que a profissão de ciência de dados se tornou algo sexy. É uma brincadeira, claro, e faço referência a um estudo que usava esse termo (sexy) para mostrar o quanto a área vem crescendo. Com o boom do mercado digital, o acesso a dados ficou muito facilitado, aumentando as oportunidades e também a procura pelo nosso trabalho. Eu acho isso ótimo. Ter uma inteligência analítica e trabalhar com ciência de dados é muito importante, independente do segmento da empresa. 

Onde o Big Data está sendo aplicado hoje em dia?
É mais fácil responder onde ele não está sendo aplicado. As aplicações do Big Data são infinitas: do esporte às cozinhas dos restaurantes. Companhias dos mais variados segmentos estão usando dados para melhorar a forma como oferecem produtos e serviços. É muito difícil encontrar um segmento que ainda não esteja utilizando inteligência em dados no mundo. Pense em uma empresa que você acha muito legal aí. Provavelmente você acha ela tão legal porque ela já sabe tudo sobre você. 

Como o Brasil vem lidando com a utilização do Big Data? Está inserido na realidade de países mais avançados?
Já temos grandes empresas trabalhando com isso no país. E a cada vez que pesquiso, descubro mais uma. É claro que, até pelo tamanho da nossa economia, não dá para comparar o nosso mercado com o de países mais desenvolvidos, mas estamos crescendo bastante com uso de dados em diversos setores.  

Você já disse que a coleta e análise de dados é um processo barato e relativamente simples. Será que teremos uma popularização do uso de dados?
Isso depende muito do dado. Há dados dificílimos de achar. É claro que com o aumento substancial das fontes de informações, é mais fácil encontrar dados, de maneira geral. A grande questão aqui é: já existem muitos dados disponíveis, o que nos falta é inteligência em cima desses dados. É isso que é extremamente valioso. O processo de transformação de um dado em informação e então em ação. Encontrar um dado pode ser muito fácil, mas tomar uma decisão qualificada a partir dele nem sempre é simples. Ainda assim, com tantos dados abertos e grandes bibliotecas de código disponíveis, digamos que a área ficou bastante democrática. Hoje qualquer pessoa pode buscar dados e extrair informação disso.

Qual o limite entre a coleta de dados disponíveis e a invasão de privacidade?
A permissão. Uma vez aqui na Niña, em um trabalho para um cliente sobre saúde feminina, encontramos um vídeo em que uma mulher filmava sua própria região genital em busca de dicas sobre um determinado produto. Isso estava postado no perfil pessoal dela, por ela que, claramente, sabia da existência do vídeo. Isso é só para ilustrar um movimento pelo qual o mundo vem passando. Nós cedemos nossos dados em busca de serviços melhores. Você cede seus dados para ter indicações melhores de séries, por exemplo. Você pede recomendações aos amigos nas redes sociais e interage com conteúdo. Todos esses são dados liberados pelas pessoas. Quando um dado sigiloso é extraído sem a permissão do usuário temos uma coleta invasiva. Seria como se eu tivesse acesso à biblioteca de vídeos da moça em questão para encontrar seu vídeo.  

Você teve uma experiência com a utilização de robôs para fazer a coleta de dados públicos e iniciar uma espécie de controle social sobre a atividade parlamentar. Por que não vemos mais experiências como essa, se o Brasil é o 8º país mais transparente do mundo?
Essa é uma excelente pergunta. Mas eu olho com otimismo. Iniciativas como o da Operação Serenata de Amor tendem a ocasionar o surgimento de mais projetos. Nós temos uma política de dados abertos funcionando, onde além de já poder coletar o que temos disponível, podemos solicitar informações novas pela Lei de Acesso a Informação. Aqui estamos falando de outro tipo de dado valiosíssimo, que são os dados abertos da administração pública. São riquíssimos em informação. Na minha opinião, só precisavam ser mais acessíveis à população em geral, além de melhor divulgados. Nós mesmos, após um ano de trabalho com esse tipo de dado, não sabemos dizer tudo o que há disponível no nosso país.
 
Você diz que entrega criatividade além dos dados. Você pode explicar o que é isso?
É que a distância entre o dado e a informação é grande. Lá na Niña, percebemos que analisar e entregar os dados não estava levando sempre os clientes ao caminho da inovação. Por isso, decidimos acompanhar internamente o consumo dos dados em cada um dos nossos parceiros, com um time nosso de criativos que auxilia na leitura dos dados, guiando até os insights. É nosso papel como cientista de dados garantir que nossos contratantes vão enxergar valor nos dados. 

Que conselho você daria para quem esteja interessado em iniciar a utilização de Big Data?
Corra (Risos)! Brincadeira. Se é uma empresa, que não perca mais tempo e aproveite logo esse recurso tão importante que é a inteligência de dados. Dizem que os dados são o novo petróleo, pela sua capacidade de revolucionar as indústrias. Eu adiciono que eles são ainda mais poderosos, porque são mais acessíveis que o petróleo. Aos profissionais que querem começar a trabalhar na área, também venham. A atuação em ciência de dados é extremamente abrangente. Precisamos de gente dos mais diferentes perfis. 

- Visite o site Be Brasil

Alguns links para conhecer e apoiar a Operação Serenata de Amor

https://serenatadeamor.org
https://apoia.se/serenata
https://twitter.com/RosieDaSerenata
https://www.facebook.com/operacaoSerenataDeAmor/