Com bilhões de gigabytes de dados gerados diariamente, é fácil contextualizar a complexidade e densidade de informações consideradas no processo de mineração de dados para a análise de negócios. Dentro deste universo de informações, há uma camada muito rica e ainda pouco explorada, que são os chamados “dados alternativos”. Esta fonte de dados se torna cada vez mais relevante e não há dúvidas de que ajuda pessoas e empresas a obter métricas mais precisas, mais rápidas e mais detalhadas sobre desempenho de empresas e mercados.

Devido à característica de dados não estruturados e desconexos, a maioria das fontes de dados deixa, de longe, de oferecer insights para a tomada de decisões. Estes dados podem ser extremamente granulares e são aplicados sobre KPIs com o cruzamento de informações relacionadas às transações comerciais e de negócios, como, por exemplo: vendas de automóveis; reservas de companhias aéreas; reservas de viagens; ofertas de trabalho, etc.

Sao Paulo
Photo by sergio souza / Unsplash

Estas informações não podem ser encontradas dentro de fontes fundamentalistas tradicionais clássicas, tais como: demonstrações financeiras, preços de títulos ou em arquivamentos na CVM ou SEC, comunicados ao mercado, etc. Portanto, isso torna o trabalho de coleta e tratamento destes dados mais complexo e difícil.

Uma das dificuldades é lidar com diversas fontes de dados que, em sua forma original de dados de recursos públicos, não são limpos, não estão em um formato utilizável (por exemplo, PDF) e, com isso, existe um grande esforço para agregar e torná-los acionáveis.

Além disso, sempre que um feed, dataset ou dado é reutilizado, é necessário refazer a busca que, por sua vez, na maioria das vezes, está dentro de uma área obscura do site de uma organização.

São poucos recursos de atualizações que mantêm a integridade dos datasets salvos, de maneira que consigam sempre utilizar e editar diferentes tipos de consultas. Neste sentido, os comparativos acabam exigindo mais esforços e horas em planilhas e revisões de dados.

Todo este esforço não tem como finalidade assimilar somente os preços e o desempenho financeiro, mas também a capacidade de entender rapidamente para fundamentar decisões críticas.

A book we keep in our office library to inspire us.
Photo by Greg Bakker / Unsplash

Esta geração e oferta de dados cria oportunidades para aplicação de novas tecnologias que, por sua vez, causam mudanças drásticas na maneira como consumimos e como estruturamos dados de análises de negócios. Esta explosão e disponibilidade de dados tem um imenso valor quando tratado corretamente e, sem dúvidas, é um dos maiores valores da sociedade atual.

No âmbito da análise de dados, o machine learning e o processamento de linguagem natural são duas tecnologias que despontam como facilitadoras da busca, descoberta e conexão dos dados. Ambas estão sendo tratadas como impulsionadores da automação para exploração deste Big Data. A sofisticação destes recursos alavancam, consideravelmente, a relação e convergência de uma gama enorme de conjunto de dados. No entanto, analistas e profissionais de mercado precisam de ferramentas que sejam simples para interagir, manipular e, principalmente, conectar e comparar seus dados com seus pares e respectivos setores.

Neste ponto, estamos falando de dados de alta qualidade, devidamente tratados para consumo, que compreendem os conjuntos padronizados de informações necessários para resolver problemas que, antes, não eram possíveis de serem abordados na tomada de decisão. Descobrir estes dados organizados, limpos e consumíveis para realização das análises, colabora para o ganho sensível de eficiência.

Há uma mudança de paradigma na maneira como coletamos, descobrimos e coletamos dados, fundamentada em machine learning e busca por linguagem natural, o que permite capturar relações complexas não abordadas em recursos computacionais convencionais.

Data Studio
Photo by Stephen Dawson / Unsplash

Por fim, você não precisa contratar um Ph.D. para que uma empresa esteja preparada para este cenário. O fundamental é que, além de recursos tecnológicos, haja uma reorganização das estruturas a fim de aproximar, ao máximo, o trabalho conjunto de cientistas de dados, engenheiros e tomadores de decisões.

Os engenheiros e cientistas de dados devem considerar ampliar seus conhecimentos em análises fundamentalistas, valuation e outras questões-chave para a estratégia das companhias. Já os tomadores de decisões devem entender que as linguagens e funcionalidades computacionais, como, por exemplo, Python e SQL, são como a nova contabilidade.

Os desafios são enormes, mas a perspectiva é muito boa, pois, com ferramentas atuais, é possível a tomada de decisões totalmente pautada em dados e, em alguns casos, com informações em tempo real e atualizadas sobre os impulsionadores de negócios de curto e longo prazo, melhor do que os especialistas e até mesmo que as próprias equipes de gerenciamento.