Home > Data science e estratégia

Big Data e tomada de decisão: há limites para a ciência dos dados?

A expectativa é que o mercado de Big Data & Analytics gere uma receita mundial de US$ 210 bilhões em 2020

Luiz Paulo Fávero

18/03/2019 às 10h30

Foto: Banco de imagens

Atualmente, produzimos cerca de 2,5 quintilhão de bytes de dados diariamente, e a humanidade percebeu que é necessário aprender a conviver com a ocorrência simultânea de cinco características que dizem respeito à geração e à disponibilidade de dados: volume, velocidade, variedade, variabilidade e complexidade.

O volume exacerbado de dados é oriundo, entre outras razões, do aumento da capacidade computacional, do incremento do monitoramento dos fenômenos e do próprio surgimento das mídias sociais. A velocidade com que dados passam a ser disponibilizados para tratamento e análise, em razão de novas formas de coleta que utilizam etiquetas eletrônicas, sistemas de antena de radiofrequência, sensor fusion ou IoT, também é visível e vital para os processos de tomada de decisão em ambientes cada vez mais competitivos.

A variedade refere-se aos diferentes formatos em que são acessados os dados, como textos, indicadores, bases secundárias ou até mesmo discursos, e uma análise convergente pode também propiciar melhor processo decisório. A variabilidade dos dados relaciona-se, para além das três dimensões anteriores, com fenômenos cíclicos ou sazonais, por vezes em alta frequência, diretamente observáveis ou não e que determinado tratamento pode gerar informações diferenciadas ao pesquisador.

Por fim, mas não menos relevante, a complexidade dos dados, principalmente para grandes volumes, reside no fato de que muitas fontes podem ser acessadas, com códigos, periodicidades ou critérios distintos, o que faz com que seja exigido do pesquisador um processo de controle gerencial sobre os dados para fins de análise integrada e tomada de decisão.

Conforme mostra a figura a seguir, a combinação dessas cinco dimensões de geração e disponibilidade de dados recebe o nome de Big Data, termo tão frequente atualmente em ambientes acadêmicos e organizacionais.

 

Dimensões da geração e disponibilidade de dados e o Big Data

Dimensões da geração e disponibilidade de dados e o Big Data.

 

Essas cinco dimensões que definem o Big Data não podem ser suportadas sem que sejam acompanhadas do aprimoramento de softwares profissionais, como Python, R, Stata, SAS, Minitab, Hadoop, Java, Spark, entre tantos outros que, além de oferecerem uma enorme capacidade de processamento de bases de dados, são capazes de elaborar os mais diversos testes e modelos apropriados e robustos a cada situação e de acordo com o que o pesquisador e o tomador de decisão desejam. E essas são as principais razões que têm levado organizações atuantes nos mais diversos setores a investirem na estruturação e no desenvolvimento de áreas multidisciplinares de Data Science e Business Analytics, que possuem o objetivo principal de analisar dados de maneira estratégica, gerando informações propícias à tomada de decisão e permitindo a criação de uma capacidade preditiva em tempo real da organização frente ao mercado e aos competidores.

O princípio fundamental consiste em explicitar, a todo instante, a hierarquia entre dados, informação e conhecimento. Os dados, quando tratados e analisados, transformam-se em informações. Já o conhecimento é gerado no momento em que tais informações são reconhecidas e aplicadas na tomada de decisão. Analogamente, a hierarquia reversa também pode ser aplicada, visto que o conhecimento, quando difundido ou explicitado, torna-se uma informação que, quando desmembrada, tem capacidade para gerar um novo conjunto de dados. A Figura a seguir apresenta esta lógica.

 

Hierarquia entre dados, informação e conhecimento

Hierarquia entre dados, informação e conhecimento.

FONTE: FÁVERO, L.P.; BELFIORE, P. Data Science for Business and Decision Making. Boston: Academic Press, 2019.

Entretanto, conforme costumava afirmar o célebre filósofo austríaco, naturalizado britânico, Ludwig Joseph Johann Wittgenstein, apenas o rigor metodológico na geração e tratamento de dados pode gerar um efeito manada e uma profunda falta de oxigênio no mercado. Além da disponibilidade de dados, de softwares apropriados e de uma adequada técnicas de analytics, é de fundamental importância que o decisor também faça uso de sua intuição e experiência na definição dos objetivos e construção de modelos, inclusive no que diz respeito à decisão de estudar o comportamento de novas e, por vezes, inimagináveis variáveis. Isso, acreditem, também poderá gerar informações interessantes e inovadoras para a tomada de decisão! A ciência dos dados não tem limites!

 

"Você quer ficar o resto da sua vida vendendo água com açúcar, ou você quer uma chance para mudar o mundo?"

Steve Jobs

 

Junte-se a nós e receba nossas melhores histórias de tecnologia. Newsletter Newsletter por e-mail