By Ana Sapata
Data Scientist na DECSIS e REBIS (agora IZERTIS) Alumni
Hoje em dia, com os avanços tecnológicos existentes, a cada segundo que passa estamos a gerar novos dados.
Muitos destes dados são gerados a partir de dispositivos que usamos no dia a dia, desde o telemóvel, que envia dados para a respetiva empresa de telecomunicações, bem como os recentes relógios que vão da contagem de passos que a pessoa dá, até ao número de batimentos cardíacos por minuto da mesma.
É um maravilhoso mundo novo ou talvez não?
Os dados podem surgir de várias fontes e sobre diversos temas, sendo que uma análise correta sobre os mesmos pode ser uma mais valia para qualquer empresa.
Esta análise possibilita à empresa, desde um melhor conhecimento sobre o seu conjunto de clientes até um melhor entendimento sobre o desenvolvimento dos seus produtos no mercado. O que lhe permite assim a aplicação de novas medidas de marketing mais adequadas a cada grupo de clientes e cada produto.
Para obter conhecimento através dos dados que cada um dispõe, é necessário transformar os mesmos em informação. Esta pode ser obtida através da exploração dos mesmos visualmente ou de modelos aplicados ao respetivo conjunto.
Os modelos podem ser os mais variados, consoante o resultado pretendido, desde o agrupamento dos clientes em diversos conjuntos consoante as suas características, como a previsão do número de vendas para um determinado produto, ou até mesmo, a identificação de padrões no número de vendas.
Em alguns casos, visualmente é sempre mais fácil obter informação, quer seja com gráficos de linhas de modo a observar as vendas ao longo do tempo, quer seja com gráficos circulares para perceber qual a percentagem de cada conjunto de clientes que compra determinado produto.
Existem programas que automaticamente indicam gráficos para os dados que lhe são fornecidos, e alguns até já disponibilizam modelos para aplicar a estes. Contudo, ainda não dizem qual o modelo que deverá ser utilizado, e será realmente o gráfico que é sugerido o mais adequado para a informação que se pretende mostrar?
Para ser possível uma melhor obtenção da informação a partir dos dados, é necessário a existência de pessoas que consigam perceber qual o melhor modelo a utilizar consoante as características dos dados e até mesmo qual o gráfico mais adequado para retirar informação dos dados.
Nos últimos anos verifica-se um aumento de pessoas com formação na área de data science e até mesmo business intelligence, que através dos seus conhecimentos tiram a informação mais adequada dos dados.
No primeiro caso, aplicando essencialmente modelos aos dados, no segundo caso, muitas vezes observando os dados através de gráficos e com o conhecimento sobre o negócio escolhendo o gráfico mais adequado para fornecer informação a outras pessoas.
No entanto, como seria de esperar, ambos têm de ter conhecimentos quer sobre o negócio, quer sobre os modelos. Pois não é possível correr modelos sobre dados sem saber sobre o que são os mesmos, tal como não é possível mostrar os resultados dos modelos, sem saber o que os mesmos fazem.