Atualmente, pequenas e grandes empresas buscam ferramentas e serviços de Inteligência Artificial com a intenção de melhorar os processos de negócios, suporte ao cliente e tomada de decisões com Big Data, análise preditiva e sistemas algorítmicos automatizados.
No entanto, a especialização em Ciência de Dados não é tão disseminada quanto o interesse em utilizar os dados para as tomadas de decisões e melhoria de resultados. Se você estiver introduzindo a Ciência de Dados em seu negócio, listamos cinco erros comuns a serem evitados.
1 – Declarar que seus dados estão prontos para uso e que não é preciso nada mais
É necessário verificar a qualidade e o volume dos dados coletados e que pensa em utilizar. “A maior parte do seu tempo, muitas vezes 80% do seu tempo, será gasto na obtenção e na limpeza de dados”, de acordo com Jonathan Ortiz, cientista de dados e engenheiro de conhecimento da data.world, em entrevista ao CIO. “Isso supondo que você esteja acompanhando o que precisa estar rastreando para que um cientista de dados faça seu trabalho”.
2 – Permitir que seu modelo de dados fique obsoleto
Se você possui um modelo de dados que funciona bem para o seu problema, pode até acreditar que conseguirá continuar utilizando-o para sempre. Porém, os modelos têm de ser atualizados e pode ser necessária a construção de modelos adicionais, com o passar do tempo. “Os recursos vão mudar com o tempo”, avisa Ortiz. “Você precisará checar continuamente a validade e atualizar seu modelo”.
3 – Automatizar sem monitorar o resultado final
Uma das vantagens do uso de um grupo de controle é medir a qualidade da saída do modelo. É preciso acompanhar isso durante todo o processo, ou acabar otimizando para o objetivo errado. “As empresas fazem coisas como aplicar um bot ao seu serviço telefônico, sem verificar continuamente se o bot está levando a uma maior satisfação do cliente, apenas comemorando o fato de que está usando menos mão de obra”, segundo John Steinert, diretor de marketing da TechTarget. Caso os clientes fechem os casos de suporte, pois o bot não pode dar a resposta correta, e não porque solucionou o problema, a satisfação do cliente cairá drasticamente.
4 – Escolher uma ferramenta muito complexa
A vanguarda do Machine Learning é empolgante e novas técnicas podem ser muito poderosas. No entanto, podem ser exageradas também. “Pode ser que um método simples, como a regressão logística ou uma árvore de decisão, funcione”, destaca Chintan Shah, cientista de dados da Avanade.
5 – Reutilizar implementações que não se encaixem no seu problema
Existem diversos exemplos de Ciência de Dados e Machine Learning com os quais é possível aprender e se adequar. “Uma das razões por trás do crescimento exponencial da Ciência de Dados é a disponibilidade da implementação de código aberto de quase todos os algoritmos, o que facilita o desenvolvimento de um protótipo rápido”, pontua Shah. Porém, essas implementações são desenvolvidas com frequência para casos de uso específicos. Se o que você quer do sistema é diferente, é melhor construir sua própria versão, recomenda o especialista. “Implemente suas próprias rotinas de limpeza de dados e criação de recursos. Isso lhe dará mais controle”.