
Se, como afirmou o escritor de ficção científica Arthur C. Clarke, "qualquer tecnologia suficientemente avançada é indistinguível da mágica", então, às vezes, parece que a ciência de dados é vista como uma forma de tirar coelhos da cartola. Essa narrativa é, obviamente, equivocada. É a percepção do que chamo de "mágica de dados", em que as pessoas acreditam que os dados podem ser bombeados para uma extremidade da "máquina de ciência de dados" e o widget perfeito (a solução para os problemas de todos) surgirá do outro lado.
Em grande parte, isso ocorre porque a grande maioria das pessoas não entende o funcionamento da ciência de dados e, quando você entra nas áreas mais avançadas, como a aprendizagem profunda, até mesmo muitos cientistas de dados reconhecem que não entendem os vários níveis de complexidade. Mas se você é um cientista de dados, sabe o suficiente (na maioria das vezes) para saber quando está fora de seu alcance. Entretanto, fora da comunidade de ciência de dados, esse nem sempre é o caso. E isso é compreensível.
Em parte, é nossa própria culpa. É um clube difícil; historicamente, é difícil para os "forasteiros" penetrarem, muito menos entenderem. As linguagens da ciência de dados têm sido mantidas em segredo. Assim como a Igreja Católica Romana selecionou o latim eclesiástico como a principal linguagem de comunicação para controlar as mensagens, principalmente durante a Idade Média e no início do período moderno, nós, cientistas de dados, poderíamos ser acusados de ações semelhantes - embora, obviamente, não na mesma escala nem com um impacto tão direto em populações inteiras. Mas, assim como a Reforma do século XVI levou à liberação da linguagem, tornando os princípios das várias igrejas cristãs mais disponíveis para as massas, a ciência de dados deve agora ampliar ainda mais seu vernáculo.
Uma linguagem compartilhada nos permitiria ir além da crença de que os cientistas de dados têm capacidades místicas para resolver qualquer problema, executando dados por meio de um ambiente de IA para produzir os resultados desejados, como que por mágica. Isso ajudaria as pessoas a entender que a ciência de dados não é uma panaceia mágica.
De fato, se você realmente deseja uma ciência de dados avançada, uma das piores coisas a fazer é designar um cientista de dados para resolver problemas isolados ou ad hoc, pois isso criará silos de comunicação, mantendo a ciência de dados nos bastidores.
Em vez disso, a melhor maneira de proliferar a ciência de dados é expor problemas de nível empresarial, entendendo que, se bem feita, a ciência de dados é um esporte de equipe. Ter equipes multidisciplinares dedicadas a produtos ou clientes produz resultados comerciais superiores e desenvolve o entendimento multifuncional. Um grupo que inclua um associado comercial, um gerente de produto, um engenheiro, um cientista de dados e representantes de outras organizações funcionais importantes deve ser trancado em uma sala sem interrupções para uma reunião de mentes focada nas maiores necessidades e oportunidades. É nesse momento que a verdadeira mágica acontece.
Ainda assim, um viajante nessa jornada deve estar ciente dos sinais de alerta. Se, ao trabalhar com clientes ou outros terceiros no espírito de colaboração, você começar a buscar soluções explicáveis para todo mundo, faça uma pausa. Assim como um mágico não limita seu desempenho a truques elementares, o público entende que os cientistas de dados não devem se limitar a soluções facilmente explicáveis. A diluição deliberada do processo pode ter o efeito colateral de fornecer uma solução inferior à ideal para o problema. É um equilíbrio.
Esse equilíbrio depende de as empresas confiarem nas capacidades de seus cientistas de dados. Confiar que os cientistas de dados compartilharão nossa linguagem o máximo possível, mas não diluirão as soluções quando as coisas se tornarem muito técnicas, e que sempre permaneceremos fiéis à nossa disciplina. Esse é o tipo de confiança e equilíbrio que permite que as empresas tecnologicamente avançadas cheguem a seus respectivos conjuntos de verdades.
Este artigo foi publicado originalmente no Mídia.