Do curso: Como Usar o Aprendizado de Máquina para Agregar Valor à sua Empresa
Definição do problema
Do curso: Como Usar o Aprendizado de Máquina para Agregar Valor à sua Empresa
Definição do problema
Em um projeto de aprendizado de máquina, definir o problema e estimar como obteremos um retorno do ponto de vista do negócio é muito importante, além de ser uma tarefa complicada. Não recomendo promover iniciativas de aprendizado de máquina se o objetivo do projeto e o impacto esperado para a empresa não estiverem claros. Nessa fase inicial, cientistas de dados e gerentes de negócios devem se entender. É muito comum que os profissionais técnicos desconheçam os interesses estratégicos de seus colegas e que os perfis empresariais não se interessem pelas novas tecnologias ou ainda não confiem nelas, pois acham difícil entendê-las. Além disso, todas as iniciativas estratégicas que surgem não precisariam ser viáveis. Lembre-se: precisaremos de dados suficientes e de qualidade para obter previsões valiosas. Neste ponto, podemos optar por qualquer uma dessas duas abordagens: baseada em dados ou baseada em hipóteses. Uma abordagem baseada em dados terá em conta as informações disponíveis e sua qualidade para identificar casos de uso viáveis e, em seguida, analisar a rentabilidade esperada. Já na abordagem baseada em hipóteses serão detectados os casos de uso que podem agregar valor estratégico ao negócio, verificando se temos tecnicamente os dados necessários para isso ou se eles podem ser obtidos, caso não estejam disponíveis no momento. Essa tarefa nem sempre é fácil e pode até ser inviável. Por exemplo, dependendo da lei de proteção de dados pessoais de cada região, pode haver restrições para usá-los no projeto. No Brasil, é necessário solicitar previamente a autorização do titular dos dados, e o consentimento deve ser informado e explícito. Independentemente da abordagem, há vários aspectos que devemos considerar para definir um problema de aprendizado de máquina. Por um lado, existem aspectos técnicos como fontes, tipos de dados disponíveis e como eles devem ser processados. Por outro lado, é preciso definir as vantagens competitivas que alcançaremos com o projeto, possíveis riscos, como a rejeição dos funcionários ou o treinamento de uma parte da equipe, e quais dados de saída esperamos. Depois disso, podemos equilibrar a complexidade do projeto e o investimento necessário e avaliar se a rentabilidade será a prevista. Aliás, é interessante usar um indicador do qual já temos um histórico ou definir um novo KPI para estimar se o projeto foi bem-sucedido. Tudo isso sem deixar de nos fazermos perguntas éticas para evitar vieses e garantir que estamos cumprindo as normas vigentes.