Treinamento de Machine Learning supervisionado ou não

Treinamento supervisionado ou não supervisionado
Treinamento supervisionado ou não supervisionado

No post que eu falei sobre a diferença entre machine Learn e Deep learning, comentei que para evoluir um modelo é necessário treiná-lo, fornecendo dados para isso, dessa forma, o aprendizado dessa máquina, é baseado no que fornecemos a ela. Quando vamos treinar um algoritmo para evolui-lo, e torná-lo mais assertivo nas tomadas de decisões, esse treinamento podemos fazer de duas formas:

Treinamento machine learning Supervisionado

No conjunto de dados de treinamento, existe uma variável chamada TARGET, que é o que queremos descobrir normalmente, preve-la no resultado final. Mas, essa característica foi colocada lá “manualmente”, por um humano. Fomos nós, seres humanos, que nomeamos esse grupo de coisas com esse nome e o modelo possui uma referência do que esta certo, e do que esta errado.

Treinamento de machine learning não supervisionado

Diferente do supervisionado, esse não possui um target nomeando cada coisa ou categoria, para se referenciar ou agrupar coisas parecidas. Essa forma, o algoritmo precisa de maneira independente agrupar os itens parecidos, não irá nomea-los, pois ele não conhece realmente o que é , mas sabe que são parecidos, levando em consideração as caraterísticas conhecidas por ele.

Vantagens e desvantagens

Como a maioria das coisas, existem vantagens e desvantagens de cada treinamento. Quando um aprendizado é supervisionado, precisamos avaliar muito bem nossa base de teste, classifica-la, muitas vezes conhecer bem o negócio que estamos desenvolvendo para evitar sinônimos, ou ate target com regionalismos, como por exemplo o nome de uma fruta, pode ter diferentes nomes no país, mexerica, bergamota ou tangerina, por exemplo.

Já no não supervisionado, precisamos gastar um tempo maior, ja que não temos um rótulo para avaliar, e mesmo sendo não supervisionado, as vezes irá precisar de uma intervenção humana para resultados mais satisfatórios.

Qual modelo de treinamento escolher?

Sem dúvidas a origem e qualidade da base de treinamento é um fator quase que determinante para a escolha inicial de um modelo de treinamento. O Problema ja é conhecido, ou estamos tentando usar aprendizagem de máquina para gerar insigths e descobrir coisas?

A escolha de um método não é imutável, ela pode ser alterado com o tempo. E com os resultados que forem obtidos. Pode se iniciar não supervisionado para agrupar e em seguida identificar os grupos.

Usufruir dos dois meios é uma boa prática, ja que durante uma aprendizagem não supervisionada pode ser identificado padrões ate então desconhecidos. Padrões que poderiam passar despercebidos caso fosse em uma supervisionada, usando target.