Saltar al contenido

Aprendizaje supervisado frente a aprendizaje no supervisado: diferencias clave

¿Qué es el aprendizaje automático supervisado?

En el aprendizaje supervisado, entrena la máquina utilizando buenos datos «etiquetado. «Significa que algunos datos ya están etiquetados con la respuesta correcta. Se pueden comparar con el aprendizaje que se lleva a cabo en presencia de un supervisor o profesor.

El algoritmo de aprendizaje supervisado aprende de los datos de entrenamiento etiquetados y le ayuda a predecir los resultados de los datos inesperados. El modelo de ciencia de datos requiere tiempo y experiencia técnica de un equipo de científicos de datos altamente capacitados para construir, escalar y usar la máquina con éxito. Además, un científico de datos necesita reconstruir modelos para asegurarse de que los conocimientos proporcionados sigan siendo verdaderos hasta que cambien sus datos.

En este tutorial, aprenderá

¿Qué es el aprendizaje no supervisado?

El aprendizaje no supervisado es una técnica de aprendizaje automático en la que no es necesario supervisar el modelo. En su lugar, debe permitir que el modelo funcione solo para obtener información. Se ocupa principalmente de los datos no etiquetados.

Los algoritmos de aprendizaje sin supervisión le permiten realizar tareas de procesamiento más complejas en comparación con el aprendizaje supervisado. Sin embargo, el aprendizaje no supervisado puede ser más predecible en comparación con el aprendizaje profundo y los métodos de aprendizaje reforzado.

¿Qué es el aprendizaje supervisado?

¿Qué aprendizaje no supervisado?

Estas son las principales razones para usar el aprendizaje no supervisado:

¿Cómo funciona el aprendizaje supervisado?

Por ejemplo, desea entrenar una máquina para que le ayude a predecir cuánto tiempo le llevará conducir a casa desde su lugar de trabajo. Aquí, comienza creando un conjunto de datos etiquetados. Estos detalles incluyen

Todos estos datos son sus entradas. El resultado es la cantidad de tiempo que tardó en conducir a casa ese día específico.

Sabes instintivamente que si llueve afuera, te tomará más tiempo conducir a casa. Pero la máquina necesita datos y estadísticas.

Ahora veremos cómo puede desarrollar un modelo de aprendizaje supervisado de este ejemplo que ayudará al usuario a determinar el tiempo de viaje. Lo primero que debe crear es un conjunto de datos de entrenamiento. El tiempo total de viaje y los factores correspondientes, como el clima, la hora, etc. En este conjunto de entrenamiento. Según este conjunto de entrenamiento, su máquina puede encontrar que existe una relación directa entre la cantidad de lluvia y el tiempo que le toma llegar a casa.

Entonces descubre que cuanto más llueve, más tiempo conducirá para regresar a su casa. También puede ver la conexión entre el tiempo que sale del trabajo y el tiempo que está en la carretera.

Cuanto más ancho sea a 6 en más tiempo le llevará llegar a casa. Su máquina puede encontrar algunas de las relaciones con sus datos etiquetados.

Este es el comienzo de su modelo de datos. Comienza a afectar el impacto de la lluvia en la forma en que las personas conducen. También comienza a ver a más personas viajar en determinados momentos del día.

¿Cómo funciona el aprendizaje no supervisado?

Tomemos una funda para bebé y un perro de la familia.

Ella conoce a este perro y lo reconoce. Unas semanas más tarde, un amigo de la familia trae un perro con él e intenta jugar con el bebé.

El bebé no había visto a este perro antes. Pero reconoce que su perro tiene muchas características (2 orejas, ojos, caminar sobre 4 patas). Ella reconoce un nuevo animal como un perro. Este es un aprendizaje no supervisado, en el que solo se le enseña a aprender de los datos (en este caso, detalles sobre un perro). Si se tratara de un aprendizaje supervisado, el amigo de la familia le habría dicho a un niño que es un perro.

Tipos de técnicas de aprendizaje automático supervisadas

Regresión:

Una técnica de regresión predice el valor de una salida individual utilizando datos de entrenamiento.

Ejemplo: puede utilizar la regresión para predecir el precio de la vivienda a partir de los datos de formación. Las variables de entrada son el distrito, el tamaño de la casa, etc.

Clasificación:

La clasificación significa agrupar la salida dentro de una clase. Si el algoritmo intenta etiquetar la entrada en dos clases separadas, se denomina clasificación binaria. La elección entre más de dos clases se denomina clasificación multiclase.

Ejemplo: Decidir si una persona morirá o no en el préstamo.

Fortalezas: Las salidas siempre tienen una interpretación de probabilidad y el algoritmo se puede regular para evitar el overclocking.

Debilidades: La regresión logística puede tener un rendimiento inferior cuando existen límites de decisión múltiples o no lineales. Este método no es flexible, por lo que no asume relaciones más complejas.

Tipos de técnicas de aprendizaje automático no supervisadas

Los problemas de aprendizaje no supervisados ​​se agrupan además en problemas de agrupación y asociación.

Agrupación

La agrupación es un concepto importante para el aprendizaje no supervisado. Se trata principalmente de encontrar una estructura o patrón en una recopilación de datos sin categorizar. Los algoritmos de agrupación procesarán sus datos y recuperarán agrupaciones naturales (grupos) si existen en los datos. También puede modificar cuántos clústeres deben reconocer sus algoritmos. Le permite ajustar la granulosidad de estos grupos.

Asociación

Las reglas de asociación le permiten establecer asociaciones entre objetos de datos dentro de grandes bases de datos. Esta técnica no supervisada implica encontrar relaciones interesantes entre variables en grandes bases de datos. Por ejemplo, es más probable que las personas que compran una casa nueva compren muebles nuevos.

Otros ejemplos:

Aprendizaje supervisado frente a aprendizaje no supervisado

Parámetros Técnica de aprendizaje automático supervisada Técnica de aprendizaje automático sin supervisión
ProcesoEn un modelo de aprendizaje supervisado, se darán las variables de entrada y salida.En el modelo de aprendizaje no supervisado, solo se proporcionarán datos de entrada
Datos de entradaLos algoritmos se entrenan utilizando datos etiquetados.Los algoritmos se utilizan contra datos no etiquetados
Algoritmos utilizadosAdmite máquina vectorial, red neuronal, regresión lineal y logística, bosque aleatorio y árboles clasificados.Los algoritmos no supervisados ​​se pueden dividir en varias categorías: como algoritmos de clúster, recurso K, agrupamiento jerárquico, etc.
Complejidad computacionalEl aprendizaje supervisado es un método más simple.El aprendizaje no supervisado está informatizado
Uso de datosUn modelo de aprendizaje supervisado utiliza datos de entrenamiento para aprender un vínculo entre las entradas y las salidas.El aprendizaje no supervisado no utiliza datos de salida.
Exactitud de los resultadosMétodo muy preciso y confiable.Método menos preciso y confiable.
Aprendizaje en tiempo realSe produce el método de aprendizaje fuera de línea.El modo de aprendizaje se realiza en tiempo real.
Numero de clasesConoce el número de clases.Se desconoce el número de clases.
Desventaja principalLa clasificación de big data es un desafío importante en el aprendizaje supervisado.No puede obtener información precisa sobre la clasificación de datos y la salida se etiqueta como datos desconocidos utilizados en el aprendizaje no supervisado.

Resumen