¿Qué es el aprendizaje automático supervisado?
En el aprendizaje supervisado, entrena la máquina utilizando buenos datos «etiquetado. «Significa que algunos datos ya están etiquetados con la respuesta correcta. Se pueden comparar con el aprendizaje que se lleva a cabo en presencia de un supervisor o profesor.
El algoritmo de aprendizaje supervisado aprende de los datos de entrenamiento etiquetados y le ayuda a predecir los resultados de los datos inesperados. El modelo de ciencia de datos requiere tiempo y experiencia técnica de un equipo de científicos de datos altamente capacitados para construir, escalar y usar la máquina con éxito. Además, un científico de datos necesita reconstruir modelos para asegurarse de que los conocimientos proporcionados sigan siendo verdaderos hasta que cambien sus datos.
En este tutorial, aprenderá
¿Qué es el aprendizaje no supervisado?
El aprendizaje no supervisado es una técnica de aprendizaje automático en la que no es necesario supervisar el modelo. En su lugar, debe permitir que el modelo funcione solo para obtener información. Se ocupa principalmente de los datos no etiquetados.
Los algoritmos de aprendizaje sin supervisión le permiten realizar tareas de procesamiento más complejas en comparación con el aprendizaje supervisado. Sin embargo, el aprendizaje no supervisado puede ser más predecible en comparación con el aprendizaje profundo y los métodos de aprendizaje reforzado.
¿Qué es el aprendizaje supervisado?
- El aprendizaje bajo supervisión le permite recopilar datos o producir datos a partir de experiencias anteriores.
- Le ayuda a optimizar los criterios de rendimiento mediante el uso de la experiencia.
- El aprendizaje automático supervisado le ayuda a resolver diferentes tipos de problemas informáticos en la vida real.
¿Qué aprendizaje no supervisado?
Estas son las principales razones para usar el aprendizaje no supervisado:
- El aprendizaje automático no supervisado encuentra todo tipo de patrones desconocidos en los datos.
- Los métodos no supervisados lo ayudan a encontrar características que pueden ser útiles para la categorización.
- Se realiza en tiempo real, por lo que todos los datos de entrada se analizan y etiquetan en presencia de los alumnos.
- Los datos sin etiquetar son más fáciles de obtener de una computadora que los datos etiquetados, lo que requiere intervención manual.
¿Cómo funciona el aprendizaje supervisado?
Por ejemplo, desea entrenar una máquina para que le ayude a predecir cuánto tiempo le llevará conducir a casa desde su lugar de trabajo. Aquí, comienza creando un conjunto de datos etiquetados. Estos detalles incluyen
- Las condiciones climáticas
- Hora del día
- vacaciones
Todos estos datos son sus entradas. El resultado es la cantidad de tiempo que tardó en conducir a casa ese día específico.
Sabes instintivamente que si llueve afuera, te tomará más tiempo conducir a casa. Pero la máquina necesita datos y estadísticas.
Ahora veremos cómo puede desarrollar un modelo de aprendizaje supervisado de este ejemplo que ayudará al usuario a determinar el tiempo de viaje. Lo primero que debe crear es un conjunto de datos de entrenamiento. El tiempo total de viaje y los factores correspondientes, como el clima, la hora, etc. En este conjunto de entrenamiento. Según este conjunto de entrenamiento, su máquina puede encontrar que existe una relación directa entre la cantidad de lluvia y el tiempo que le toma llegar a casa.
Entonces descubre que cuanto más llueve, más tiempo conducirá para regresar a su casa. También puede ver la conexión entre el tiempo que sale del trabajo y el tiempo que está en la carretera.
Cuanto más ancho sea a 6 en más tiempo le llevará llegar a casa. Su máquina puede encontrar algunas de las relaciones con sus datos etiquetados.
Este es el comienzo de su modelo de datos. Comienza a afectar el impacto de la lluvia en la forma en que las personas conducen. También comienza a ver a más personas viajar en determinados momentos del día.
¿Cómo funciona el aprendizaje no supervisado?
Tomemos una funda para bebé y un perro de la familia.
Ella conoce a este perro y lo reconoce. Unas semanas más tarde, un amigo de la familia trae un perro con él e intenta jugar con el bebé.
El bebé no había visto a este perro antes. Pero reconoce que su perro tiene muchas características (2 orejas, ojos, caminar sobre 4 patas). Ella reconoce un nuevo animal como un perro. Este es un aprendizaje no supervisado, en el que solo se le enseña a aprender de los datos (en este caso, detalles sobre un perro). Si se tratara de un aprendizaje supervisado, el amigo de la familia le habría dicho a un niño que es un perro.
Tipos de técnicas de aprendizaje automático supervisadas
Regresión:
Una técnica de regresión predice el valor de una salida individual utilizando datos de entrenamiento.
Ejemplo: puede utilizar la regresión para predecir el precio de la vivienda a partir de los datos de formación. Las variables de entrada son el distrito, el tamaño de la casa, etc.
Clasificación:
La clasificación significa agrupar la salida dentro de una clase. Si el algoritmo intenta etiquetar la entrada en dos clases separadas, se denomina clasificación binaria. La elección entre más de dos clases se denomina clasificación multiclase.
Ejemplo: Decidir si una persona morirá o no en el préstamo.
Fortalezas: Las salidas siempre tienen una interpretación de probabilidad y el algoritmo se puede regular para evitar el overclocking.
Debilidades: La regresión logística puede tener un rendimiento inferior cuando existen límites de decisión múltiples o no lineales. Este método no es flexible, por lo que no asume relaciones más complejas.
Tipos de técnicas de aprendizaje automático no supervisadas
Los problemas de aprendizaje no supervisados se agrupan además en problemas de agrupación y asociación.
Agrupación
La agrupación es un concepto importante para el aprendizaje no supervisado. Se trata principalmente de encontrar una estructura o patrón en una recopilación de datos sin categorizar. Los algoritmos de agrupación procesarán sus datos y recuperarán agrupaciones naturales (grupos) si existen en los datos. También puede modificar cuántos clústeres deben reconocer sus algoritmos. Le permite ajustar la granulosidad de estos grupos.
Asociación
Las reglas de asociación le permiten establecer asociaciones entre objetos de datos dentro de grandes bases de datos. Esta técnica no supervisada implica encontrar relaciones interesantes entre variables en grandes bases de datos. Por ejemplo, es más probable que las personas que compran una casa nueva compren muebles nuevos.
Otros ejemplos:
- Un subgrupo de pacientes con cáncer agrupados por sus medidas de expresión génica
- Grupos de compradores según su historial de navegación y compras
- Grupo de películas de acuerdo con la calificación otorgada por los espectadores de películas
Aprendizaje supervisado frente a aprendizaje no supervisado
Parámetros | Técnica de aprendizaje automático supervisada | Técnica de aprendizaje automático sin supervisión |
Proceso | En un modelo de aprendizaje supervisado, se darán las variables de entrada y salida. | En el modelo de aprendizaje no supervisado, solo se proporcionarán datos de entrada |
Datos de entrada | Los algoritmos se entrenan utilizando datos etiquetados. | Los algoritmos se utilizan contra datos no etiquetados |
Algoritmos utilizados | Admite máquina vectorial, red neuronal, regresión lineal y logística, bosque aleatorio y árboles clasificados. | Los algoritmos no supervisados se pueden dividir en varias categorías: como algoritmos de clúster, recurso K, agrupamiento jerárquico, etc. |
Complejidad computacional | El aprendizaje supervisado es un método más simple. | El aprendizaje no supervisado está informatizado |
Uso de datos | Un modelo de aprendizaje supervisado utiliza datos de entrenamiento para aprender un vínculo entre las entradas y las salidas. | El aprendizaje no supervisado no utiliza datos de salida. |
Exactitud de los resultados | Método muy preciso y confiable. | Método menos preciso y confiable. |
Aprendizaje en tiempo real | Se produce el método de aprendizaje fuera de línea. | El modo de aprendizaje se realiza en tiempo real. |
Numero de clases | Conoce el número de clases. | Se desconoce el número de clases. |
Desventaja principal | La clasificación de big data es un desafío importante en el aprendizaje supervisado. | No puede obtener información precisa sobre la clasificación de datos y la salida se etiqueta como datos desconocidos utilizados en el aprendizaje no supervisado. |
Resumen
- En el aprendizaje supervisado, entrena la máquina utilizando datos que están «bien etiquetados».
- El aprendizaje no supervisado es una técnica de aprendizaje automático en la que no es necesario supervisar el modelo.
- El aprendizaje bajo supervisión le permite recopilar datos o producir datos a partir de experiencias anteriores.
- El aprendizaje automático no supervisado lo ayuda a encontrar todo tipo de patrones desconocidos en los datos.
- Por ejemplo, podrá determinar el tiempo que tardará en regresar según el clima, las horas del día y los días festivos.
- Por ejemplo, un niño puede identificar a otros perros basándose en un aprendizaje supervisado previo.
- La regresión y la clasificación son dos tipos de técnicas de aprendizaje automático supervisadas.
- La agrupación y la asociación son dos tipos de aprendizaje no supervisado.
- En un modelo de aprendizaje supervisado, se proporcionarán variables de entrada y salida y, en el caso de un modelo de aprendizaje no supervisado, solo se proporcionarán datos de entrada.