Los mejores cursos de ciencia de datos de Kaggle

Kaggle es la plataforma más popular para Data Science. ¡Hay toneladas de conjuntos de datos gratuitos, proyectos que puedes usar para practicar y concursos con premios increíbles! También hay una comunidad útil donde puedes compartir tus pensamientos y aprender cosas nuevas. Pero la mejor característica de Kaggle es Kaggle Learn. Incluso si no sabe nada sobre ciencia de datos, puede aprender todos los conceptos básicos de los cursos de Kaggle y luego pasar a perfeccionar sus habilidades mediante la realización de proyectos.

estas Kaggle Los cursos de ciencia de datos son los microcursos que son la forma más rápida de obtener las habilidades que necesita para un proyecto de ciencia de datos. Proporcionan una introducción rápida a la ciencia de datos si es un principiante al cubrir todos los temas importantes como Python, aprendizaje automático, visualización de datos, Pandas, SQL, aprendizaje profundo, procesamiento de lenguaje natural (NLP), etc. cursos en detalle y comprender lo que puede aprender de ellos.

1. pitón

Este es el primer minicurso de la serie de cursos ofrecidos para Data Science. ¡Y eso es porque necesitas aprender Python antes de sumergirte en aguas más profundas! Este curso le brinda una comprensión básica del lenguaje Python desde su sintaxis hasta funciones, booleanos, condicionales, listas, bucles, listas de comprensión, cadenas, diccionarios y bibliotecas externas. Cada uno de estos módulos del curso contiene información básica seguida de ejemplos y ejercicios, para que pueda aprender haciendo. ¡Estos proporcionan un conocimiento holístico de Python en 2 horas que puede desarrollar hasta que haya dominado el lenguaje más popular en Data Science!

2. Introducción al aprendizaje automático

El aprendizaje automático es una parte importante de la ciencia de datos porque los algoritmos de ML se entrenan con datos y luego se usan con datos según su necesidad. Es por eso que este segundo minicurso sobre Kaggle trata sobre la introducción al aprendizaje automático con un enfoque especial en los modelos de aprendizaje automático, la validación de modelos, el ajuste insuficiente, el ajuste excesivo, los bosques aleatorios y un ejercicio que enseña más sobre las competencias de aprendizaje automático. También hay algunas lecciones adicionales sobre Introducción a AutoML y cómo iniciar sus propios cuadernos Kaggle para participar en competencias. Y usará la competencia Titanic: Machine Learning from Disaster como ejemplo. ¡Esa es una competencia famosa en Kaggle!

3. Aprendizaje automático intermedio

Después de la introducción, Kaggle tiene el microcurso de aprendizaje automático intermedio que profundiza en el aprendizaje automático. Se enfoca principalmente en valores faltantes en un conjunto de datos, Pipelines, Cross Validation, XGBoost, Data Leakage, etc. Aprender este curso asegurará que sus modelos Ml sean mucho más precisos y útiles de lo que podrían ser de otra manera.

4. Visualización de datos

El próximo curso se centra en la visualización de datos, que es una parte vital de la ciencia de datos. Es muy difícil comunicar ideas y patrones de datos a las personas cuando esos datos se almacenan en filas y filas de tablas. Ahí es donde la visualización de datos es extremadamente útil, ya que comunica la información de los datos de manera comprensible. Este mini curso comienza con Seaborn y luego le enseña cómo crear gráficos de líneas, gráficos de barras, mapas de calor, diagramas de dispersión, histogramas y diagramas de densidad. También ayuda a elegir la visualización correcta para los datos y luego usa un proyecto final para probar sus habilidades en todo lo que ha aprendido.

5. Pandas

Pandas es una popular biblioteca de software de Python para el análisis y la manipulación de datos. Así que obviamente este es el próximo mini-curso que aprenderás. Comienza con la creación, lectura y escritura de datos usando Pandas y luego continúa con la indexación, selección, combinación, clasificación, cambio de nombre, asignación, agrupación, etc. Todas estas son técnicas que son fundamentales para la ciencia de datos, ya que ayudan a limpiar y preparar sus conjuntos de datos. Este curso también le enseña cómo investigar los tipos de datos dentro de un DataFrame o Array y cómo lidiar con los valores de datos faltantes.

6. Introducción al aprendizaje profundo

Kaggle Courses también se enfoca en el aprendizaje profundo en un nivel básico para que pueda pasar a temas avanzados por su cuenta más adelante. Este curso comienza con una introducción al aprendizaje profundo en visión artificial y luego continúa con la creación de modelos a partir de convoluciones de programación, TensorFlow y Keras, la creación de modelos de alta precisión mediante el aprendizaje por transferencia, además de proporcionar más datos para el entrenamiento de modelos mediante el aumento de datos. Luego, le enseña una comprensión más profunda de Deep Learning con descenso de gradiente estocástico y propagación hacia atrás y cómo construir modelos sin transferencia de aprendizaje. También hay una lección adicional que lo ayuda a participar en la competencia Petals to the Metal Kaggle, donde debe crear un modelo de aprendizaje automático que identifique el tipo de flor en un conjunto de datos de imágenes.

7. Introducción a SQL

Ahora pasamos al ámbito de las bases de datos y con él, ¡viene SQL! Como sabe, SQL es un lenguaje de administración de bases de datos muy popular, por lo que el microcurso de Kaggle obviamente también cubre esto. El curso trata los conceptos básicos de SQL y BigQuery y le enseña cómo crear consultas SQL utilizando palabras clave comunes como Seleccionar, De, Agrupar por, Dónde, En, Contar, Ordenar por, Como y con, etc. También le enseña cómo combinar diferentes fuentes de datos usando Join y los diferentes tipos de Join.

8. SQL avanzado

Después de la introducción a SQL, Kaggle pasa a un curso de SQL avanzado que enseña este tema en detalle. Esto incluye más información sobre las diversas uniones y uniones, así como la explicación de las funciones analíticas, los datos anidados y los datos repetidos. Finalmente, te enseña diferentes estrategias sobre cómo escribir preguntas más efectivas que antes.

9. Análisis geoespacial

El análisis geoespacial se centra en los datos geoespaciales y cómo manejarlos correctamente. Este breve curso comienza con el aprendizaje de cómo trazar en GeoPandas, un proyecto de código abierto que facilita el trabajo con datos geoespaciales en Python. También aprenderá sobre los sistemas de coordenadas de referencia que representan la Tierra 3D en 2D junto con los conceptos básicos para crear mapas de calor interactivos y mapas de coropletas. Este curso también le enseña cómo manejar datos geoespaciales, así como los conceptos básicos del análisis de proximidad.

10. Procesamiento del lenguaje natural

Este es un curso breve que enseña los conceptos básicos del procesamiento del lenguaje natural. La PNL es una rama de la Inteligencia Artificial que se centra en la enseñanza de lenguajes como el habla y el texto a las máquinas. Siri, Alexa, etc. son un gran ejemplo de esto. Dado que el procesamiento del lenguaje natural es un tema tan complejo, Kaggle solo tiene un microcurso básico que cubre Introducción a la PNL, clasificación de texto que combina aprendizaje automático con habilidades de PNL, y luego termina con un módulo sobre vectores de palabras.

Además de todos estos cursos, Kaggle también tiene varios otros cursos que cubren varios otros aspectos de la ciencia de datos. Éstos incluyen Ingeniería de características que le enseña cómo mejorar sus modelos con modelos de referencia, codificación categórica, generación de características y selección de características, Visión por computador, Limpieza de datosy Aprendizaje automático explicable. hay otro curso Introducción a la IA de juegos y el aprendizaje por refuerzo. Este es un curso divertido que te permite crear tus bots de videojuegos utilizando el algoritmo minimax y el aprendizaje de refuerzo profundo. Además de todos estos cursos, también hay un módulo separado para Micro Desafíos que te permitirá aplicar todo lo que has aprendido y poner a prueba tus habilidades.

Es posible que todos los microcursos y desafíos de Kaggle no lo conviertan en un experto por sí solos, pero lo harán más inteligente y más capaz de usar estos conceptos básicos para desarrollar aún más su conocimiento. ¡Y son gratis! ¡Así que no tienes nada que perder y mucho que ganar!

Mis notas personales
flecha_caer_arriba

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Salir de la versión móvil