
Jose Manuel Ortega | Security researcher & Software engineer
Machine learning y data science con scikit-learn y pyspark
-
Este curso pretende ser una introducción a las técnicas más relevantes de Machine Learning y mostrar ejemplos de aplicación de estas técnicas. Que sirva para conocer qué técnicas existen, en qué se fundamentan y sobre qué tipos de problemas pueden aplicarse.
-
El enfoque será teórico-práctico y se hará uso del lenguaje de programación Python y del toolkit Scikit Learn. Se recomienda a los alumnos instalarse ANACONDA en su plataforma habitual. ANACONDA incluye Python, Scikit-Learn y Matplotlib. La versión de python que utilizaremos será la 3.6.
-
También veremos pyspark como plataforma de desarrollo de aplicaciones distribuídas
-
Entre los principales objetivos podemos destacar:
-
Introducir los conceptos de ciencias de datos y machine learning.
-
Introducir las principales librerías que podemos encontrar en python para aplicar técnicas de machine learning a los datos.
-
Introducir las principales librerías que podemos encontrar en python para tratamiento y visualización de datos
-
Dar a conocer los pasos para construir un modelo de machine learning, desde la adquisición de datos,pasando por la generación de funciones, hasta la selección de modelos.
-
Dar a conocer los principales algoritmos para resolver problemas de machine learning.
-
Introducir scikit-learn como herramienta para resolver problemas de machine learning.
-
Introducir pyspark como herramienta para aplicar técnicas de big data y map-reduce a los datos.
-
Conocer y aplicar algoritmos de machine learning con pyspark.
-
Introducir los sistemas de recomendación basados en contenidos
¿Cuáles son los requisitos?
-
Es necesario tener conocimientos básico de python.
-
Es necesario tener instalada la distribución de Python de Anaconda, preferentemente la versión de Python3. Se usarán principalmente las librerías numpy, scipy, pandas, scikit-learn y pyspark.
-
Es necesario tener instalado python.Trabajaremos con python 3.6
-
¿Qué voy a aprender en este curso?
-
Investigar que con Python también se puede hacer ciencia de datos y machine learning.
-
Aplicar técnicas de machine learning y ciencia de datos en proyectos con python
-
Que el alumno descubra el potencial de las técnicas de Machine Learning para el análisis de datos y sobre todo para extracción de información a partir de los datos. Es decir, sacar valor a los datos.
-
Presentar con casos prácticas las técnicas de Machine Learning que actualmente se utilizan en soluciones de análisis de datos, tanto en Big Data como en Data Science en general.
-
Dar a conocer una de las herramientas más fáciles de utilizar para aplicar Machine Learning a problemas reales de una manera sencilla, como es Python, Numpy y Scikit-Learn.
-
¿A quién está dirigido?
-
Desarrolladores python interesados en herramientas de machine learning y data science





