Correlación en Azure Machine Learning
El cálculo de correlaciones es ampliamente usado en el mundo de la estadística para determinar que tan ligadas están dos o más variables entre sí.
Por ejemplo, si queremos realizar una proyección de ventas y queremos saber si la variación del PIB afecta la venta, un análisis preliminar puede consistir en medir la correlación entre estas dos variables.
La suite de Azure Machine Learning posee tres componentes principales, siendo uno de ellos la posibilidad de programar en Python usando una de sus más importantes librerías de análisis de datos: pandas. Y todo esto dentro de un ambiente amigable como son las libretas Jupyter, las cuáles permiten escribir, editar, guardar y ejecutar código en Python directamente en un entorno HTML.
El siguiente ejercicio consta del cálculo de correlación entre la venta de jugos y la temperatura
Podríamos asumir que a mayor temperatura la venta de jugos aumenta en un proporción similar, por lo que a continuación se presenta la carga de datos a Azure Machine Learning y luego el correspondiente cálculo de correlación en Python para determinar si esta hipótesis es correcta
Paso 1: Crear nuevo conjunto de datos

Paso 2: Crear nueva libreta
Anteriormente era necesario ejecutar nuestros scripts de Python en entorno de consola/terminal.
Jupyter en cambio, ofrece un entorno web para programar y ejecutar código en Python.
Azure Machine Learning Studio incluye por defecto las libretas (notebooks) de Jupyter que usaremos en esta sección

Paso 3: Consumir un conjunto de datos
Podemos copiar directamente el código que permite cargar en Python la información almacenada en un conjunto de datos de Azure ML (ver paso 1)

Paso 4: Abrir una libreta

Paso 5: Programar en Python
Una vez abierta la libreta, podemos trabajar directamente programando en Python.
Dado que necesitamos concluir si existe o no correlación entre la temperatura y la venta de jugos, la secuencia que seguiremos es la siguiente
Importar la información del maestro de productos cargado previamente como conjunto de datos y transformarlo en un dataframe, que corresponde a un tipo de datos de la librería pandas de Python.
Filtramos este maestro para terminar la lista productos que pertenecen a la categoría Jugos
Importar la información de venta como dataframe desde el conjunto de datos previamente creado
Filtrar la venta de acuerdo a la lista de productos que pertenece a la categoría Jugos