pandas marco de datos.impar() se utiliza para obtener la correlación por pares de todas las columnas en Pandas Dataframe en Python. Cualquier valor de NaN se excluye automáticamente. Cualquier tipo de datos no numéricos o columnas en el marco de datos se ignoran.
Sintaxis de dataframe.corr()
Use la función odd() para encontrar la correlación entre las columnas en el Dataframe usando el método ‘Pearson’.
Sintaxis: DataFrame.odd(self, mode=’person’, min_periods=1)
Parámetros:
- método:
- pearson: coeficiente de correlación estándar
- kendall: Coeficiente de correlación Tau de Kendall
- Spearman: correlación de rango de Spearman
- min_períodos: El número mínimo de observaciones requeridas por par de columnas para tener un resultado válido. Actualmente solo disponible para la correlación de Pearson y Spearman
Devoluciones: contar: y: marco de datos
Un ejemplo
Un ejemplo simple que muestra cómo funciona la correlación en Python.
Python3
import pandas as pd df = { "Array_1" : [ 30 , 70 , 100 ], "Array_2" : [ 65.1 , 49.50 , 30.7 ] } data = pd.DataFrame(df) print (data.corr()) |
Producción:
Array_1 Array_2 Array_1 1.000000 -0.990773 Array_2 -0.990773 1.000000
Representación de pandas dataframe.corr()
Imprima las primeras 10 filas del marco de datos.
Nota: La correlación entre una variable consigo misma es 1. Para obtener un vínculo al archivo CSV utilizado en el código, haga clic en aquí
Python3
# importing pandas as pd import pandas as pd # Making data frame from the csv file df = pd.read_csv( "nba.csv" ) # Printing the first 10 rows of the data frame for visualization d.f.[: 10 ] |
Producción:
Ejemplo 1:
Ahora usa odd() para encontrar la correlación entre las columnas. Solo tenemos cuatro columnas numéricas en el marco de datos. El marco de datos de salida se puede representar junto con cualquier celda, la correlación entre una variable de fila y la variable de columna es el valor de la celda. Como se mencionó anteriormente, la correlación entre una variable y ella misma es 1. Por lo tanto, todos los valores de la diagonal son 1,00
Python3
# To find the correlation among # the columns using pearson method df.corr(method = 'pearson' ) |
Producción:
Ejemplo 2:
Use la función odd() para encontrar la correlación entre las columnas en el Dataframe usando el método ‘kendall’. El marco de datos de salida se puede representar junto con cualquier celda, la correlación entre una variable de fila y la variable de columna es el valor de la celda. Como se mencionó anteriormente, la correlación entre una variable y sí misma es 1. Por lo tanto, todos los valores de la diagonal son 1,00.
Python3
# importing pandas as pd import pandas as pd # Making data frame from the csv file df = pd.read_csv( "nba.csv" ) # To find the correlation among # the columns using kendall method df.corr(method = 'kendall' ) |
Producción:

