Pitón | marco de datos de pandas.odd()

pandas marco de datos.impar() se utiliza para obtener la correlación por pares de todas las columnas en Pandas Dataframe en Python. Cualquier valor de NaN se excluye automáticamente. Cualquier tipo de datos no numéricos o columnas en el marco de datos se ignoran.

Sintaxis de dataframe.corr()

Use la función odd() para encontrar la correlación entre las columnas en el Dataframe usando el método ‘Pearson’.

Sintaxis: DataFrame.odd(self, mode=’person’, min_periods=1)

Parámetros:

  • método:
    • pearson: coeficiente de correlación estándar
    • kendall: Coeficiente de correlación Tau de Kendall
    • Spearman: correlación de rango de Spearman
  • min_períodos: El número mínimo de observaciones requeridas por par de columnas para tener un resultado válido. Actualmente solo disponible para la correlación de Pearson y Spearman

Devoluciones: contar: y: marco de datos

Un ejemplo

Un ejemplo simple que muestra cómo funciona la correlación en Python.

Python3



import pandas as pd
df = {
  "Array_1": [30, 70, 100],
  "Array_2": [65.1, 49.50, 30.7]
}
data = pd.DataFrame(df)
print(data.corr())

Producción:

          Array_1   Array_2
Array_1  1.000000 -0.990773
Array_2 -0.990773  1.000000

Representación de pandas dataframe.corr()

Imprima las primeras 10 filas del marco de datos.

Nota: La correlación entre una variable consigo misma es 1. Para obtener un vínculo al archivo CSV utilizado en el código, haga clic en aquí

Python3



# importing pandas as pd
import pandas as pd
# Making data frame from the csv file
df = pd.read_csv("nba.csv")
# Printing the first 10 rows of the data frame for visualization
d.f.[:10]

Producción:

Ejemplo 1:

Ahora usa odd() para encontrar la correlación entre las columnas. Solo tenemos cuatro columnas numéricas en el marco de datos. El marco de datos de salida se puede representar junto con cualquier celda, la correlación entre una variable de fila y la variable de columna es el valor de la celda. Como se mencionó anteriormente, la correlación entre una variable y ella misma es 1. Por lo tanto, todos los valores de la diagonal son 1,00

Python3



# To find the correlation among
# the columns using pearson method
df.corr(method ='pearson')

Producción:

Ejemplo 2:

Use la función odd() para encontrar la correlación entre las columnas en el Dataframe usando el método ‘kendall’. El marco de datos de salida se puede representar junto con cualquier celda, la correlación entre una variable de fila y la variable de columna es el valor de la celda. Como se mencionó anteriormente, la correlación entre una variable y sí misma es 1. Por lo tanto, todos los valores de la diagonal son 1,00.

Python3



# importing pandas as pd
import pandas as pd
# Making data frame from the csv file
df = pd.read_csv("nba.csv")
# To find the correlation among
# the columns using kendall method
df.corr(method='kendall')

Producción:

Mis notas personales
flecha_caer_arriba

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *