Saltar al contenido

Manual de aprendizaje automático para desarrolladores de SAP

Los pandas son como un pequeño almacén de datos de memoria que permite el procesamiento de datos. Internamente, utiliza numpy, pero agrega algunas consultas convenientes y acceso a datos. Un uso muy común es importar y exportar archivos CSV desde y hacia Pandas Data Frame.

Instalación Pandas paquete creando y ejecutando un nuevo código de celda:

!{sys.executable} -m pip install pandas
import pandas as pd

Las dos estructuras de datos principales de Pandas son Series y DataFrame.

UNA. Serie Es un conjunto unidimensional que también contiene un índice que sirve como etiqueta para cada elemento.

  1. Crea filas a partir de una lista:

    egeeks = ['Thomas','Rich','Craig','Dan','Ed']
    ring_srs = pd.Series([12,8,10,8,13],index=egeeks, name='Ring Size')
    print("Series type:", type(ring_srs))
    print("Series name:", ring_srs.name)
    print(f"Rich's ring size is {ring_srs['Rich']}")
    ring_srs
    
  2. Analizar salida
  1. Crea capas a partir de un diccionario:

    state_srs = pd.Series({"Thomas": "Indiana", "Rich": "Pennsylvania", "Craig": "North Rhine-Westphalia", "Dan": "New York", "Ed":"Indiana"}, name="State")
    print("Series name:", state_srs.name)
    print("Series type:", type(state_srs))
    print(f"Thomas lives in {state_srs['Thomas']}")
    state_srs
    
  2. Analizar: la salida debe verse similar a la salida anterior de la matriz que creó a partir de una lista

UNA. Marco de datos matriz bidimensional con filas, columnas y etiquetas. Cada fila y columna individual de un marco de datos se compone de una sola fila.

  1. Cree un nuevo DataFrame a partir de las dos capas creadas anteriormente:

    egeeks_df = pd.concat([ring_srs, state_srs], axis=1)
    print(type(egeeks_df))
    print(f"Rich lives in {egeeks_df.loc['Rich']['State']}")
    egeeks_df
    
  2. Analizar salida: DataFrame consta de un índice, 2 columnas y 5 conjuntos de datos. Los datos individuales se pueden encontrar buscando en el índice y el nombre de la columna.
    Salida de Pandas DataFrame
  3. Ejecute y analice las celdas restantes en el cuaderno de la sección Pandas para explorar más atributos y capacidades de DataFrame.

Hecho

Inicie sesión para responder la pregunta