Los pandas son como un pequeño almacén de datos de memoria que permite el procesamiento de datos. Internamente, utiliza numpy
, pero agrega algunas consultas convenientes y acceso a datos. Un uso muy común es importar y exportar archivos CSV desde y hacia Pandas Data Frame.
Instalación Pandas
paquete creando y ejecutando un nuevo código de celda:
!{sys.executable} -m pip install pandas
import pandas as pd
Las dos estructuras de datos principales de Pandas son Series y DataFrame.
UNA. Serie Es un conjunto unidimensional que también contiene un índice que sirve como etiqueta para cada elemento.
Crea filas a partir de una lista:
egeeks = ['Thomas','Rich','Craig','Dan','Ed'] ring_srs = pd.Series([12,8,10,8,13],index=egeeks, name='Ring Size') print("Series type:", type(ring_srs)) print("Series name:", ring_srs.name) print(f"Rich's ring size is {ring_srs['Rich']}") ring_srs
- Analizar salida
Crea capas a partir de un diccionario:
state_srs = pd.Series({"Thomas": "Indiana", "Rich": "Pennsylvania", "Craig": "North Rhine-Westphalia", "Dan": "New York", "Ed":"Indiana"}, name="State") print("Series name:", state_srs.name) print("Series type:", type(state_srs)) print(f"Thomas lives in {state_srs['Thomas']}") state_srs
- Analizar: la salida debe verse similar a la salida anterior de la matriz que creó a partir de una lista
UNA. Marco de datos matriz bidimensional con filas, columnas y etiquetas. Cada fila y columna individual de un marco de datos se compone de una sola fila.
Cree un nuevo DataFrame a partir de las dos capas creadas anteriormente:
egeeks_df = pd.concat([ring_srs, state_srs], axis=1) print(type(egeeks_df)) print(f"Rich lives in {egeeks_df.loc['Rich']['State']}") egeeks_df
- Analizar salida: DataFrame consta de un índice, 2 columnas y 5 conjuntos de datos. Los datos individuales se pueden encontrar buscando en el índice y el nombre de la columna.
- Ejecute y analice las celdas restantes en el cuaderno de la sección Pandas para explorar más atributos y capacidades de DataFrame.