PANDAS "LIBRERÍA"

 LIBRERÍA PANDAS 

¿Que es pandas? 


Pandas es una librería de Python que proporciona diversas funciones como la estructura de datos para que nos permita trabajar de forma fácil y rápido con los datos, recordemos que definimos los datos como representaciones de hechos pasados y a su vez esto es muy valioso en el campo de la informática, regresando a pandas el manejo de datos se realiza con tres estructuras de datos diferentes:

Series: Estructura de una dimensión.

Tablas: Estructura de dos dimensiones

Panel: Estructura de tres dimensiones

Además, tiene el objetivo más amplio de convertirse en la herramienta de manipulación y análisis de datos de código abierto más potente y flexible.

Si deseas instalar esta librería para Python puede entrar a su página oficial que dejare a continuación:

https://pandas.pydata.org/

En resumen y de forma práctica, pandas es una librería de Python que nos permite manejo y estructura de datos.  



Ventajas de la líbreria: 

Una de las ventajas que tiene la librería panda seria su facilidad del manejo de datos, además admite una variedad de formatos de archivos como en formato Excel, CSV y entre otras, esto es esencial a que facilita la importación y exportación de datos.  

Es eficiente en su rendimiento, esto debido a que está muy optimizado y especializado en datos de gran escala.  

La librería panda es muy flexible, además de proporcionar las tres estructuras de datos que mencionamos anteriormente se integra muy bien a otras bibliotecas dando pocas fallas, esto permite un análisis de datos más completo y avanzado.

Permite realizar fácilmente operaciones de agrupamiento y agregación de datos, simplificando el análisis de datos. Pues cabe destacar que se puede realizar diversas operaciones con la Dataframe, desde filtrar hasta unir tablas u otras estructuras. 


Ejemplo y uso de la librería pandas: 

Para este caso creare un Dataframe y filtrare la tabla con los datos que requiero, esto paso a paso para que se pueda comprender con facilidad en el manejo de tablas, que es el caso que escogí. Ojo usare google colab para más facilidad al momento de usar los codigos e instalar pandas.

Primero que nada, importaremos la librería pandas con el siguiente código.Ojo las palabras que al iniciar tienen un numeral (#) y están en verde no son necesarias escribirlas ya que solo es un comentario, pero te puede servir de guía.

En el ejemplo tendremos dos Dataframes con el nombre "datos1" y "datos2",  lo que haremos es fusionar esas dos tablas y luego filtrar ya que solo queremos los de la especialidad "I1" 

import pandas as pd

# Datos Nombre, Apellido, Especialidad, Ciclo  
datos1 = {
    'Nombre': ['Juan', 'María', 'Carlos', 'Celia', 'Carlos', 'Mario'],
    'Apellido': ['Begazo', 'Alegre', 'Alcantara', 'Vasquez', 'Antaurco', 'Fisfalen'],
    'Especialidad': ["I2","I1","I2","I1","I2","I1"],
    'Ciclo': ["2do", "3ro", "5to", "4to", "9no", "10mo"]
}

# Crear un DataFrame con pandas
uni1 = pd.DataFrame(datos1)


# Datos Nombre, Apellido, Especialidad, Ciclo  
datos2 = {
    'Nombre': ['Juan', 'María', 'Carlos', 'Celia', 'Carlos', 'Mario'],
    'Edad': ['20', '19', '50', '43', '67', '53'],
    'Nota': [12,15,16,13,19,20],
    'Tipo de ingreso': ["M1", "M2", "M2", "M1", "M1", "M1"]
}

# Crear un DataFrame con pandas
uni2 = pd.DataFrame(datos2)

uni2.head(10)

#Ahora el problema es fusionar estas dos tablas y obtener solo los alumnos "I1"

unir = pd.merge(uni1,uni2,how="left")

#Ahora solo necesitamos filtrar

filtro = unir[unir['Especialidad'] == 'I1']
filtro.head(10)

El resultado es el siguiente: 




Comentarios

INTRODUCCIÓN A LA COMPUTACIÓN

CLASE II

CONEXIÓN A BASE DE DATOS