Review4iu.com

El mejor Blog de noticias, descuentos, y reviews…!

SciPy primeros pasos

En nuestro anterior post SciPy, módulo para machine learning explicamos brevemente las funcionalidades de las distintas librerías de SciPy.

En esta entrada describimos los primeros pasos en SciPy para trabajar con nuestros datos.

Muchas veces, los datos que queremos analizar provienen de bases de datos en formato Excel o CSV. Una forma rápida de poder leer y trabajar con esos datos es utilizar la librería Pandas.

pandas

Para utilizar Pandas debemos haberla instalado previamente. Podemos utilizar cualquiera de los múltiples entornos de desarrollo disponibles para comenzar a trabajar con SciPy. Para nuevos usuarios sin mucho conocimiento de programación recomiendo un IDE sencillo, ligero y flexible como Geany. Para usuarios que necesiten un IDE potente y completo para análisis de datos recomiendo Spyder o Jupyter Notebook . Para usuarios que busquen un IDE que les permita desarrollar software recomiendo Pycharm, Atom o Visual Studio.

En nuestro ejemplo tenemos un archivo CSV “usuarios.csv” con información numérica.

Primero, cargamos la librería Pandas con:

import pandas as pd

En segundo lugar, cargamos nuestro archivo y lo asociamos a la variable datos con:

datos = pd.read_csv('usuarios.csv')

Una vez cargada la información, la librería Pandas nos permite obtener y visualizar información numérica relevante de nuestros datos de forma rápida.

Por ejemplo, podemos visualizar el encabezado de nuestro archivo con el comando:

print(datos.head())

Head

Donde en head() podemos definir el número de filas de datos que queremos visualizar, de forma que, si incluimos head(8), visualizaremos las 8 primeras filas.

Otro comando muy útil es describe(), con el que visualizaremos estadísticas relevantes de nuestro archivo, como percentiles, media, mediana… basta con teclear:

print(datos.describe())
Describe
Describe

Os hemos ofrecido tan solo una pequeña muestra del funcionamiento de Pandas para una primera visualización de nuestros datos numéricos, antes de empezar a utilizar otras librerías con algoritmos de análisis de datos o visualización gráfica. En nuestros próximos posts explicaremos los pasos a seguir.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *