Commandes utiles pour les librairies Pandas et Numpy

Commandes utiles pour les librairies Pandas et Numpy

Python 2018-11-28

Quelque commande utile à garder dans un coin de sa tête ou dans un coin du web :

import numpy as np
import pandas as pd

###########--NUMPY--#############
#je cree une liste numpy
listes = ([1,2,3,4,5],
          [1,20,30,40,50],
          [100,200,300,400,500])

listesNumpy = np.array(listes)

#je peux travailler sur l'ensemble
#exemple : je divise chaque data par deux
print(listesNumpy/2)

#pour trouver un element
#liste[elem,position]
print(listesNumpy[0,2])
#pour avoir tout les elem a une position
print(listesNumpy[:,2])

#calcul de somme
somme = listesNumpy[:,2]
print(somme.sum())

###########--PANDAS--#############
#je cree un dataframe
dataframe = pd.DataFrame(listesNumpy,index=['i1','i2','i3'],columns=['c1','c2','c3','c4','c5'])

#je peux voir la ligne que je veux
#avec iloc()
print(dataframe.iloc[2])
#ou loc()
print(dataframe.loc['i3'])

#je le parcour avec iterrows de pandas
for ligne in dataframe.iterrows():
    index_ligne = ligne[0]
    contenu_ligne = ligne[1]

#je peux filtrer ce que je veux
ligneFiltre = dataframe[dataframe["c1"]==1]
#ou ce que je ne veux pas
select = dataframe["c1"]==1
ligneEject = dataframe[~select]

#je peux assembler deux dataframe avec les meme nom de colonnes que le precedent dataframe
dataframeAjout = pd.DataFrame([[11,22,33,44,55],[111,222,333,444,555]], index=['i4','i5'], columns=dataframe.columns)
dataframeAll = dataframe.append(dataframeAjout)

#autres commandes utile
#avoir le nom des columns
name = dataframeAll.columns
#ajout d'une colonne
dataframeAll['c6'] = ['a','',2,'b','']
#avoir le nombre de ligne
print(len(dataframeAll))
#obtenir les valeurs distinctes sur une colonne
#dataframe.column.unique()
print(dataframeAll.c1.unique())
#importer un csv dans un dataframe
dataframe = pd.read_csv("file.csv", sep=";")