a = 2


b = "Hello"


del a

a


if (2 > 1):
    print("C'est vrai")


if (2 > 3):
    print("C'est vrai")
else:
    print("c'est faux")


input()


valeur = int(input())
if valeur < 5:
    print(str(valeur) + " est plus petit que 5")
elif valeur <= 10:
    print(str(valeur) + " est compris entre 5 et 10")
else :
    print(str(valeur) + " est plus grand que 10")


def calcul_IMC(poids = 60, taille = 1.70):
    imc = poids / taille**2
    return(imc)


calcul_IMC(poids = float(input("Quel poids (en kg) ? ")) ,
           taille = float(input("Quelle taille (en metres) ? ")))


calcul_IMC(50,1.66)


calcul_IMC(taille = 1.66, poids = 50)


def calcul_IMC(poids = 60, taille = 1.70):
    imc = poids / taille**2
    return(imc)


calcul_IMC()


calcul_IMC(poids = 80)


nb = int(input())
for i in range(1,nb):
    un_poids = float(input("Quel poids (en kg) ? "))
    une_taille = float(input("Quelle taille (en metres) ? "))
    print(calcul_IMC(un_poids,une_taille))


nb = int(input())
i = 1
while i <= nb:
    un_poids = float(input("Quel poids (en kg) ? "))
    une_taille = float(input("Quelle taille (en metres) ? "))
    print(calcul_IMC(un_poids,une_taille))
    i=i+1


liste = [1,2,3,4]
liste

[1, 2, 3, 4]


liste.append(8)
liste

[1, 2, 3, 4, 8]


liste.extend([1,2,3])
liste

[1, 2, 3, 4, 8, 1, 2, 3]


len(liste)

8


liste[0]

1


liste[0:5]

[1, 2, 3, 4, 8]


import numpy


import numpy as np


np.linspace(start= 0 , stop = 1, num = 9)

array([0.   , 0.125, 0.25 , 0.375, 0.5  , 0.625, 0.75 , 0.875, 1.   ])


np.arange(start= 0 , stop = 1, step = 0.1)

array([0. , 0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9])


import pandas as pd


#Afficher la version de pandas
pd.__version__

'1.2.3'


df = pd.read_csv("../Dataset/Titanic.csv")


df.head(2)


df.drop(['Unnamed: 0'], axis=1, inplace=True)


df.shape

(1313, 6)


df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 1313 entries, 0 to 1312
Data columns (total 6 columns):
 #   Column    Non-Null Count  Dtype  
---  ------    --------------  -----  
 0   Name      1313 non-null   object 
 1   PClass    1313 non-null   object 
 2   Age       756 non-null    float64
 3   Sex       1313 non-null   object 
 4   Survived  1313 non-null   int64  
 5   SexCode   1313 non-null   int64  
dtypes: float64(1), int64(2), object(3)
memory usage: 61.7+ KB


df.dtypes

Name         object
PClass       object
Age         float64
Sex          object
Survived      int64
SexCode       int64
dtype: object


df.PClass

0       1st
1       1st
2       1st
3       1st
4       1st
       ... 
1308    3rd
1309    3rd
1310    3rd
1311    3rd
1312    3rd
Name: PClass, Length: 1313, dtype: object


df['PClass']

0       1st
1       1st
2       1st
3       1st
4       1st
       ... 
1308    3rd
1309    3rd
1310    3rd
1311    3rd
1312    3rd
Name: PClass, Length: 1313, dtype: object


type(df['PClass'])

pandas.core.series.Series


df[['Name','PClass']]


df[['PClass','Name']]


type(df[['PClass','Name']])

pandas.core.frame.DataFrame


#Afficher la première ligne
df.iloc[0]

Name        Allen, Miss Elisabeth Walton
PClass                               1st
Age                                 29.0
Sex                               female
Survived                               1
SexCode                                1
Name: 0, dtype: object


#Afficher la première colonne
df.iloc[:,0]

0                        Allen, Miss Elisabeth Walton
1                         Allison, Miss Helen Loraine
2                 Allison, Mr Hudson Joshua Creighton
3       Allison, Mrs Hudson JC (Bessie Waldo Daniels)
4                       Allison, Master Hudson Trevor
                            ...                      
1308                               Zakarian, Mr Artun
1309                           Zakarian, Mr Maprieder
1310                                 Zenni, Mr Philip
1311                                 Lievens, Mr Rene
1312                                   Zimmerman, Leo
Name: Name, Length: 1313, dtype: object


#Afficher les 3 premières lignes de la première colonne
df.iloc[:3,0]

0           Allen, Miss Elisabeth Walton
1            Allison, Miss Helen Loraine
2    Allison, Mr Hudson Joshua Creighton
Name: Name, dtype: object


#Afficher les 3 premières lignes
df.iloc[0:3,:]


#Afficher les 3 premières lignes
df.iloc[ [0,1,2,3] ,:]


#Afficher la dernière lignes
df.iloc[-1,:]

Name        Zimmerman, Leo
PClass                 3rd
Age                   29.0
Sex                   male
Survived                 0
SexCode                  0
Name: 1312, dtype: object


df.loc[:, ['PClass','Name']]


df.columns.difference(['Age','SexCode'])

Index(['Name', 'PClass', 'Sex', 'Survived'], dtype='object')


df[  df.columns.difference(['Age','SexCode'])  ].head(3)


df.columns

Index(['Name', 'PClass', 'Age', 'Sex', 'Survived', 'SexCode'], dtype='object')


df.columns.difference([''])

Index(['Age', 'Name', 'PClass', 'Sex', 'SexCode', 'Survived'], dtype='object')


#Tester une égalité
df.PClass == "1st"

0        True
1        True
2        True
3        True
4        True
        ...  
1308    False
1309    False
1310    False
1311    False
1312    False
Name: PClass, Length: 1313, dtype: bool


df[df.PClass == "1st"]


#Tester une différence
df.PClass != "3rd"

0        True
1        True
2        True
3        True
4        True
        ...  
1308    False
1309    False
1310    False
1311    False
1312    False
Name: PClass, Length: 1313, dtype: bool


df[df.PClass != "3rd"]


#Tester si supérieur
df.Age > 20

0        True
1       False
2        True
3        True
4       False
        ...  
1308     True
1309     True
1310     True
1311     True
1312     True
Name: Age, Length: 1313, dtype: bool


df[df.Age > 20]


#Tester si comris dans des bornes
(df.Age > 15) & (df.Age < 30)

0        True
1       False
2       False
3        True
4       False
        ...  
1308     True
1309     True
1310     True
1311     True
1312     True
Name: Age, Length: 1313, dtype: bool


df[(df.Age > 15) & (df.Age < 30)]


#Tester avec deux valeurs possibles 
(df.PClass == "1st") | (df.PClass == "2nd")

0        True
1        True
2        True
3        True
4        True
        ...  
1308    False
1309    False
1310    False
1311    False
1312    False
Name: PClass, Length: 1313, dtype: bool


df[(df.PClass == "1st") | (df.PClass == "2nd")]


#Tester si compris dans la liste
df.PClass.isin(['1st', '2nd'])

0        True
1        True
2        True
3        True
4        True
        ...  
1308    False
1309    False
1310    False
1311    False
1312    False
Name: PClass, Length: 1313, dtype: bool


df[df.PClass.isin(['1st', '2nd'])]


#Tester si n'est pas compris dans la liste
~ df.PClass.isin(['1st', '2nd'])

0       False
1       False
2       False
3       False
4       False
        ...  
1308     True
1309     True
1310     True
1311     True
1312     True
Name: PClass, Length: 1313, dtype: bool


~pd.Series([True,False,True,True])

0    False
1     True
2    False
3    False
dtype: bool


df[~ df.PClass.isin(['1st', '2nd'])]


df.Age.isna()

0       False
1       False
2       False
3       False
4       False
        ...  
1308    False
1309    False
1310    False
1311    False
1312    False
Name: Age, Length: 1313, dtype: bool


df[df.Age.isna()]


df.Age.notna()

0       True
1       True
2       True
3       True
4       True
        ... 
1308    True
1309    True
1310    True
1311    True
1312    True
Name: Age, Length: 1313, dtype: bool


df[df.Age.notna()]


#On trie la série Age
df.Age.sort_values()

763     0.17
751     0.33
544     0.80
616     0.83
358     0.83
        ... 
1300     NaN
1302     NaN
1305     NaN
1306     NaN
1307     NaN
Name: Age, Length: 1313, dtype: float64


#On trie la série Age par ordre décroissant
df.Age.sort_values(ascending=False)

505     71.0
119     71.0
9       71.0
72      70.0
73      69.0
        ... 
1300     NaN
1302     NaN
1305     NaN
1306     NaN
1307     NaN
Name: Age, Length: 1313, dtype: float64


# On trie le data frame
df.sort_values(by = 'Age', ascending=False)


# On trie le data frame avec selon plusieurs colonnes
df.sort_values(by = ['PClass','Age'], ascending=[True,False])


import numpy as np


df.Age.mean()

30.397989417989415


df.Age.median()

28.0


df.Age.max()

71.0


df.Age.std()

14.259048710359023


df.Age.var()

203.32047012439133


df.Age.quantile([.1, .5])

0.1    16.0
0.5    28.0
Name: Age, dtype: float64


df.Age.quantile(np.linspace(start = 0, stop = 1, num= 11))

0.0     0.17
0.1    16.00
0.2    20.00
0.3    22.00
0.4    25.00
0.5    28.00
0.6    32.00
0.7    36.00
0.8    43.00
0.9    50.00
1.0    71.00
Name: Age, dtype: float64


df.describe()


df.describe(include = "all")


df.describe(exclude=[np.number])


df.describe(include=[np.number])


df.describe(percentiles=np.linspace(start = 0, stop = 1, num= 11))


df.PClass.unique()

array(['1st', '2nd', '3rd'], dtype=object)


df.PClass.nunique()

3


df.nunique()

Name        1310
PClass         3
Age           75
Sex            2
Survived       2
SexCode        2
dtype: int64


df.PClass.value_counts()

3rd    711
1st    322
2nd    280
Name: PClass, dtype: int64


#en pourcentage
df.PClass.value_counts(normalize=True)

3rd    0.541508
1st    0.245240
2nd    0.213252
Name: PClass, dtype: float64


pd.crosstab(df.PClass, df.Sex, margins=True)


#pourcentage total général
pd.crosstab(df.PClass, df.Sex, margins=True, normalize = True)


#pourcentage colonne
pd.crosstab(df.PClass, df.Sex).apply(lambda x: x/x.sum(), axis=0)


#pourcentage ligne
pd.crosstab(df.PClass, df.Sex).apply(lambda x: x/x.sum(), axis=1)


df.groupby(['PClass']).Age.agg([min, max])


df.groupby(['PClass','Sex']).Age.agg([min, max])


df_agg = df.groupby(['PClass','Sex']).agg( { 'Age' : ['min','max'] , 'PClass' : 'count'  })
df_agg


df_agg.columns = ['_'.join(col) for col in df_agg.columns]
df_agg


df.groupby(['PClass','Sex']).Age.agg([min, max]).reset_index()


df.dtypes

Name         object
PClass       object
Age         float64
Sex          object
Survived      int64
SexCode       int64
dtype: object


df.Survived = df.Survived.astype('str')
df.dtypes

Name         object
PClass       object
Age         float64
Sex          object
Survived     object
SexCode       int64
dtype: object


df.Survived = df.Survived.astype('int')
df.dtypes

Name         object
PClass       object
Age         float64
Sex          object
Survived      int64
SexCode       int64
dtype: object


df.columns

Index(['Name', 'PClass', 'Age', 'Sex', 'Survived', 'SexCode'], dtype='object')


df.rename(columns={'PClass': 'Classe passager',
                  'Age': 'Age passager'}, inplace=True)


df.columns

Index(['Name', 'Classe passager', 'Age passager', 'Sex', 'Survived',
       'SexCode'],
      dtype='object')


df.columns = df.columns.str.replace(' ', '_')
df.columns

Index(['Name', 'Classe_passager', 'Age_passager', 'Sex', 'Survived',
       'SexCode'],
      dtype='object')


df.rename(columns={'Classe_passager': 'PClass',
                  'Age_passager': 'Age'}, inplace=True)


df.rename(columns={'Age_passager': 'Age'}, inplace=True)


df.Age.isna().value_counts()

False    756
True     557
Name: Age, dtype: int64


df.Age.describe()

count    756.000000
mean      30.397989
std       14.259049
min        0.170000
25%       21.000000
50%       28.000000
75%       39.000000
max       71.000000
Name: Age, dtype: float64


df['Age_fillna_0'] = df.Age.fillna(0)


df.Age_fillna_0.isna().value_counts()

False    1313
Name: Age_fillna_0, dtype: int64


df.Age_fillna_0.describe()

count    1313.000000
mean       17.502574
std        18.516945
min         0.000000
25%         0.000000
50%        18.000000
75%        30.000000
max        71.000000
Name: Age_fillna_0, dtype: float64


#calcul de la moyenne
mean = df.Age.mean()


df['Age_fillna_mean'] = df.Age.fillna(mean)


df.Age_fillna_mean.describe()

count    1313.000000
mean       30.397989
std        10.816758
min         0.170000
25%        26.000000
50%        30.397989
75%        30.397989
max        71.000000
Name: Age_fillna_mean, dtype: float64


df[df.Age.isna()].iloc[:,[2,6,7]]


df.drop(columns=['Age_fillna_0', 'Age_fillna_mean'], inplace=True)


df.dropna(axis=0, how="all").shape

(1313, 6)


df.dropna(axis=0, how="any").shape

(756, 6)


#avant le dropna()
df.shape

(1313, 6)


df.dropna(axis=0, how="any", inplace=True)


#après le dropna()
df.shape

(756, 6)


d = {'x': [5, 10, np.nan, 20], 'y': [np.nan,4,6,9]}
X = pd.DataFrame(d)
X


from sklearn.impute import KNNImputer
imputer = KNNImputer(n_neighbors=2, weights="distance")
X = pd.DataFrame(imputer.fit_transform(X), columns = X.columns)
X


df_counts_name = df.Name.value_counts()
df_counts_name

Connolly, Miss Kate                     2
Carlsson, Mr Frans Olof                 2
Kelly, Mr James                         2
Ryerson, Miss Susan (Suzette) Parker    1
Kenyon, Mr Frederick R                  1
                                       ..
Bishop, Mr Dickinson H                  1
Andersson, Miss Ingeborg Constancia     1
Walker, Mr William Anderson             1
Brown, Miss Mildred                     1
Badt, Mr Mohamed                        1
Name: Name, Length: 753, dtype: int64


doublons = df_counts_name[ df_counts_name > 1].index
print(doublons)

Index(['Connolly, Miss Kate', 'Carlsson, Mr Frans Olof', 'Kelly, Mr James'], dtype='object')


df_doublons = df[df.Name.isin(doublons)]
df_doublons


df_doublons.drop_duplicates(subset=['Name'])


df_doublons


df_doublons.drop_duplicates(subset=['Name',"PClass"])


df_doublons.groupby('Name').nth(0)


df_doublons.groupby('Name').tail(1)


pd.cut(df.Age, bins = [0,18,40,150])

0       (18, 40]
1        (0, 18]
2       (18, 40]
3       (18, 40]
4        (0, 18]
          ...   
1308    (18, 40]
1309    (18, 40]
1310    (18, 40]
1311    (18, 40]
1312    (18, 40]
Name: Age, Length: 756, dtype: category
Categories (3, interval[int64]): [(0, 18] < (18, 40] < (40, 150]]


pd.cut(df.Age, bins = [0,18,40,150], include_lowest=True)

0         (18.0, 40.0]
1       (-0.001, 18.0]
2         (18.0, 40.0]
3         (18.0, 40.0]
4       (-0.001, 18.0]
             ...      
1308      (18.0, 40.0]
1309      (18.0, 40.0]
1310      (18.0, 40.0]
1311      (18.0, 40.0]
1312      (18.0, 40.0]
Name: Age, Length: 756, dtype: category
Categories (3, interval[float64]): [(-0.001, 18.0] < (18.0, 40.0] < (40.0, 150.0]]


df['Age_cut'] = pd.cut(df.Age, bins = [0,18,40,150],
                       labels=['moins de 18','entre 19 et 40','plus de 40'],
                       include_lowest=True)


df['Age_cut'].value_counts().sort_index()

moins de 18       126
entre 19 et 40    456
plus de 40        174
Name: Age_cut, dtype: int64


df['PClass_category'] = np.where(df['PClass'] == '1st', '1st', '2nd and 3rd')
df['PClass_category'].value_counts()

2nd and 3rd    530
1st            226
Name: PClass_category, dtype: int64


pd.get_dummies(df, columns=['PClass','Sex']).head(3)


df = pd.get_dummies(df, columns=['PClass','Sex'], drop_first=True)
df.head(3)


#df.to_csv("mon_Titanic.csv", index = False)


# df.to_excel(excel_writer = "Titanic.xlsx" , 
#             sheet_name = "Feuil1", index=False)


#Creation des Séries   
ls_prenom = pd.Series(["Wilfried", "Alex", "Morgane", "Etienne", "Célia", "Baptiste", "Anthony", "Fred"])
ls_bi = pd.Series([15,9,12,15,6,14,11,19])
ls_dataviz = pd.Series([14,7,15,13,15,10,12,14])

print(ls_prenom)

0    Wilfried
1        Alex
2     Morgane
3     Etienne
4       Célia
5    Baptiste
6     Anthony
7        Fred
dtype: object


d = {'Prenom': ls_prenom, 'BI': ls_bi, 'Dataviz' : ls_dataviz, 'Maths' : [5,20,11,13,5,14,12,16]}
df = pd.DataFrame(data=d)
df


#gerer le nombre de ligne à afficher
pd.set_option("display.min_rows", 2)


#gérer le nombre de colonne à afficher
pd.set_option("display.max_columns", 4)


#gérer la largeur des colonnes
pd.set_option('max_colwidth', 5)

df


pd.reset_option(("^display"))

df


#conda install -c conda-forge pandas-profiling


# import pandas_profiling


# profile = pandas_profiling.ProfileReport(df, title='Pandas Profiling Report', explorative=True)


# profile

Rappels du langage Python🐍¶

Les bases de la programmation¶

Variables¶

Structure conditionnelle¶

Construire une fonction¶

Boucles¶

FOR¶

WHILE¶

Liste¶

Librairies¶

Numpy¶

L'essentiel de 🐼¶

Importer la librairie pandas¶

Importer un jeu de données¶

Manipuler un jeu de données¶

Interroger le data frame avec le nom des colonnes¶

Interroger le data frame avec les indices lignes/colonnes¶

Interroger le data frame avec des filtres¶

Trier un jeu de données¶

Exploration statistique sur un jeu de données¶

Indicateurs statistiques¶

Grouper les données¶

Tableaux croisés¶

Agrégation¶

Modifier un jeu de données¶

Changement de type des variables¶

Renommer des colonnes¶

Gerer les valeurs manquantes¶

Remplacer avec fillna()¶

Supprimer avec dropna()¶

Remplacer avec KNNImputer()¶

Gérer les doublons¶

Créer de nouvelle variables¶

Discrétisation¶

Recodage de variables¶

Exporter le jeu de données¶

Créer un objet pandas¶

Les options pandas¶

Pandas Profiling¶

	Unnamed: 0	Name	PClass	Age	Sex	Survived	SexCode
0	1	Allen, Miss Elisabeth Walton	1st	29.0	female	1	1
1	2	Allison, Miss Helen Loraine	1st	2.0	female	0	1

	Name	PClass
0	Allen, Miss Elisabeth Walton	1st
1	Allison, Miss Helen Loraine	1st
2	Allison, Mr Hudson Joshua Creighton	1st
3	Allison, Mrs Hudson JC (Bessie Waldo Daniels)	1st
4	Allison, Master Hudson Trevor	1st
...	...	...
1308	Zakarian, Mr Artun	3rd
1309	Zakarian, Mr Maprieder	3rd
1310	Zenni, Mr Philip	3rd
1311	Lievens, Mr Rene	3rd
1312	Zimmerman, Leo	3rd

	Name	PClass	Age	Sex	Survived	SexCode
0	Allen, Miss Elisabeth Walton	1st	29.00	female	1	1
1	Allison, Miss Helen Loraine	1st	2.00	female	0	1
2	Allison, Mr Hudson Joshua Creighton	1st	30.00	male	0	0
3	Allison, Mrs Hudson JC (Bessie Waldo Daniels)	1st	25.00	female	0	1
4	Allison, Master Hudson Trevor	1st	0.92	male	1	0
...	...	...	...	...	...	...
317	Robbins, Mr Victor	1st	NaN	male	0	0
318	Segesser, Mlle Emma	1st	NaN	female	1	1
319	Seredeca, Ms	1st	NaN	female	0	1
320	Ward, Ms Anna	1st	NaN	female	0	1
321	Wilson, Ms Helen	1st	NaN	female	1	1

	Name	PClass	Age	Sex	Survived	SexCode
602	Abbing, Mr Anthony	3rd	42.0	male	0	0
603	Abbott, Master Eugene Joseph	3rd	13.0	male	0	0
604	Abbott, Mr Rossmore Edward	3rd	16.0	male	0	0
605	Abbott, Mrs Stanton (Rosa)	3rd	35.0	female	1	1
606	Abelseth, Miss Anna Karen	3rd	16.0	female	1	1
...	...	...	...	...	...	...
1308	Zakarian, Mr Artun	3rd	27.0	male	0	0
1309	Zakarian, Mr Maprieder	3rd	26.0	male	0	0
1310	Zenni, Mr Philip	3rd	22.0	male	0	0
1311	Lievens, Mr Rene	3rd	24.0	male	0	0
1312	Zimmerman, Leo	3rd	29.0	male	0	0

	Name	PClass	Age	Sex	Survived	SexCode
12	Aubert, Mrs Leontine Pauline	1st	NaN	female	1	1
13	Barkworth, Mr Algernon H	1st	NaN	male	1	0
14	Baumann, Mr John D	1st	NaN	male	0	0
29	Borebank, Mr John James	1st	NaN	male	0	0
32	Bradley, Mr George	1st	NaN	male	1	0
...	...	...	...	...	...	...
1300	Wiseman, Mr Phillippe	3rd	NaN	male	0	0
1302	Yalsevac, Mr Ivan	3rd	NaN	male	1	0
1305	Youssef, Mr Gerios	3rd	NaN	male	0	0
1306	Zabour, Miss Hileni	3rd	NaN	female	0	1
1307	Zabour, Miss Tamini	3rd	NaN	female	0	1

	Name	PClass	Age	Sex	Survived	SexCode
505	Mitchell, Mr Henry Michael	2nd	71.0	male	0	0
119	Goldschmidt, Mr George B	1st	71.0	male	0	0
9	Artagaveytia, Mr Ramon	1st	71.0	male	0	0
72	Crosby, Captain Edward Gifford	1st	70.0	male	0	0
73	Crosby, Mrs Edward Gifford (Catherine Elizabet...	1st	69.0	female	1	1
...	...	...	...	...	...	...
1300	Wiseman, Mr Phillippe	3rd	NaN	male	0	0
1302	Yalsevac, Mr Ivan	3rd	NaN	male	1	0
1305	Youssef, Mr Gerios	3rd	NaN	male	0	0
1306	Zabour, Miss Hileni	3rd	NaN	female	0	1
1307	Zabour, Miss Tamini	3rd	NaN	female	0	1

	Age	Survived	SexCode
count	756.000000	1313.000000	1313.000000
mean	30.397989	0.342727	0.351866
std	14.259049	0.474802	0.477734
min	0.170000	0.000000	0.000000
25%	21.000000	0.000000	0.000000
50%	28.000000	0.000000	0.000000
75%	39.000000	1.000000	1.000000
max	71.000000	1.000000	1.000000

	Name	PClass	Age	Sex	Survived	SexCode
count	1313	1313	756.000000	1313	1313.000000	1313.000000
unique	1310	3	NaN	2	NaN	NaN
top	Carlsson, Mr Frans Olof	3rd	NaN	male	NaN	NaN
freq	2	711	NaN	851	NaN	NaN
mean	NaN	NaN	30.397989	NaN	0.342727	0.351866
std	NaN	NaN	14.259049	NaN	0.474802	0.477734
min	NaN	NaN	0.170000	NaN	0.000000	0.000000
25%	NaN	NaN	21.000000	NaN	0.000000	0.000000
50%	NaN	NaN	28.000000	NaN	0.000000	0.000000
75%	NaN	NaN	39.000000	NaN	1.000000	1.000000
max	NaN	NaN	71.000000	NaN	1.000000	1.000000

Sex	female	male	All
PClass
1st	0.108911	0.136329	0.245240
2nd	0.081493	0.131759	0.213252
3rd	0.161462	0.380046	0.541508
All	0.351866	0.648134	1.000000

Sex	female	male
PClass
1st	0.309524	0.210341
2nd	0.231602	0.203290
3rd	0.458874	0.586369

	x	y
0	5.0	NaN
1	10.0	4.0
2	NaN	6.0
3	20.0	9.0

	x	y
0	5.0	5.25
1	10.0	4.00
2	14.0	6.00
3	20.0	9.00

Sex	female	male
PClass
1st	0.444099	0.555901
2nd	0.382143	0.617857
3rd	0.298172	0.701828

	Name	PClass	Age	Sex	Survived	SexCode
44	Carlsson, Mr Frans Olof	1st	33.0	male	0	0
707	Carlsson, Mr Frans Olof	3rd	33.0	male	0	0
728	Connolly, Miss Kate	3rd	30.0	female	0	1
729	Connolly, Miss Kate	3rd	22.0	female	1	1
921	Kelly, Mr James	3rd	44.0	male	0	0
922	Kelly, Mr James	3rd	42.0	male	0	0

	Name	Age	Survived	SexCode	Age_cut	PClass_category	PClass_1st	Sex_female	Sex_male
0	Allen, Miss Elisabeth Walton	29.0	1	1	entre 19 et 40	1st	1	1	0
1	Allison, Miss Helen Loraine	2.0	0	1	moins de 18	1st	1	1	0
2	Allison, Mr Hudson Joshua Creighton	30.0	0	0	entre 19 et 40	1st	1	0	1

	Prenom	BI	Dataviz	Maths
0	Wilfried	15	14	5
1	Alex	9	7	20
2	Morgane	12	15	11
3	Etienne	15	13	13
4	Célia	6	15	5
5	Baptiste	14	10	14
6	Anthony	11	12	12
7	Fred	19	14	16

	Prenom	BI	Dataviz	Maths
0	W...	15	14	5
1	Alex	9	7	20
2	M...	12	15	11
3	E...	15	13	13
4	C...	6	15	5
5	B...	14	10	14
6	A...	11	12	12
7	Fred	19	14	16