Détails de l'événement.

PREREQUIS 

Avoir une bonne logique de programmation et des bonnes notions de bases de données mais également de bonnes bases de statistiques voire de data mining.

OBJECTIFS

L'objectif de cette formation est de permettre d'apprendre les bases de Python.

La préparation des données avec pandas, la lecture et l'écriture des données depuis et vers différentes source.

Mais aussi d'apprendre et de faire de nombreux exercices sur l’analyse discriminante, la régression logistique et les arbres de décision.

Ainsi qu'une introduction à l’utilisation de Spark avec Python (pyspark)

PROGRAMME

Les bases de Python

  • Organisation d’un programme
  • Types de données simples et complexes, List

Compréhension

  • Structures de contrôle
  • Gestion des fichiers
  • Principaux modules et fonctions

Préparation des données avec pandas

  • Lecture et écriture des données depuis et vers différentes sources (fichiers textes, Excel, bases de données, etc.)
  • Filtrage, sélection, transformation, calcul, agrégation, jointure, sorties simples

La visualisation de données avec matplotlib & seaborn

Revue des différents types de graphiques

Apprentissage et analyse statistique avec scikit-learn & statsmodels

  • Revue des techniques :- L’analyse discriminante- La régression logistique- Les arbres de décision
  • Gestion des ensembles d’apprentissage et de test
  • Évaluation des modèles
  • Introduction à l’utilisation de Spark avec Python (pyspark)

DUREE

3 journées (9h-17h)

LIEN INSCRIPTION

*Inscription obligatoire

Un évènement organisé par Numeria, structure issue des Centres de Compétences, Technifutur®, Technobel, Technocité et Technofutur TIC, en collaboration avec Digitalwallonia4.ai