DATA SCIENCE BACKGROUND

Un cocktail de statistiques, d’informatique et un soupçon de geek attitude

Formations et cursus initial

 » L’avenir n’appartient pas à ceux qui savent… mais à ceux qui continuent d’apprendre « 

Eric Décosterd

DATA SCIENCE

Data Essentials - JEDHA Bootcamp - mai 2021
100%
Data Science Essentials
Construction de modèles de machine learning et évaluation pour la réalisation de prédictions.

Data Analysis et Business Intelligence avec l’utilisation d’outils de Data Visualisation comme Tableau pour l’analyse de bases de données et la restitution de résultats de manière synthétique et pertinente.

Manipulation de bases de données sous MySQL, Postgresql, SQL Servers via une pratique en profondeur des différents types de requêtes SQL ( sous-requêtes, jointures, fonction d’agrégation,…)

Fondamentaux de la statistique et analyses descriptives poussées. Programmation Python et utilisation de ses librairies principales Pandas, Numpy, Seaborn et Matplotlib.

Construction des A/B Tests en Python. Construction et comparaison d’échantillons représentatifs pour des travaux d’optimisation de contenus web.

Restitution finale d’un projet mené de A à Z devant combiner l’ensemble des compétences acquises lors de la formation.

PROGRAMMATION PYTHON

Apprendre à coder avec Python - FUN MOOC
20%
Python

Programmation dans les environnements Python 3 et PyCharm. Utilisation des outils UpyLaB et Python Tutor

  • Valeurs et expressions arithmétiques et textuelles
  • Les variables
  • La console et les scripts
  • Quelques fonctions prédéfinies
  • les modules math et turtle
  • L’instruction conditionnelle if
  • Les instructions répétitives while et for
  • L’instruction pass
  • les fonctions prédéfinies et définies
  • Règles de bonnes pratiques
  • Manipulations de base des séquences
  • Slicing et opérations de manipulation des séquences
  • Compréhension et copies de listes
  • Les fichiers textes et les matrices
  • Manipulations de base des séquences ensembles et dictionnaires
  • Méthodes de manipulation des dictionnaires
  • Dictionnaires persistants

PROGRAMMATION R

Datacamp - (en continue)
Formations ponctuelles en e-learning
Programmation R
  • Inputs, Outputs, and Layouts
  • Reactive Programming
  • Build Shiny Apps
  • Dashboard structure overview
  • Create Header, Sidebar and Body
  • Message menus
  • Notification menus
  • Tab boxes

Conditionals and Control Flow :

  • Operators (relational, logical)
  • Compare vectors
  • Compare marices
  • Conditionals Statements
  • Customize further
  • Vectors
  • Matrices
  • Factors
  • Data frames
  • Lists

MASTER MASS - STATISTIQUE APPLIQUÉE

Mathématique appliquée et Science Sociale - Rennes 2
2 ans 100%
Master Statistique appliquée
  • Régression linéaire
  • Analyse de variance
  • Statistique inférentielle
  • Analyse des données
  • Discrimination
  • Séries temporelles
  • Classification
  • Régression logistique
  • Scoring
  • Modèles linéaires en grande dimension
  • Statistique bayésienne
  • Logiciel R
  • Logiciel SAS
  • Logiciels statistiques avancés
  • Visualisation des données
  • Base de données
  • Économétrie
  • Modélisation économique
  • Marketing
  • Sociologie appliquée
  • Data Mining
  • Bases de données avancées
  • Programmation Web
  • Finance
  • Anglais
  • Droit
  • Comptabilité

Inserm u1061 Montpellier

Évolution des trajectoires de dépression chez les personnes âgées
Modélisation mixte à classes latentes, comparaison méthodologique de la procédure TRAJ de SAS et du package LCMM de R.
Effets de la consommation de benzodiazépines
Modélisation logistique mixte, automatisation de la procédure NLMIXED.

LICENCE PRO SIS - STATISTIQUE INFORMATIQUE

Licence Professionnelle Statistique et Informatique pour la Santé - IUT Vannes
1 an 100%
Licence SIS
  • Régression logistique
  • Analyse des données
  • Data-mining
  • Analyse de la survie
  • Statistiques pour la recherche clinique
  • Logiciel SAS
  • Logiciel R
  • Business Object (BO)
  • Data-management
  • Systèmes de Gestion de Bases de Données (SGBD)
  • Systèmes d’informations
  • Nomenclatures
  • Les diffèrents types d’établissement de soin
  • Tableaux de bord
  • Indicateurs
  • Qualité du service rendu
  • Essais cliniques et bonnes pratiques
  • Réglementation
  • Les différentes phases de la recherche clinique
  • Intervenants et rôles
  • Mesure de risque et d’association
  • Études transversales, cas-témoins, cohortes
  • Protocoles
  • Méthodes de standardisation
  • Lecture critique d’articles
  • Le système de santé en France
  • Les différents acteurs
  • L’ assurance maladie
  • Conduite de projet
  • Qualité des données
  • Projet en entreprise
  • Communication
  • Expression
  • Anglais technique
  • Veille documentaire

TcLand Expression Nantes

Étude de la tolérance aux variabilités techniques et biologiques d’un prédicteur basé sur l’expression de gènes

Synthèse bibliographique de publications scientifiques.
Techniques de détections de valeurs aberrantes, Modélisation non-paramétrique.

LICENCE 2 MIASHS -
MATHS-INFORMATIQUE

Mathématiques et Informatique appliquées aux Sciences Sociales - Rennes 2
2 ans 100%
Master Statistique appliquée
  • Analyse
  • Méthodologie mathématiques
  • Algèbre
  • Probabilité
  • Statistiques descriptives
  • Statistiques inférentielles
  • Programmation
  • Structures de données
  • Conception de BDD relationnelles
  • Optimisation
  • Histoire de la pensée économique
  • Micro-économie
  • Macro-économie
  • Statistiques et économie appliquée
  • Introduction au Droit
  • Droit du travail
  • Sociologie
  • Psychologie (option)
  • Management de l’entreprise
  • Stratégie d’entrepreneur

LA NON-RÉPONSE DANS LES ENQUÊTES

Correction de la non-réponse dans les enquêtes - ENSAE-ENSAI
2 jours 100%
La non-réponse dans les enquêtes
  • La non-réponse totale
  • Mécanisme de réponse ignorable
  • Modèles d’estimation de la probabilité de réponse
  • Calcul d’erreur en présence de non-réponse totale
  • Techniques de calage
  • Macro Calmar2
  • Traitement de la non-réponse non-ignorable
  • Les principales méthodes d’imputations (moyenne, ratio, régression, hot-deck, plus proche voisin,…)
  • Conséquences sur l’estimation des paramètres de dispersion ou d’association
  • Calculs d’erreur avec un aléa d’échantillonnage en population finie
  • Calculs d’erreur avec une variable d’intérêt modélisée

 

VOXCO CATI - GESTION CAMPAGNE D’ENQUÊTES

Gestion d'une campagne d'enquêtes téléphoniques - VOXCO
2 jours 100%
Gestion campagne d'enquêtes
  • Création du guide d’enquêtes
  • Implémentation du CATI
  • Optimisation du temps de réponse

 

  • Configuration des utilisateurs
  • Gestion des droits
  • Mode superviseur
  • Rapports de productivité
  • Règles de rappels
  • Gestion des quotas

OBSERVATOIRES LOCAUX

Repérer et analyser un marché local de l'habitat - Ecole des Ponts
2,5 jours 100%
Montage d'un observatoire
  • Construction
  • Objectifs
  • Modes de fonctionnement et de production
  • Diffusion de l’information
  • Implication des partenaires
  • Les principes de construction et de gestion d’un observatoire
  • Le « noyau dur » des indicateurs de l’observatoire
  • Des indicateurs aux sources d’information
  • Les enjeux spécifiques au parc privé

Les déterminants de la demande en logement :

  • Dynamiques et structures démographiques
  • Structures et comportements des ménages

Les déterminants de l’offre en logement :

  • Parc existant et production neuve
  • Mobilité résidentielle

Équilibres et déséquilibres des marchés locaux :

  • La notion de tension des marchés
  • Les indicateurs essentiels

Besoins en logement et régulation des marchés

UTILISATIONS DES FICHIERS FONCIERS

Formation à l'utilisation des Fichiers fonciers - CEREMA
3 jours 100%
Fichiers Fonciers
  • Cours en SQL
  • Lien avec QGis
  • Cas d’usages concrets
  • Exercices avancés
  • De MAJIC aux fichiers fonciers
  • Principes de retraitement
  • Accès et accompagnement
  • Notions thématiques
  • Des notions fiscales aux usages concrets
  • Usages classiques des Fichiers fonciers