Formation Data Science (R et Hadoop)

icon public

Public : Professionnels des bases de données, managers, analystes de données, data scientists et assistants à  maîtrise d'ouvrage. Cette formation est très utile pour les professionnels chargés de gérer les prévisions et les tendances

icon horloge

Durée : 5 jour(s)

Syllabus de la formation Data Science (R et Hadoop)

Pré-requis : Connaissances en matière de programmation et de statistiques sont utiles sans toutefois être obligatoires

Objectifs : - Appliquer des techniques d'exploration des données pour améliorer la prise de décisions métier à  partir de sources de données internes et externes - Prendre une longueur d'avance sur vos concurrents avec l'analyse des données structurées et non structurées - Prédire un résultat en utilisant des techniques d'apprentissage automatique supervisé

Sanction : Attestation de fin de formation mentionnant le résultat des acquis

Taux de retour à l’emploi : Aucune donnée disponible

Référence : BUS100294-F

Accessibilité : Si vous êtes en situation de handicap, nous sommes en mesure de vous accueillir, n'hésitez pas à nous contacter à referenthandicap@dawan.fr, nous étudierons ensemble vos besoins

Contact : commercial@dawan.fr

À partir de

1 075,00 € HT / jour

2 760,00 €HT

1 535,71 € HT

Pour 10 heures utilisables pendant 12 mois

3 450,00 € HT

Tarif plein:

  • Paiement à 60 jours
  • Report possible à J-3
  • 3 tickets d'assistance

2 760,00 € HT

Tarif remisé :

Contacter Dawan

Programme de Formation Data Science (R et Hadoop)

Exploration et analyse des données avec R

Charger, interroger et manipuler des données avec R
Nettoyer les données brutes avant la modélisation
Réduire les dimensions avec l'analyse en composantes principales (ACP)
Développer les fonctionnalités de R avec les packages définis par l'utilisateur

Faciliter la pensée analytique avec la visualisation des données

Explorer les caractéristiques d'un ensemble de données à travers la visualisation
Représenter graphiquement la distribution des données avec des boîtes à moustaches, des histogrammes et des diagrammes de densité
Identifier les valeurs hors normes

Explorer les données non structurées pour les applications métier

Traitement préliminaire et préparation des données non structurées pour une analyse plus approfondie
Décrire un ensemble de documents avec une matrice termes-documents

Difficultés supplémentaires liées au Big Data

Examiner les architectures de MapReduce et Hadoop
Intégrer R et Hadoop à RHadoop

Estimer les valeurs avec les règles de régression linéaire et logistique

Modéliser la relation entre une variable de sortie et plusieurs variables d'entrée
Interpréter correctement les coefficients des données continues et qualitatives

Techniques de régression pour manipuler le Big Data

Traiter les ensembles de données volumineux avec RHadoop
Créer des modules de régression pour RHadoop

Identification automatique de chaque nouvel élément de données

Utiliser des arbres de décision pour prédire les valeurs cible
Appliquer des règles de probabilité pour prédire les résultats avec le modèle Naive Bayes
Combiner les variables de prédiction des arbres et les forêts aléatoires dans RHadoop

Évaluer les performances des modèles

Visualiser les performances des modèles avec une courbe ROC
Évaluer les modèles de classification avec des matrices de confusion

Identifier des groupes encore inconnus dans un ensemble de données

Segmenter le marché client avec l'algorithme K-Means
Trouver des similarités avec les mesures des distances
Créer des clusters en forme d'arbres et des mises en cluster hiérarchiques
Mettre en cluster les tweets et les fichiers texte pour mieux les comprendre

Mettre à jour les connexions avec l'analyse des associations

Identifier les connexions importantes avec l'analyse des réseaux sociaux
Comprendre l'utilisation des résultats de l'analyse des réseaux sociaux à des fins marketing

Définir et évaluer des règles d'association

Identifier les préférences réelles des clients à partir d'un ensemble de données transactionnelles pour améliorer l'expérience utilisateur
Calculer les indices de support et de confiance et le lift pour différencier les bonnes règles des mauvaises

Pour suivre une session à distance depuis l'un de nos centres, contactez-nous.

Aucune date de programmée actuellement. Pour plus d'information sur les prochaines sessions, nous vous invitons à joindre le service commercial par téléphone au 09 72 37 73 73 (prix d'un appel local) ou depuis notre formulaire de contact.

Nos centres de formation

  • Bordeaux

    Nos locaux sont accessibles

    Bât Ravezies - 2e étage 250 avenue Emile Counord

    33300 Bordeaux

    Liaison directe de la gare Bordeaux Saint-Jean via le tram C

  • Distance

    32 Boulevard Vincent Gâche

    44000 Nantes

  • Lille

    Nos locaux sont accessibles

    46 rue des Canonniers - 2è étage

    59800 Lille

    Proche des deux gares

  • Lyon

    Nos locaux sont accessibles

    62 rue de Bonnel - 1er étage Ascenseur à droite de l'entrée

    69003 Lyon

  • Marseille

    Nos locaux sont accessibles

    38/40 rue de la République Escalier A, 1er étage

    13001 Marseille

    A proximité du vieux port

  • Montpellier

    Nos locaux sont accessibles

    26 Allée de Mycènes Le Thèbes, Bât. A, 3è étage

    34000 Montpellier

    Quartier Antigone

  • Nantes

    Nos locaux sont accessibles

    32 Boulevard Vincent Gâche 5 ème étage

    44200 Nantes

  • Nice

    Nos locaux sont accessibles

    455 promenade des Anglais Bât Arenice, 7è étage

    06200 Nice

  • Paris

    Nos locaux sont accessibles

    11 rue Antoine Bourdelle

    75015 Paris

    dans le 15e arrondissement

  • Rennes

    Nos locaux sont accessibles

    3 place du Général Giraud

    35000 Rennes

  • Strasbourg

    Nos locaux sont accessibles

    4 rue de Sarrelouis - 4è étage

    67000 Strasbourg

  • Toulouse

    Nos locaux sont accessibles

    1 place Occitane Bât. Le Sully - 4è étage

    31000 Toulouse

    Proche de Jean-Jaurès et du Capitole