Pré-requis : Connaissances en matière de programmation et de statistiques sont utiles sans toutefois être obligatoires
Objectifs : - Appliquer des techniques d'exploration des données pour améliorer la prise de décisions métier à partir de sources de données internes et externes - Prendre une longueur d'avance sur vos concurrents avec l'analyse des données structurées et non structurées - Prédire un résultat en utilisant des techniques d'apprentissage automatique supervisé
Sanction : Attestation de fin de formation mentionnant le résultat des acquis
Taux de retour à l’emploi : Aucune donnée disponible
Référence : BUS100294-F
Accessibilité : Si vous êtes en situation de handicap, nous sommes en mesure de vous accueillir, n'hésitez pas à nous contacter à referenthandicap@dawan.fr, nous étudierons ensemble vos besoins
Contact : commercial@dawan.fr
3 450,00 € HT
Charger, interroger et manipuler des données avec R
Nettoyer les données brutes avant la modélisation
Réduire les dimensions avec l'analyse en composantes principales (ACP)
Développer les fonctionnalités de R avec les packages définis par l'utilisateur
Explorer les caractéristiques d'un ensemble de données à travers la visualisation
Représenter
graphiquement la distribution des données avec des boîtes à moustaches,
des histogrammes et des diagrammes de densité
Identifier les valeurs hors normes
Traitement préliminaire et préparation des données non structurées pour une analyse plus approfondie
Décrire un ensemble de documents avec une matrice termes-documents
Examiner les architectures de MapReduce et Hadoop
Intégrer R et Hadoop à RHadoop
Modéliser la relation entre une variable de sortie et plusieurs variables d'entrée
Interpréter correctement les coefficients des données continues et qualitatives
Traiter les ensembles de données volumineux avec RHadoop
Créer des modules de régression pour RHadoop
Utiliser des arbres de décision pour prédire les valeurs cible
Appliquer des règles de probabilité pour prédire les résultats avec le modèle Naive Bayes
Combiner les variables de prédiction des arbres et les forêts aléatoires dans RHadoop
Visualiser les performances des modèles avec une courbe ROC
Évaluer les modèles de classification avec des matrices de confusion
Segmenter le marché client avec l'algorithme K-Means
Trouver des similarités avec les mesures des distances
Créer des clusters en forme d'arbres et des mises en cluster hiérarchiques
Mettre en cluster les tweets et les fichiers texte pour mieux les comprendre
Identifier les connexions importantes avec l'analyse des réseaux sociaux
Comprendre l'utilisation des résultats de l'analyse des réseaux sociaux à des fins marketing
Identifier
les préférences réelles des clients à partir d'un ensemble de données
transactionnelles pour améliorer l'expérience utilisateur
Calculer les indices de support et de confiance et le lift pour différencier les bonnes règles des mauvaises
Pour suivre une session à distance depuis l'un de nos centres, contactez-nous.
Aucune date de programmée actuellement. Pour plus d'information sur les prochaines sessions, nous vous invitons à joindre le service commercial par téléphone au 09 72 37 73 73 (prix d'un appel local) ou depuis notre formulaire de contact.
Bât Ravezies - 2e étage 250 avenue Emile Counord
33300 Bordeaux
Liaison directe de la gare Bordeaux Saint-Jean via le tram C
32 Boulevard Vincent Gâche
44000 Nantes
46 rue des Canonniers - 2è étage
59800 Lille
Proche des deux gares
62 rue de Bonnel - 1er étage Ascenseur à droite de l'entrée
69003 Lyon
38/40 rue de la République Escalier A, 1er étage
13001 Marseille
A proximité du vieux port
26 Allée de Mycènes Le Thèbes, Bât. A, 3è étage
34000 Montpellier
Quartier Antigone
32 Boulevard Vincent Gâche 5 ème étage
44200 Nantes
455 promenade des Anglais Bât Arenice, 7è étage
06200 Nice
11 rue Antoine Bourdelle
75015 Paris
dans le 15e arrondissement
3 place du Général Giraud
35000 Rennes
4 rue de Sarrelouis - 4è étage
67000 Strasbourg
1 place Occitane Bât. Le Sully - 4è étage
31000 Toulouse
Proche de Jean-Jaurès et du Capitole