The Data Mining Page

 

 Site mis à jour le : 21 mai 2012

Google
Web data.mining.free.fr

 

 

 

Stéphane Tufféry

Statisticien

Data Miner

En charge de la statistique et du data mining dans un grand groupe bancaire français.

Enseigne la statistique et le data mining au niveau DESS - Master 2 dans les Universités de Paris-Dauphine et de Rennes 1.

Intervient à l'ENSAI (Ecole Nationale de la Statistique et de l'Analyse de l'Information)

 

Auteur de :

 

Data Mining et Scoring, Dunod, 2002 (épuisé)

 

Data Mining et statistique décisionnelle, Éditions Technip, nouvelle édition revue et enrichie, janvier 2010, 62 euros, préface de Gilbert Saporta

 

Revue de Presse : cliquer ici

 

Télécharger la table des matières

 

Pour l'acheter sur Amazon : cliquer ici !

 

 

 

 

 

 Votre secteur d'activité : 

Banque - Assurance

Télécommunications

Grande distribution

e-commerce / web

Santé

Industrie

Recherche

Autre

Pour être averti des nouveautés  :

 

 A COURSE IN DATA MINING

Cours donnés en DESS et Master 2 d'’Économétrie entre 1999 et 2010

Cette formation est consacrée aux techniques de statistique décisionnelle, data mining et scoring, et à leur mise en oeœuvre en entreprise.

Ces cours sont disponibles sous forme de fichiers PDF (nécessitant au moins Acrobat 5.0).

 Cours                                       

Contenu

Présentation du data mining

43 diapos - 428 ko

Déroulement d'un projet et facteurs de succès

62 diapos - 275 ko

Les logiciels de statistique et de data mining

30 diapos - 186 ko

Étude statistique et préparation des données

77 diapos - 431 ko

Techniques prédictives de data mining

249 diapos - 2129 ko

Techniques descriptives de data mining

101 diapos - 1432 ko

Analyse factorielle

51 diapos - 190 ko

Réseaux de neurones et Support Vector Machines

46 diapos - 436 ko

Le text mining et le web mining

53 diapos - 357 ko

Data mining, informatique et libertés

 16 diapos - 66 ko

Thèmes abordés :

statistique décisionnelle, data mining, datamining, kdd, crm, grc, eda, analyse des données, classification, clustering, segmentation, arbres de décision, détection des associations, régression linéaire, analyse discriminante, régression logistique, GLM, modèle linéaire général, classement, scoring, analyse de survie, réseaux de neurones, séparateurs à vastes marges, algorithmes génétiques, text mining, web mining, dataminer, logiciels.

Topics :

statistical analysis, data mining, datamining, kdd, knowledge discovery, business intelligence, crm, eda, statistical data analysis,data transformation and cleaning, data preparation, clustering, segmentation, decision trees, association rules, market basket analysis, linar regression, discriminant analysis, logistic regression, GLM, general linear model, GLZ, generalized linear model, classification, predictive analysis, scoring, survival analysis, neural networks, support vector machines, genetic algorithms, text mining, web mining, dataminer, software.

L'’information contenue dans ces documents est fournie par l'’auteur sans garantie d'’aucune sorte, explicite ou implicite. L'’utilisateur assume entièrement le risque de l'’utilisation du contenu de ces documents. En cas de reproduction, leur source doit être citée. Ces documents ne peuvent revendus ou cédés en échange d'’un quelconque profit.

Événements :

LE LIVRE DU MOIS :

 

Olivier Decourt : SAS l'essentiel - SAS v8 et SAS v9, SAS Enterprise Guide, langages SAS, SQL et macro , Éditions Dunod, 2011

 

Une excellente présentation, claire et précise, du logiciel SAS jusque dans ses fonctionnalités les plus récentes, illustrée de nombreux exemples.

Cet ouvrage s'adresse aux utilisateurs débutants et confirmés. Les premiers y trouveront les grands principes de SAS, une présentation de l'interface, des concepts de base et des principales instructions. Les seconds y mettront à jour leurs connaissances en incluant les nouveautés de la version 9, et trouveront des synthèses sur des sujets importants (ODS, macro-langage, SQL, formats…).

 

VOTEZ !

 

Quelle méthode de modélisation utilisez-vous le plus souvent ?

 

Analyse discriminante

Arbres de décision

Régression logistique

Régression PLS

Réseaux bayésiens

Réseaux de neurones

Support Vector Machines

Autre

 

 

Cliquez ici pour voir

les résultats du sondage

 

Cartographie des logiciels de statistique et data mining

(lire les articles How to choose a data mining suite, Data Mining Tools : Which One is Best for CRM ? et Comparison of mathematical programs for data analysis)

 

Logiciels multi-techniques

Insight - S-PLUS

R (libre)

Weka (gratuit)

Tanagra (gratuit)

SAS – Entreprise Miner

SPSS – Clementine

Statsoft - Statistica Data Miner

Insight - Insightful Miner

SPAD

 

KXEN

Logiciels mono-techniques

Salford Systems – CART

Isoft – Alice

Neuralware – Predict

 

DataLab (spécialiste du prétraitement des données)

SPSS – Answer Tree

 

Logiciels micros

Logiciels gros systèmes

Revenir en haut de la page

[Home][Livres data mining][Sites data mining][Formations data mining]

Copyright (c) 2003-2012 Stéphane Tufféry. Tous droits réservés.