[Livres data mining][Sites data mining][Formations data mining]

 

[Home
[Livres data mining] 
[Sites data mining
[Formations data mining] 

 

 

 

 

SUR LA STATISTIQUE ET L’ANALYSE DES DONNÉES

 

 

Jean-Marie Bouroche, Gilbert Saporta : L’analyse des données, Que sais-je ?, n° 1854, Presses Universitaires de France, 9e éd., 2006.

Un "best-seller" du domaine (plus de 60 000 exemplaires), traduit en plusieurs langues, présentant de façon synthétique les fondements de l'analyse des données.

 

 

 

Christophe Croux, Jean-Jacques Droesbeke, Pierre-Louis Gonzalez, Christian Gourieroux, Gentiane Haesbroeck, Michel Lejeune, Gilbert Saporta, Michel Tenenhaus : Modèles statistiques pour données qualitatives, Technip, 2005.

Les actes d’un séminaire très intéressant organisé par la Société Française de Statistique sur les méthodes de classement, la régression logistique, le modèle log-linéaire, les modèles de comptage, les modèles linéaires généralisés, la régression PLS, avec des applications à la médecine et l’assurance. À lire pour connaître l’état de l’art sur ces sujets.

 

 

 

Ludovic Lebart, Alain Morineau, Marie Piron : Statistique exploratoire multidimensionnelle : Visualisations et inférence en fouille de données, Dunod, 4e éd., 2006.

Edition actualisée de l'un des meilleurs titres sur l'analyse des données "à la française" (analyse factorielle), mais aussi des développements sur la classification, l'analyse discriminante, les modèles log-linéaires, les arbres de décision, les réseaux de neurones, les méthodes de validation, etc.

 

 

Gilbert Saporta : Probabilités, analyse des données et statistique, Technip, 2006.

Dans une nouvelle édition, l'ouvrage de référence, à avoir en permanence sur sa table de travail, pour son exposé clair, précis et complet. Il contient toutes les bases qu'il faut connaître avec dans l'édition 2006 de nombreux compléments sur des sujets récents : SVM, théorie de l'apprentissage de Vapnik, méthodes de Monte-Carlo, etc.

 

 

Michel Jambu : Méthodes de base de l’analyse des données, Eyrolles, 1999.

Ecrit par un spécialiste, à la fois théoricien et consultant pour France Telecom, sur l'analyse des données "à la française" et les méthodes de classification. N'aborde pas les méthodes prédictives hormis la régression linéaire.

 

 

Jean-Pierre Nakache, Josiane Confais : Statistique explicative appliquée, Technip, 2003.

Un ouvrage récent à propos des principales méthodes prédictives : l'analyse discriminante linéaire, la régression logistique et les arbres de décision. L'ouvrage rappelle la théorie de façon concise et détaillée, et la fait suivre d'exemples variés et éclairants réalisés à l'aide des logiciels SAS et SPAD.

 

 

Jean-Pierre Nakache, Josiane Confais : Approche pragmatique de la classification, Technip, 2004.

C'est en quelque sorte la suite de l'ouvrage Statistique explicative appliquée des mêmes auteurs, dans le même style fait de rigueur théorique et de pédagogie dans les exemples d'applications, avec de nombreuses références à la littérature récente, à des sites internet, ainsi qu'aux dernières versions de logiciels, principalement SAS et SPAD, mais pas exclusivement. Un excellent ouvrage de référence sur ce vaste et riche sujet.

 

 

Sylvie Thiria, Olivier Gascuel, Yves Lechevallier, Stéphane Canu : Statistique et méthodes neuronales, Dunod, 1997.

Un ouvrage de référence sur le sujet.

 

 

 

David W. Hosmer and Stanley Lemeshow : Applied Logistic Regression, Wiley, 1989, 2d edition 2000.

Un ouvrage fameux sur la régression logistique, avec de nombreux exemples.

 

 

 

Michel Tenenhaus : La régression PLS, théorie et pratique, Technip, 1998.

Tout ce qu'il faut savoir sur la régression PLS, inventée en 1983 par Svante Wold et généralisée en 2000 par Michel Tenenhaus à la régression logistique PLS, de plus en plus utilisée dans l'industrie (chimique, agroalimentaire...) quand il faut manipuler un grand nombre de variables explicatives fortement colinéaires.

 

 

Mireille Bardos : Analyse discriminante, application au risque et scoring financier, Dunod, 2001.

Un ouvrage riche de l'expérience de l'auteur à la Banque de France. Contient de nombreux exemples de scoring des entreprises, avec des comparaisons de méthodes, en particulier de l'analyse discriminante et de la régression logistique, et des remarques utiles sur la préparation des données. Très utile pour qui travaille dans ce domaine.

 

 

 

SUR LE DATA MINING

 

 

Stéphane Tufféry : Data Mining et Statistique Décisionnelle, Éditions Technip, 2005.

Cet ouvrage fait le point sur le data mining, ses méthodes, ses outils et ses applications, qui vont du scoring jusqu’au web mining et au text mining. Nombre de ses outils appartiennent à l’analyse des données et la statistique classique (classification automatique, analyse discriminante, régression logistique, modèles linéaires généralisés…) mais certains sont plus spécifiques au data mining (arbres de décision, réseaux de neurones, support vector machines, algorithmes génétiques…). Un chapitre aidera le lecteur à se diriger dans une offre logicielle fournie, et il dresse un comparatif approfondi de SAS et SPSS. De nombreux exemples conduits avec SAS, SPSS et SPAD.

Les aspects méthodologiques vont de la conduite des projets jusqu’aux facteurs de réussite et aux pièges à éviter, en passant par l’évaluation et la comparaison des modèles, l’intégration dans le marketing de bases de données, le calcul du retour sur investissement, les interfaces informatiques, sans oublier les contraintes juridiques dès que l’on traite des données à caractère personnel.

Cet ouvrage de référence intéressera les statisticiens, les data miners, les utilisateurs et les gestionnaires de bases de données, quel que soit leur secteur d’activité. Les décideurs, les économètres, les enseignants et étudiants en sciences économiques, le liront aussi avec profit.

 

 

Stéphane Tufféry : Data Mining et Scoring, Dunod, 2002.

Panorama des techniques descriptives et prédictives de data mining utilisées en entreprise, pour le CRM et le management du risque. Annexe statistique et étude de cas complète.

Nouvelle présentation en juin 2003.

DEFINITIVEMENT EPUISE

Cité dans  Le Monde Informatique n° 996 du 03/10/2003.

 

 

Michael J. A. Berry, Gordon S. Linoff : Data Mining, Masson, 1997.

Un livre agréable à lire sur le data mining (traduit de l’américain), qui ne parle toutefois ni de l'analyse des données à la française, ni des méthodes prédictives par analyse discriminante et régression logistique. Aussi traduit en japonais et en chinois.

EPUISE

 

 

Michael J. A. Berry, Gordon S. Linoff : Mastering Data Mining : The Art and Science of Customer Relationship Management, John Wiley & Sons, 1999.

Le second livre de data mining des célèbres consultants américains, avec vingt études de cas. Aussi traduit en italien et en chinois.

 

 

Usama M. Fayyad, Gregory Piatetsky-Shapiro, Padhraic Smyth, Ramasamy Uthurusamy (Editors) : Advances in Knowledge Discovery and Data Mining, AAAI Press / MIT Press, 1996.

L’état de l’art sur le data mining. Un ouvrage académique réputé.

 

 

T. Hastie, R. Tibshirani, J.-H. Friedman : The Elements of Statistical Learning : Data Mining, Inference and Prediction, Springer Series in Statistics, Springer Verlag, 2001.

Un des meilleurs ouvrages récents sur les aspects statistiques du data mining, écrit par des statisticiens réputés.

Cliquez ici pour aller sur le site de l'ouvrage

 

 

L. Breiman, J.H. Friedman, R.A. Olshen, C.J. Stone : Classification and Regression Trees, Wadsworth, 1984.

Un ouvrage fondemental sur les arbres de décision, écrits par les inventeurs de CART.

 

 

Olivia Parr Rud : Data Mining Cookbook, Wiley, 2000.

Un livre pratique accompagné de très nombreux exemples de modélisations utilisant les logiciels SAS (antérieurs à Entreprise Miner).

 

 

 

SUR LE TEXT MINING

 

 

Ludovic Lebart, André Salem : Statistique textuelle, Éditions Dunod, 1994.

 Un classique passionnant.

 

 

 

SUR LE WEB MINING

 

 

Michael J.A. Berry, Gordon S. Linoff : Mining the web, John Wiley & Sons, 2002.

 Le dernier titre des célèbres consultants du cabinet bostonien "Data-miners".

 

 

Mylène Bazsalicza, Patrick Naïm : Data mining pour le Web, Eyrolles, 2001.

 Un titre français sur le web mining.

 

 

 

SUR LE MARKETING DE BASES DE DONNÉES

 

 

Andrea Micheaux : Marketing de bases de données, Éditions d’Organisation, 1997.

Un ouvrage à la fois pratique et clair.

 

 

 

 

SUR SAS ET LE LANGAGE SAS

 

 

Hélène Kontchou, Olivier Decourt : SAS : Maîtriser SAS Base et SAS Macro, SAS 9.2 et versions antérieures, Éditions Dunod, 2007.

Nouvelle édition d'un excellent livre qui s'adresse aux utilisateurs débutants et confirmés. Les premiers y trouveront les grands principes de SAS, une présentation de l'interface et des concepts de base (table, variable, format, étape Data, procédure, ODS), des principales instructions. Les seconds y mettront à jour leurs connaissances en incluant les nouveautés de la version 9 (signalées dans le livre), et trouveront des synthèses sur des sujets difficiles (ODS, macro-langage, formats, fonctions SAS, ...). Il est émaillé d'un grand nombre d'exemples, et s'achève par un chapitre consacré à un traitement de cas concret, sur des données bancaires réalistes, qui synthétise le contenu des chapitres précédents.

 

 

[Home][Livres data mining][Sites data mining][Formations data mining]

Copyright (c) 2003-2007 Stéphane Tufféry. Tous droits réservés.