|
|
SUR LA STATISTIQUE ET L’ANALYSE DES DONNÉES
|
|
Jean-Marie Bouroche, Gilbert Saporta : L’analyse
des données, Que sais-je ?, n° 1854, Presses Universitaires
de France, 9e éd., 2006.
Un "best-seller" du domaine
(plus de 60 000 exemplaires), traduit en plusieurs langues, présentant
de façon synthétique les fondements de l'analyse des
données.
|
|
Christophe Croux, Jean-Jacques Droesbeke, Pierre-Louis Gonzalez, Christian Gourieroux, Gentiane Haesbroeck, Michel Lejeune, Gilbert Saporta, Michel Tenenhaus : Modèles statistiques pour données qualitatives, Technip, 2005.
Les actes d’un séminaire très intéressant organisé par la Société Française de Statistique sur les méthodes de classement, la régression logistique, le modèle log-linéaire, les modèles de comptage, les modèles linéaires généralisés, la régression PLS, avec des applications à la médecine et l’assurance. À lire pour connaître l’état de l’art sur ces sujets.
|
|
Ludovic Lebart, Alain Morineau, Marie Piron : Statistique
exploratoire multidimensionnelle : Visualisations et
inférence en fouille de données, Dunod, 4e éd.,
2006.
Edition actualisée de l'un des meilleurs titres sur l'analyse
des données "à la française" (analyse factorielle),
mais aussi des développements sur la classification,
l'analyse discriminante, les modèles log-linéaires,
les arbres de décision, les réseaux de neurones, les
méthodes de validation, etc.
|
|
Gilbert Saporta : Probabilités,
analyse des données
et statistique, Technip, 2006.
Dans une nouvelle édition, l'ouvrage de référence, à avoir
en permanence sur sa table de travail, pour son exposé
clair, précis et complet. Il contient toutes les bases qu'il
faut connaître avec dans l'édition 2006 de nombreux compléments sur des sujets récents : SVM, théorie de l'apprentissage de Vapnik, méthodes de Monte-Carlo, etc.
|
|
Michel Jambu : Méthodes de base de l’analyse des
données, Eyrolles, 1999.
Ecrit par un spécialiste, à la fois
théoricien et consultant pour France Telecom, sur l'analyse
des données "à la française" et les méthodes
de classification. N'aborde pas les méthodes prédictives
hormis la régression linéaire.
|
|
Jean-Pierre
Nakache, Josiane Confais : Statistique
explicative appliquée,
Technip, 2003.
Un ouvrage récent à propos des principales
méthodes prédictives : l'analyse discriminante
linéaire, la régression logistique et les arbres
de décision. L'ouvrage rappelle la théorie de façon
concise et détaillée, et la fait suivre d'exemples
variés et éclairants réalisés à l'aide des logiciels
SAS et SPAD.
|
|
Jean-Pierre
Nakache, Josiane Confais : Approche pragmatique de
la classification,
Technip, 2004.
C'est en quelque
sorte la suite de l'ouvrage Statistique explicative
appliquée des mêmes auteurs, dans le même style
fait de rigueur théorique et de pédagogie dans les exemples
d'applications, avec de nombreuses références à la littérature
récente, à des sites internet, ainsi qu'aux dernières
versions de logiciels, principalement SAS et SPAD, mais
pas exclusivement. Un excellent ouvrage de référence
sur ce vaste et riche sujet.
|
|
Sylvie Thiria, Olivier Gascuel, Yves Lechevallier,
Stéphane Canu : Statistique et méthodes neuronales,
Dunod, 1997.
Un ouvrage de référence sur le sujet.
|
|
David
W. Hosmer and Stanley Lemeshow : Applied Logistic
Regression, Wiley, 1989, 2d edition 2000.
Un ouvrage fameux sur la régression
logistique, avec de nombreux exemples.
|
|
Michel
Tenenhaus : La régression PLS, théorie et pratique,
Technip, 1998.
Tout ce qu'il faut savoir sur la régression
PLS, inventée en 1983 par Svante Wold et généralisée
en 2000 par Michel Tenenhaus à la régression logistique
PLS, de plus en plus utilisée dans l'industrie (chimique,
agroalimentaire...) quand il faut manipuler un
grand nombre de variables explicatives fortement colinéaires.
|
|
Mireille Bardos : Analyse discriminante, application
au risque et scoring financier, Dunod, 2001.
Un ouvrage riche de l'expérience de
l'auteur à la Banque de France. Contient de nombreux
exemples de scoring des entreprises, avec des comparaisons
de méthodes, en particulier de l'analyse discriminante
et de la régression logistique, et des remarques utiles
sur la préparation des données. Très utile pour qui
travaille dans ce domaine.
|
|
SUR LE DATA MINING
|
|
Stéphane
Tufféry : Data Mining et Statistique Décisionnelle, Éditions Technip, 2005.
Cet ouvrage fait le point sur le data mining, ses méthodes, ses outils et ses applications, qui vont du scoring jusqu’au web mining et au text mining. Nombre de ses outils appartiennent à l’analyse des données et la statistique classique (classification automatique, analyse discriminante, régression logistique, modèles linéaires généralisés…) mais certains sont plus spécifiques au data mining (arbres de décision, réseaux de neurones, support vector machines, algorithmes génétiques…). Un chapitre aidera le lecteur à se diriger dans une offre logicielle fournie, et il dresse un comparatif approfondi de SAS et SPSS. De nombreux exemples conduits avec SAS, SPSS et SPAD.
Les aspects méthodologiques vont de la conduite des projets jusqu’aux facteurs de réussite et aux pièges à éviter, en passant par l’évaluation et la comparaison des modèles, l’intégration dans le marketing de bases de données, le calcul du retour sur investissement, les interfaces informatiques, sans oublier les contraintes juridiques dès que l’on traite des données à caractère personnel.
Cet ouvrage de référence intéressera les statisticiens, les data miners, les utilisateurs et les gestionnaires de bases de données, quel que soit leur secteur d’activité. Les décideurs, les économètres, les enseignants et étudiants en sciences économiques, le liront aussi avec profit.
|
|
Stéphane
Tufféry : Data Mining et Scoring, Dunod, 2002.
Panorama
des techniques descriptives et prédictives de data mining
utilisées en entreprise, pour le CRM et le management
du risque. Annexe statistique et étude de cas complète.
Nouvelle
présentation en juin 2003.
DEFINITIVEMENT
EPUISE
Cité
dans Le
Monde Informatique
n° 996 du 03/10/2003.
|
|
Michael J. A. Berry, Gordon S.
Linoff : Data Mining,
Masson, 1997.
Un livre agréable à lire sur le data mining
(traduit de l’américain), qui ne parle toutefois ni
de l'analyse des données à la française, ni des méthodes
prédictives par analyse discriminante et régression
logistique. Aussi traduit en japonais et en chinois.
EPUISE
|
|
Michael J. A. Berry, Gordon S.
Linoff : Mastering
Data Mining : The Art and Science of Customer Relationship
Management, John Wiley & Sons, 1999.
Le second livre de data mining des
célèbres consultants américains, avec vingt études de cas.
Aussi traduit en italien et en chinois.
|
|
Usama M. Fayyad, Gregory Piatetsky-Shapiro, Padhraic
Smyth, Ramasamy Uthurusamy (Editors) : Advances in
Knowledge Discovery and Data Mining, AAAI Press
/ MIT Press, 1996.
L’état de l’art sur le data mining.
Un ouvrage académique réputé.
|
|
T. Hastie, R. Tibshirani, J.-H. Friedman : The
Elements of Statistical Learning : Data Mining, Inference
and Prediction, Springer Series in Statistics, Springer
Verlag, 2001.
Un des meilleurs ouvrages récents
sur les aspects
statistiques du data mining, écrit par des statisticiens
réputés.
Cliquez ici pour aller sur le site de l'ouvrage
|
|
L. Breiman, J.H. Friedman, R.A. Olshen, C.J. Stone
: Classification and Regression Trees, Wadsworth,
1984.
Un ouvrage fondemental sur les arbres
de décision, écrits par les inventeurs de CART.
|
|
Olivia Parr Rud : Data Mining Cookbook, Wiley,
2000.
Un livre pratique accompagné de très
nombreux exemples de modélisations utilisant les logiciels
SAS (antérieurs à Entreprise Miner).
|
|
SUR LE TEXT MINING
|
|
Ludovic Lebart, André Salem : Statistique textuelle,
Éditions Dunod, 1994.
Un classique passionnant.
|
|
SUR LE WEB MINING
|
|
Michael
J.A. Berry, Gordon S. Linoff : Mining
the web, John
Wiley & Sons, 2002.
Le dernier titre des célèbres
consultants du cabinet bostonien "Data-miners".
|
|
Mylène Bazsalicza, Patrick Naïm : Data mining
pour le Web, Eyrolles, 2001.
Un titre français sur le web mining.
|
|
SUR LE MARKETING DE BASES DE DONNÉES
|
|
Andrea Micheaux : Marketing de bases de données,
Éditions d’Organisation, 1997.
Un ouvrage à la fois pratique et clair.
|
|
SUR SAS ET LE LANGAGE SAS
|
|
Hélène Kontchou, Olivier Decourt : SAS
: Maîtriser SAS Base et SAS Macro, SAS 9.2 et versions
antérieures,
Éditions Dunod, 2007.
Nouvelle édition d'un excellent livre qui s'adresse aux utilisateurs débutants et confirmés. Les premiers y trouveront les grands principes de SAS, une présentation de l'interface et des concepts de base (table, variable, format, étape Data, procédure, ODS), des principales instructions. Les seconds y mettront à jour leurs connaissances en incluant les nouveautés de la version 9 (signalées dans le livre), et trouveront des synthèses sur des sujets difficiles (ODS, macro-langage, formats, fonctions SAS, ...). Il est émaillé d'un grand nombre d'exemples, et s'achève par un chapitre consacré à un traitement de cas concret, sur des données bancaires réalistes, qui synthétise le contenu des chapitres précédents.
|
Copyright (c) 2003-2007 Stéphane
Tufféry. Tous droits réservés.
|