Groupe de discussion
|
***
Un
groupe francophone très actif sur l'analyse des données
- Nombreux sujets abordés
|
***
Archives
of SAS-L@LISTSERV.UGA.EDU
|
***
Archives
of SPSSX-L@LISTSERV.UGA.EDU
|
Analyse des données
|
***
Le
site très complet de Philippe Besse (Université de Toulouse), avec
de nombreux supports de cours en ligne
|
***
Le
site très riche de Christophe Benavent (IAE des pays
de l'Adour), avec plusieurs cours fondamentaux donnés
par lui ou d'autres, ainsi que d'autres ressources sur
les outils, les ouvrages, etc
|
***
StatNotes
Online Textbook
Le
cours en ligne de G. David Garson, avec de nombreuses
notices très bien faites sur tous les sujets de la statistique
et de l'analyse des données, avec le détail de l'implémentation
dans SPSS
|
***
Un
très bon glossaire statistique
|
***
Introduction aux Statistiques et notamment aux tests paramétriques et non-paramétriques ainsi qu'à l'analyse factorielle (AFC et ACP)
Cours de Ramousse R., Le Berre M & Le Guelte L.
|
***
La Revue MODULAD
Une mine de renseignements pratiques (sur les logiciels, les manifestations) et d'articles statistiques très intéressants.
|
***
Exemples d'utilisations de SAS/STAT dans
le domaine de l'écologie
|
**
Electronic
Statistics Textbook
Cours
de statistique en ligne - Moins de théorie que celui
de Besse et moins d'exemples que celui de Garson
|
**
Cours
de Andrew W. Moore's (Carnegie Mellon University) -
Transparents téléchargeables au format PDF sur de nombreux
sujets
|
**
Sur la courbe ROC et son interprétation
Calcul de l'aire sous la courbe ROC à
l'aide de la méthode
d'approximation des trapèzes (SUGI
27)
|
**
An
Introduction to Logistic Regression
Un
cours de base bien fait sur la régression logistique
|
**
Un
cours sur la régression logistique de l'Université d'Exeter
|
**
Un
cours sur l'analyse des correspondances à la Benzécri
|
**
Les
travaux de Petitjean sur la classification, avec ses
freewares en téléchargement
|
**
Cours
de l'INSA de Rouen - Régression linéaire, réseaux bayésiens,
réseaux neuronaux - Pour ceux qui aiment les formules
|
**
Stat/Math
Center (Indiana University)
Comparaison
d'algorithmes (régression, tests statistiques) de SAS,
SPSS
|
Data Mining
|
***
Une
présentation d'ensemble du data mining par un grand
statisticien
|
***
Le site du livre "Introduction to Data Mining" de Pang-Ning Tan, Michael Steinbach, Vipin
Kumar chez Addison-Wesley, avec tout un matériel proposé (extraits, diapositives
PowerPoint...)
|
***
Un
article sur les fondements du data mining
|
***
Cours pas très détaillé mais assez complet de data
mining
|
**
Glossaire
du data mining
|
*
Comparaison
entre réseaux de neurones et régression logistique
|
*
Performances
comparées de différents outils d'analyse de données
de PMSI sur plusieurs dizaines de jeux de données, allant
du "maison" au très connu (CENSUS, TITANIC,
etc.)
|
Régression Logistique
|
***
Cours
de Régression Logistique Appliquée, de Patrick Taffé,
Lausanne, 2004
Un
tour d'horizon complet en 64 pages avec des exemples
obtenus avec le logiciel STATA
|
***
Logistic
regression in SAS version 8, de Paul W. Dickman
Department
of Medical Epidemiology and Biostatistics Karolinska
Institutet, 2003
Encore
un bon panorama du sujet en 57 diapositives
|
***
Stat/Math
Center (Indiana University) :
Analysis
Of Categorical Dependent Variables With SAS And SPSS
:
Exemples
détaillés avec sorties des logiciels
|
***
UCLA
Academic Technology Services
Statistical
Computing Seminar
Proc
Logistic and Logistic Regression Models
Une
vue d'ensemble complète de la proc LOGISTIC de SAS 8.2
|
***
Cours
de Régression logistique, de Paul-Marie Bernard
Département
de Médecine Sociale et Préventive, Québec, Canada, 2003
Cours
complet incluant des exercices, et abordant la régression
logistique ordinale et nominale
|
Réchantillonnage et agrégation de modèles
|
***
Re-sampling methods in statistical modeling
Très bon cours du Pr Bontempi de l'Université Libre de Bruxelles sur les modèles prédictifs
et l'apport des techniques de jackknife, de boostrap, notamment au travers des méthodes
d'agrégation de modèles (bagging, boosting)
|
**
What are cross-validation and bootstrapping?
Une petite synthèse intéressante
|
Réseaux de neurones
et Support Vector Machines
|
***
Très
bonne présentation des SVM par Olivier Bousquet (Ecole
Polytechnique)
|
***
Site
sur les SVM avec plusieurs liens vers des articles intéressants
|
***
Cours
de Philippe Leray (INSA de Rouen) sur le sujet : Réseaux
de neurones,
réseaux
bayesiens et applications
|
***
mySVM - a support vector machine - implémentation gratuite des SVM par Stefan Rüping
|
**
Ressources sur les réseaux de neurones
|
Statistique
|
***
Université de Neuchâtel
De nombreux cours de statistique en ligne d'excellent niveau
|
***
Un cours sur les équations structurelles, utilisant le logiciel AMOS.
|
***
Cours
de biostatistique
|
***
Le
cours de licence de statistique de Jean Véronis - Complet
et convivial avec des exemples
|
***
Aide
mémoire de maîtrise de Michel Le-Her - Les bases à connaître
|
***
Des exposés intéressants sur les
statistiques, ses pièges et la façon d'aborder une étude en sciences humaines
|
**
Cours
de Jean-Michel (INSA Lyon)
|
**
Cours
de (bio)statistique des Facultés Universitaires de Namur
|
Mathématique
|
***
Eric
Weisstein's World of Mathematics
Une
encyclopédie mathématique en ligne avec plus de 11000
entrées et 5000 figures
|
***
BibM@th
Dictionnaire
mathématique en ligne
|
Text Mining
|
***
Site
de la revue Lexicometrica - Articles à télécharger sur
la fouille de données textuelles
|
**
Coloriage
automatique de corpus (exemples et téléchargements)
|
**
Text mining : Word Mapper
|
Web Mining
|
***
Cours de Web mining de Gregory Piatetsky-Shapiro
|
Applications métiers
|
***
Article
de Gilbert Saporta sur l'essentiel de ce qu'il faut
savoir sur le scoring
|
***
Extraction
des Connaissances à partir des Données (ECD) - Laboratoire
ERIC, Université Lumière Lyon 2
|
**
Working Paper Series
|
**
Papers about Credit Scoring
|
**
Rakesh Agrawal's Publications
|
**
Groupe de Recherche Opérationnelle - Crédit Lyonnais
|
*
Data Mining in Finance
|
Consulting et formation
|
***
Le
site d'Olivier Decourt, consultant - Nombreuses informations
sur les outils SAS, y compris une rubrique "paparazzi"
consacrée aux "indiscrétions sur les nouveautés
de SAS"
|
***
Le
site de Lincoln, société de conseil particulièrement
active en data mining
|
**
Société
Française de Statistique
|
Outils logiciels
|
***
Aide
en ligne SAS :
http://support.sas.com/documentation/onlinedoc/
http://support.sas.com/documentation/onlinedoc/sas9doc.html
http://v8doc.sas.com/sashtml/
|
***
Support
technique sur SAS/STAT
|
***
FASTats:
Frequently Asked-for Statistics
De
nombreux renseignements sur les procédures de SAS/STAT
|
***
Exemples
de programmes SAS/STAT avec des données réelles
Autres
exemples
de programmes SAS/STAT
Encore
des exemples
de programmes SAS/STAT
|
***
Bonne introduction à SAS base et SAS macro :
http://www.cnam.fr/maths/IMG/pdf/SAS_introduction_1.pdf
http://www.cnam.fr/math/IMG/pdf/SAS_macros.pdf
|
***
Groupe des utilisateurs du logiciel R
|
***
Statistiques
avec le logiciel R, de Vincent Zoonekynd, mathématicien
et bioinformaticien
|
***
Cours
sur R :
http://www.biostat.envt.fr/wiki/index.php/GNU_R
http://cran.r-project.org/doc/contrib/Paradis-rdebuts_fr.pdf
|
***
La "R Graph Gallery" de Romain François, pour obtenir de superbes graphiques avec R
|
***
Rattle
Rattle est une interface graphique de R
permettant de faire différents modèles assez facilement (import des données, variable cible, type de
modélisation...).
|
***
R
commander
Un article qui donne le mode d'emploi de Rcmdr ("R
commander"), package qui dote R d'une "interface graphique" pour certaines de
ses fonctionnalités : import de données, transformation de variables, tests
statistiques, modèles de régression, scoring d'un fichier, etc.
|
***
Factor Analysis and Data Mining with R
developed by F. Husson, S. Lê and J. Mazet (CNRS - Université de Rennes)
FactoMineR est un programme d'analyse factorielle qui permet de traiter les tableaux simples et multiples. Il permet en outre de travailler avec des individus et/ou des variables supplémentaires.
|
***
Enseignements
de Statistique en Biologie
A.B.
Dufour, D. Chessel et J.R. Lobry
Nombreux
supports de cours et de TD avec le logiciel R
|
***
Université
Lyon 1, TD
de Statistique en Biologie, A.B.
Dufour, D. Chessel & J. Lobry
Exemples
d'utilisation du logiciel R couvrant toute la statistique
|
***
Raynald's
SPSS Tools
Un
site très complet consacré à SPSS, avec FAQ, conseils pratiques,
syntaxes, liens, etc
|
***
Des manuels de référence SPSS 13 sur le site de
l'Université du Kansas
|
***
En téléchargement sur ce site de SPSS, le
guide SPSS Programming and Data Management: A Guide for SPSS and SAS®
Users , écrit par le grand spécialiste de SPSS Raynald Levesque, qui
expose avec de nombreux exemples la syntaxe des commandes SPSS, le langage
script et l'OMS (output management system), équivalent de l'ODS de SAS. Il
contient aussi l'équivalent SPSS d'un certain nombre de commandes SAS de gestion
des données.
|
**
Solving Homework Problems in Data Analysis II
De petites études de cas traitées en détail avec SPSS, expliquant bien les étapes à franchir
|
***
Macros
Excel pour effectuer des tests non-paramétriques, avec
des rappels de cours
Très
bien fait
|
***
Visual PLS, pour les modèles à équations structurelles
|
**
Liste
de scripts SPSS
fournis pour compléter les procédures existantes de
SPSS
|
**
Support
technique statistique de SPSS
|
**
SPSS
Suisse
|
**
Un
texte sur la régression logistique sur SPSS
|
**
Quelques
macros statistiques pour SAS et Excel surtout
|
**
The
BUGS Project
Logiciel
de réseau bayésien
|
**
Un comparatif récent (2004) et complet de
plusieurs logiciels de statistique (Gauss, Maple, Mathematica, Matlab, MuPAD,
O-Matrix, Ox, Scilab, S-Plus)
|
**
Un comparatif de vitesse entre plusieurs
logiciels de statistique (R, S-Plus, Matlab, O-Matrix, Octave, Scilab, Ox)
|
**
Comparatif fonctionnel de SAS Entreprise Miner, Statistica Data Miner et SPSS Clementine
Comparatif fonctionnel de Insightful Miner, KXEN et XL-Miner
Data Mining Tools : Which One is Best for CRM ?
Article published in DM Direct Special Report, by Robert A. Nisbet
|
Jeux de données statistiques
|
***
Statistical
Consulting Center - University of Massachusetts
Des
données réelles avec commentaires pour illustrer les
méthodes statistiques, triées par méthode
|
***
Quelques jeux de données très intéressants :
Utilisés pour comparer 20 algorithmes de classement
(projet Statlog - projet européen Esprit), méthodes statistiques, arbres de
décision et réseaux de neurones
(plus
de détails sur Statlog)
|
***
DASL
: The Data and Story Library
Des
données réelles avec commentaires pour illustrer les
méthodes statistiques, triées par méthode
|
***
Journal
of Statistics Education
Des
données réelles avec commentaires pour illustrer les
méthodes statistiques
|
***
The
Insurance Company (TIC) Benchmark
|
***
The
German Credit Risk Database
Voir aussi l'adresse : ftp://ftp.ics.uci.edu/pub/machine-learning-databases/statlog
|
***
Liste
de jeux de données du Machine Learning Network
|
***
Delve
Datasets - Collections of data for developing, evaluating,
and comparing learning methods
|
***
The
University of Edinburgh - Datasets for Data Mining
|
***
Fichiers
de données réelles pour études statistiques
|
**
Canadian
Automobile Insurance Claims for 1957-1958
Jeu
d'essai pour tester la régression de Poisson et la régression
gamma
|
Portails
|
**
Kdnuggets : Data Mining, Web Mining, and Knowledge
Discovery Guide
|
**
Un portail
complet en français
|
**
Data Mining - Web-datamining, le portail
de la société Lincoln
|
**
Ressources statistiques libres sur le web
|
**
Centre de Veille et de Recherches Thématiques (références
d'articles, d'études, d'ouvrages et de sites sur
le data mining)
|
***
Jeux de données : nombreux exemples de données statistiques
|