[Livres data mining][Sites data mining][Formations data mining]

 

[Home
[Livres data mining
[Sites data mining] 
[Formations data mining] 

 

 

Groupe de discussion

 

***

Un groupe francophone très actif sur l'analyse des données - Nombreux sujets abordés

 

***

Archives of SAS-L@LISTSERV.UGA.EDU

 

 ***

Archives of SPSSX-L@LISTSERV.UGA.EDU

 

 

Analyse des données

 

***

Le site très complet de Philippe Besse (Université de Toulouse), avec de nombreux supports de cours en ligne

 

***

Le site très riche de Christophe Benavent (IAE des pays de l'Adour), avec plusieurs cours fondamentaux donnés par lui ou d'autres, ainsi que d'autres ressources sur les outils, les ouvrages, etc

 

***

StatNotes Online Textbook

Le cours en ligne de G. David Garson, avec de nombreuses notices très bien faites sur tous les sujets de la statistique et de l'analyse des données, avec le détail de l'implémentation dans SPSS

 

***

Un très bon glossaire statistique

 

***

Introduction aux Statistiques et notamment aux tests paramétriques et non-paramétriques ainsi qu'à l'analyse factorielle (AFC et ACP)

Cours de Ramousse R., Le Berre M & Le Guelte L.

 

***

La Revue MODULAD

Une mine de renseignements pratiques (sur les logiciels, les manifestations) et d'articles statistiques très intéressants.

 

***

Exemples d'utilisations de SAS/STAT dans le domaine de l'écologie

 

**

Electronic Statistics Textbook

Cours de statistique en ligne - Moins de théorie que celui de Besse et moins d'exemples que celui de Garson

 

**

Cours de Andrew W. Moore's (Carnegie Mellon University) - Transparents téléchargeables au format PDF sur de nombreux sujets

 

**

Sur la courbe ROC et son interprétation

Calcul de l'aire sous la courbe ROC à l'aide de la méthode d'approximation des trapèzes (SUGI 27)

  

**

An Introduction to Logistic Regression

Un cours de base bien fait sur la régression logistique

 

**

Un cours sur la régression logistique de l'Université d'Exeter

 

**

Un cours sur l'analyse des correspondances à la Benzécri

 

**

Les travaux de Petitjean sur la classification, avec ses freewares en téléchargement

 

**

Cours de l'INSA de Rouen - Régression linéaire, réseaux bayésiens, réseaux neuronaux - Pour ceux qui aiment les formules

 

**

Stat/Math Center (Indiana University)

Comparaison d'algorithmes (régression, tests statistiques) de SAS, SPSS 

 

 

Data Mining

 

***

Une présentation d'ensemble du data mining par un grand statisticien

 

***

Le site du livre "Introduction to Data Mining" de Pang-Ning Tan, Michael Steinbach, Vipin

Kumar chez Addison-Wesley, avec tout un matériel proposé (extraits, diapositives

PowerPoint...)

 

***

Un article sur les fondements du data mining

 

***

Cours pas très détaillé mais assez complet de data mining

 

**

Glossaire du data mining

 

*

Comparaison entre réseaux de neurones et régression logistique

 

*

Performances comparées de différents outils d'analyse de données de PMSI sur plusieurs dizaines de jeux de données, allant du "maison" au très connu (CENSUS, TITANIC, etc.)

 

 

Régression Logistique

 

***

Cours de Régression Logistique Appliquée, de Patrick Taffé, Lausanne, 2004

Un tour d'horizon complet en 64 pages avec des exemples obtenus avec le logiciel STATA

 

 

***

Logistic regression in SAS version 8, de Paul W. Dickman

Department of Medical Epidemiology and Biostatistics Karolinska Institutet, 2003

Encore un bon panorama du sujet en 57 diapositives

 

 

***

Stat/Math Center (Indiana University) :

Analysis Of Categorical Dependent Variables With SAS And SPSS :

Exemples détaillés avec sorties des logiciels

 

 

***

UCLA Academic Technology Services

Statistical Computing Seminar

Proc Logistic and Logistic Regression Models

Une vue d'ensemble complète de la proc LOGISTIC de SAS 8.2

 

***

Cours de Régression logistique, de Paul-Marie Bernard

Département de Médecine Sociale et Préventive, Québec, Canada, 2003

Cours complet incluant des exercices, et abordant la régression logistique ordinale et nominale

 

 

Réchantillonnage et agrégation de modèles

 

***

Re-sampling methods in statistical modeling

Très bon cours du Pr Bontempi de l'Université Libre de Bruxelles sur les modèles prédictifs

et l'apport des techniques de jackknife, de boostrap, notamment au travers des méthodes

d'agrégation de modèles (bagging, boosting)

 

 

**

What are cross-validation and bootstrapping?

Une petite synthèse intéressante

 

 

Réseaux de neurones et Support Vector Machines

 

***

Très bonne présentation des SVM par Olivier Bousquet (Ecole Polytechnique)

 

***

Site sur les SVM avec plusieurs liens vers des articles intéressants

 

***

Cours de Philippe Leray (INSA de Rouen) sur le sujet : Réseaux de neurones,

réseaux bayesiens et applications

 

***

mySVM - a support vector machine - implémentation gratuite des SVM par Stefan Rüping

 

**

Ressources sur les réseaux de neurones

 

 

Statistique

 

***

Université de Neuchâtel

De nombreux cours de statistique en ligne d'excellent niveau

 

 

***

Un cours sur les équations structurelles, utilisant le logiciel AMOS.

 

 

***

Cours de biostatistique

 

***

Le cours de licence de statistique de Jean Véronis - Complet et convivial avec des exemples

 

***

Aide mémoire de maîtrise de Michel Le-Her - Les bases à connaître

 

***

Des exposés intéressants sur les statistiques, ses pièges et la façon d'aborder une étude en sciences humaines

 

**

Cours de Jean-Michel (INSA Lyon)

  

**

Cours de (bio)statistique des Facultés Universitaires de Namur

 

 

Mathématique

 

***

Eric Weisstein's World of Mathematics

Une encyclopédie mathématique en ligne avec plus de 11000 entrées et 5000 figures

 

 

***

BibM@th

Dictionnaire mathématique en ligne

 

 

Text Mining

 

***

Site de la revue Lexicometrica - Articles à télécharger sur la fouille de données textuelles

 

**

Coloriage automatique de corpus (exemples et téléchargements)

 

**

Text mining : Word Mapper

 

 

Web Mining

 

***

Cours de Web mining de Gregory Piatetsky-Shapiro

 

 

Applications métiers

 

***

Article de Gilbert Saporta sur l'essentiel de ce qu'il faut savoir sur le scoring

 

***

Extraction des Connaissances à partir des Données (ECD) - Laboratoire ERIC, Université Lumière Lyon 2

 

**

Working Paper Series

 

**

Papers about Credit Scoring

 

**

Rakesh Agrawal's Publications

 

**

Groupe de Recherche Opérationnelle - Crédit Lyonnais

 

*

Data Mining in Finance

 

 

Consulting et formation

 

***

Le site d'Olivier Decourt, consultant - Nombreuses informations sur les outils SAS, y compris une rubrique "paparazzi" consacrée aux "indiscrétions sur les nouveautés de SAS"

 

***

Le site de Lincoln, société de conseil particulièrement active en data mining

 

**

Société Française de Statistique

 

 

Outils logiciels

 

***

Aide en ligne SAS :

http://support.sas.com/documentation/onlinedoc/
http://support.sas.com/documentation/onlinedoc/sas9doc.html
http://v8doc.sas.com/sashtml/

 

***

Support technique sur SAS/STAT

 

***

FASTats: Frequently Asked-for Statistics

De nombreux renseignements sur les procédures de SAS/STAT

 

***

Exemples de programmes SAS/STAT avec des données réelles

Autres exemples de programmes SAS/STAT

Encore des exemples de programmes SAS/STAT

 

***

Bonne introduction à SAS base et SAS macro :

http://www.cnam.fr/maths/IMG/pdf/SAS_introduction_1.pdf

http://www.cnam.fr/math/IMG/pdf/SAS_macros.pdf

 

***

Groupe des utilisateurs du logiciel R

 

***

Statistiques avec le logiciel R, de Vincent Zoonekynd, mathématicien et bioinformaticien

 

***

Cours sur R :

http://www.biostat.envt.fr/wiki/index.php/GNU_R

http://cran.r-project.org/doc/contrib/Paradis-rdebuts_fr.pdf

 

***

La "R Graph Gallery" de Romain François, pour obtenir de superbes graphiques avec R

 

***

Rattle

Rattle est une interface graphique de R permettant de faire différents modèles assez facilement (import
des données, variable cible, type de modélisation...).

 

***

R commander

Un article qui donne le mode d'emploi de Rcmdr ("R commander"), package qui dote R d'une "interface graphique" pour certaines de ses fonctionnalités : import de données, transformation de variables, tests statistiques, modèles de régression, scoring d'un fichier, etc.

 

***

Factor Analysis and Data Mining with R

developed by F. Husson, S. Lê and J. Mazet (CNRS - Université de Rennes)

FactoMineR est un programme d'analyse factorielle qui permet de traiter les tableaux simples et multiples. Il permet en outre de travailler avec des individus et/ou des variables supplémentaires.

 

***

Enseignements de Statistique en Biologie

A.B. Dufour, D. Chessel et J.R. Lobry

Nombreux supports de cours et de TD avec le logiciel R

 

***

Université Lyon 1, TD de Statistique en Biologie, A.B. Dufour, D. Chessel & J. Lobry

Exemples d'utilisation du logiciel R couvrant toute la statistique

 

***

Raynald's SPSS Tools

Un site très complet consacré à SPSS, avec FAQ, conseils pratiques, syntaxes, liens, etc

 

***

Des manuels de référence SPSS 13 sur le site de l'Université du Kansas

 

***

En téléchargement sur ce site de SPSS, le guide SPSS Programming and Data Management: A Guide for SPSS and SAS® Users , écrit par le grand spécialiste de SPSS Raynald Levesque, qui expose avec de nombreux exemples la syntaxe des commandes SPSS, le langage script et l'OMS (output management system), équivalent de l'ODS de SAS. Il contient aussi l'équivalent SPSS d'un certain nombre de commandes SAS de gestion des données.

 

**

Solving Homework Problems in Data Analysis II

De petites études de cas traitées en détail avec SPSS, expliquant bien les étapes à franchir

 

***

Macros Excel pour effectuer des tests non-paramétriques, avec des rappels de cours

Très bien fait

 

***

Visual PLS, pour les modèles à équations structurelles

 

**

Liste de scripts SPSS fournis pour compléter les procédures existantes de SPSS

 

**

Support technique statistique de SPSS

 

**

SPSS Suisse

 

**

Un texte sur la régression logistique sur SPSS

 

**

Quelques macros statistiques pour SAS et Excel surtout

 

**

The BUGS Project

Logiciel de réseau bayésien

 

**

Un comparatif récent (2004) et complet de plusieurs logiciels de statistique (Gauss, Maple, Mathematica, Matlab, MuPAD, O-Matrix, Ox, Scilab, S-Plus)

 

**

Un comparatif de vitesse entre plusieurs logiciels de statistique (R, S-Plus, Matlab, O-Matrix, Octave, Scilab, Ox)

 

**

Comparatif fonctionnel de SAS Entreprise Miner, Statistica Data Miner et SPSS Clementine

Comparatif fonctionnel de Insightful Miner, KXEN et XL-Miner

Data Mining Tools : Which One is Best for CRM ?

Article published in DM Direct Special Report, by Robert A. Nisbet

 

 

Jeux de données statistiques

 

***

Statistical Consulting Center - University of Massachusetts

Des données réelles avec commentaires pour illustrer les méthodes statistiques, triées par méthode

 

 

***

Quelques jeux de données très intéressants :
Utilisés pour comparer 20 algorithmes de classement (projet Statlog - projet européen Esprit), méthodes statistiques, arbres de décision et réseaux de neurones

 

(plus de détails sur Statlog)

 

***

DASL : The Data and Story Library

Des données réelles avec commentaires pour illustrer les méthodes statistiques, triées par méthode

 

***

Journal of Statistics Education

Des données réelles avec commentaires pour illustrer les méthodes statistiques

 

***

The Insurance Company (TIC) Benchmark

 

***

The German Credit Risk Database

Voir aussi l'adresse : ftp://ftp.ics.uci.edu/pub/machine-learning-databases/statlog

 

***

Liste de jeux de données du Machine Learning Network

 

***

Delve Datasets - Collections of data for developing, evaluating, and comparing learning methods

 

***

The University of Edinburgh - Datasets for Data Mining

 

***

Fichiers de données réelles pour études statistiques

 

**

Canadian Automobile Insurance Claims for 1957-1958

Jeu d'essai pour tester la régression de Poisson et la régression gamma

 

 

Portails

 

**

Kdnuggets : Data Mining, Web Mining, and Knowledge Discovery Guide

 

**

Un portail complet en français

 

**

Data Mining - Web-datamining, le portail de la société Lincoln

 

**

Ressources statistiques libres sur le web

 

**

Centre de Veille et de Recherches Thématiques (références d'articles, d'études, d'ouvrages et de sites sur le data mining)

 

***

Jeux de données : nombreux exemples de données statistiques

 

 

[Home][Livres data mining][Sites data mining][Formations data mining]

Copyright (c) 2003-2007 Stéphane Tufféry. Tous droits réservés.