Méthodes et outils numériques : les bases de données en histoire
École doctorale internationale organisée par Pascal Bastien (IEA de Paris, UQAM), Benjamin Deruelle (UQAM) et Stéphane Lamassé (Université Paris 1)
Présentation
L’École doctorale internationale de Paris 2017 est la seconde école d’été numérique organisée par l’UQAM et l’Université de Paris 1 – Panthéon-Sorbonne. Elle s’inscrit dans le cadre d’un partenariat émergent qui a pour objectif de favoriser l’échange des pratiques du numérique entre le Québec et la France, leur apprentissage par les doctorants et la mobilité étudiante. L’esprit de cette école est de promouvoir l’usage des méthodes informatiques de la recherche en sciences humaines et sociales dans la discipline historique. Organisée par des enseignants-chercheurs expérimentés, elle aborde des méthodologies et des thématiques innovantes, appliquées au sein d’une pédagogie adaptée aux spécificités de l’histoire, aux besoins des étudiants et aux impératifs de la recherche.
Seconde édition d’une école qui veut s’inscrire dans la durée, elle sera la première organisée en France, après celle de Montréal, tenue à l’UQAM en mai 2016. Le thème choisi cette année, « Les bases de données en histoire », se situe dans le prolongement du précédent, axé sur les méthodes d’analyse textuelles assistées par ordinateur. L’objectif est de permettre aux étudiants de doctorat, ainsi qu’aux collègues de l’UQAM et de l’Université de Paris 1, de se former aux méthodes de structurations des données, ainsi qu’aux enjeux historiographiques et épistémologiques de leur application aux sciences sociales en général, et à l’histoire en particulier. Consacrée à la méthodologie, cette école se situe ainsi au carrefour de leur domaine d’étude individuel, de leur formation académique et d’une approche méthodologiques commune.
Le schéma d’enseignement de l’année dernière ayant fait ses preuves et ayant été plébiscité par les étudiants sera reconduit cette année. Les suggestions d’amélioration ont cependant été prises en compte pour rendre cette école encore plus efficace que la précédente. L’école est une formation de courte durée qui se déroulera sur 5 jours dans le cadre d’une formation universitaire avec le souci d’articuler la découverte théorique des notions qui sous-tendent l’édification d’une base de données (structuration, architecture, modèle conceptuel des données…) et leur exploitation pratique – de la construction d’une base de données à son exploration statistique (statistique descriptive, multivariée et exploratoire). Pour atteindre cet objectif, les journées s’organisent selon un schéma simple : les matinées débutent par une heure de discussion sur des lectures recommandées ou des exercices à réaliser, suivie par des conférences méthodologiques ; les après-midis sont consacrés à des prises en main logiciels et des expérimentations individuelles ou en groupes pour favoriser l’apprentissage.
Les intérêts de cette école sont multiples. D'abord, il s’agit d’assurer la formation des étudiants et des collègues à une méthode informatique de recherche en histoire qui a fait ses preuves depuis les années 1960, mais qui a aussi connu de nombreux bouleversements avec le développement de l’informatique personnelle et des logiciels de gestion de base de données (SGBD). Cette école est également l’occasion de créer des liens internationaux entre les formateurs de France et du Canada, mais aussi entre les étudiants, entre eux et avec les formateurs étrangers. Elle est, à ce titre, l’occasion d’échanges riches et stimulants non seulement sur les méthodes, les pratiques et les compétences mais sur le contenu même de la recherche. Elle favorise donc l’émergence de réseaux de recherche et de chercheurs qui ont encore du mal à se cristalliser autour d’initiatives structurantes dans ce domaine particulier. Enfin et au-delà des aspects professionnels, c’est aussi l’occasion pour les étudiants de découvrir une culture différente et d’autres façons de faire de l’histoire, d’enseigner et d’apprendre.
Recherche et formation internationales conjointes :
Cette école d’été internationale a moins pour objet de former les participants à l’informatique, qu’à l’usage scientifique des méthodes de recherche mis à la disposition des chercheurs par l’informatique. Si ces méthodes intéressent toutes les disciplines des SHS (philosophie, sociologie, psychologie, littérature), elles restent pourtant encore le plus souvent ignorées des historiens. Pourtant les logiciels permettant de s’en saisir sont de plus en plus nombreux, de plus en plus adaptés aux besoins de la recherche en SHS et de plus en plus simples à utiliser. Le risque pour les étudiants réside alors dans leur usage en dehors de toute formation méthodologique et épistémologique.
Le cœur et la force de cette formation résident donc dans l’attention portée à la fois aux enjeux épistémologiques et méthodologiques, et dans l’application pratique qu’elle en propose quotidiennement. Consacrée cette année aux bases de données, qui ont déjà une longue tradition en histoire, elle propose de s’attacher aux enjeux de l’utilisation de l’informatique pour le traitement critique et spécifiques des sources et des données historiques, aux règles de la constitution de populations et de la structuration des données (métasource, architecture, arbres relationnels, structuration souple, xml), ainsi qu’aux méthodes qui en permettent l’exploitation (statistiques univariées et multivariées, méthodes de classification et de visualisation).
Elle aborde ainsi sur une semaine l’état de l’art au travers l’exploration d’études désormais considérées comme exemplaires, et d’expérimentations menées à partir d’exemples introduits par les formateurs à partir de bases de données ayant déjà fait l’objet de publications de la part de chercheurs expérimentés. La semaine s’organise autour de lectures épistémologiques, de conférences méthodologiques, assurées par des spécialistes d’horizons divers (historiens, informaticiens, sociologues), suivies de discussion le matin, et d’ateliers les après-midis. Aucun « pré-requis » n’est indispensable pour suivre cette formation, sauf, peut-être, de faire preuve de curiosité, d’ouverture d’esprit, et d’une connaissance élémentaire de la bureautique. S’il est souhaitable que les participants aient un projet, cela n’est absolument pas une obligation.
Grands axes du programme
I. De la source à la métasource : stocker et manipuler l’information
- Réflexions épistémologiques sur les enjeux et les pratiques des bases de données
- Notions de population, de métasource, de modélisation, structuration
- Réflexion sur les spécificités des données en histoire (données induites/déduites ; données floues ; temporalité/spatialité)
- Enjeux de la modélisation et de la structuration des données historiques
II. L’exploitation des données
- Initiation à la constitution de bases de données
- Initiation à l’exploitation de bases de données
- Les requêtes
- Les statistiques descriptives, et séries temporelles
- Analyse multivariée (analyses factorielles, méthodes post-factorielles) - Codages et recodages de l’information : constitution de catégories (méthodes quantitatives et qualitatives)
- Représentations graphiques, cartographiques et réseaux des données historiques
Programme
Lundi 22 mai 2017
Les bases de données en histoire
9h00 Mots de bienvenue et tour de table de présentation
10h00 - 12h00 Conférence de Jean-Philippe Genet (Paris 1)
Les bases de données en histoire : approches historiographiques et épistémologique (10h-12h)
13h30 - 15h TP (salle informatique)
- Jamie Folsom (Harvard University), Découverte d’une base de données en ligne : http://www.cfregisters.org/
15h00 - 15h30 : Pause
15h30 - 17h TP (salle informatique)
- Présentation des recherches (problématiques, documentation, méthode envisagée)
- Installation des logiciels utilisés durant la formation
17h-18h Café statistique : rencontre autour du logiciel R
Mardi 23 mai 2017
Données et modélisation des données historiques
9h00 Retour sur les travaux de la veille et tour de table autour des lectures fournies aux participants
Lectures commentées :
- Jean-Philippe Genet, « Histoire, informatique, mesure », Histoire et mesure, 1-1, 1986, p. 7-18.
- Jean-Yves Grenier, Claude Grignon, Pierre-Michel Menger, Le modèle et le récit, Paris, Maison des sciences de l’homme, 2001.
10h00 - 12h00 Conférence de Stéphane Lamassé (Université de Paris 1) et Benjamin Deruelle (UQAM)
La modélisation informatiques et les « données » historiques
13h30 - 15h TP (salle informatique) : Modéliser : textuelle, images objets
- Lettres de Rémission (Cl. Gauvard)
- Les registres de commissaires (P. Serna)
- Les épées (archéologie)
- Les images d’Henri IV (D. Thomas)
15h00 - 15h30 : Pause
15h30 - 17h TP (salle informatique) : Implémenter
- Tables, champs et relations
- Formulaires et états
17h-18h Café informatique : Rencontre autour de la modélisation d’archives (XML)
Mercredi 24 mai 2017
Les requêtes
9h30 Retour sur les travaux de la veille
10h00 - 12h00 Conférence de Camille Salinesi (Université de Paris 1)
Exploiter les données : méthodes et pratiques
13h30 - 16h30 TP (salle informatique) : Les requêtes en pratiques
16h30 - 17h30 : Pause
17h30 - 19h00 Café statistique : Pérennité, archivage et transparence des données
- Valérie Shaffer (CNRS)
- Léon Robichaud (Université de Sherbrooke)
- Camille Salinesi (Université de Paris 1)
- Sean Takats (IEA de Paris - Roy Rosenzweig Center for History and New Media, George Mason University)
Jeudi 25 mai 2017
Une exploitation raisonnée des données historiques
La journée se tiendra exceptionnellement à la Maison Suger, Fondation Maison des sciences de l’homme, 16 rue Suger, 75006 Paris
9h00 Retour sur les travaux de la veille et tour de table autour des lectures fournies aux participants
Lectures commentées :
- Alain Desrosières, « Comment faire des choses qui tiennent : histoire sociale et statistique », Histoire & Mesure, 4-3 (1989), pp. 225-242. [http://www.persee.fr/doc/hism_0982-1783_1989_num_4_3_1358]
- Bernard Lepetit, « L'histoire quantitative : deux ou trois choses que je sais d'elle », Histoire & Mesure Année, 1989 (4-3), pp. 191-199.
10h00 - 12h00 Conférence de Julien Alerini et Gaëtan Bonnot (Université de Paris 1)
Base de données et statistiques
13h30 - 15h TP (salle informatique) : Décrire et interpréter ses données avec R
15h00 - 15h30 : Pause
15h30 - 17h TP (salle informatique) : Les analyses multidimensionnelles avec R
Vendredi 26 mai 2017
Bases de données, cartes et réseaux
9h00 Retour sur les travaux de la veille et tour de table autour des lectures fournies aux participants
Lectures commentées :
- Isabelle Rosé, « Reconstitution, représentation graphique et analyse des réseaux de pouvoir au haut Moyen Âge. Approche des pratiques sociales de l’aristocratie à partir de l’exemple d’Odon de Cluny († 942) », REDES- Revista hispana para el análisis de redes sociales, 21 (2011), en ligne [http://revista-redes.rediris.es/html-vol21/vol21_5f.htm]
- Hélène Noizet, Les plans d'îlots Vasserot, support d'un système de l'information géographique historique de Paris, EAV (Ecole nationale supérieure d'architecture de Versailles), 2009, 14, pp. 86-95. En ligne [http://hal-paris1.archives-ouvertes.fr/halshs-00419684/fr/]
10h00 - 12h00 Conférence de Léon Robichaud (Université de Sherbrooke)
L'ancrage spatio-temporel des données historiques
13h30 - 15h TP (salle informatique) : De la base de données à la production d’une carte (La base de données Adhémar)
15h00 - 15h30 : Pause
15h30 - 16h30 Bilan (salle de conférence)
16h30 - 17h30 Pot de l’amitié offert par l’Ambassade du Canada à Paris
|
Sociabilités urbaines et engagement politique à Paris au XVIIIe siècle 01 octobre 2016 - 30 juin 2017 |
|