École ATO 2020 : Formation intensive en analyse de texte assistée par ordinateur

Présentation

Avec la croissance exponentielle des documents textuels en format numérique, la recherche dans les sciences humaines et sociales (SHS) nécessite une plus grande maîtrise des modèles, méthodes et outils computationnels d’analyse de textes. Plusieurs disciplines en SHS s’intéressent à ces techniques : l’histoire, la sociologie, l’anthropologie, la philosophie, les sciences politiques, la psychologie, la linguistique, la sémiotique ou encore la philologie. Or l’apprentissage de ces savoir-faire est peu accessible dans ces cursus disciplinaires.

La formation intensive ici proposée sera donnée en mode laboratoire. Elle vise à répondre au besoin grandissant des étudiant.e.s des SHS quant à l’acquisition de l’ensemble des compétences nécessaires à l’analyse de corpus de textes numériques : collecte de données, prétraitement, modélisation computationnelle, analyse et visualisation des résultats.

À raison d’une journée d’apprentissage pratique par semaine pendant 8 semaines (du 10 septembre au 29 octobre 2020), cette formation intensive et individualisée est offerte à un groupe restreint d’étudiant.e.s qui bénéficieront de l’enseignement et du soutien d’experts situés à l’intersection des sciences humaines et de l’informatique. Un ratio moniteurs/étudiant.e.s très élevé permettra aux participant.e.s de mieux appliquer les acquis à leur propre corpus.

Objectifs

L’objectif principal de cette formation est d’initier à l’analyse de texte assistée par ordinateur (ATO) une nouvelle génération d’étudiant.e.s et de démystifier l’usage de certains outils informatiques développés en fouille de texte (Text Mining) pour la recherche en SHS. C’est pourquoi cette formation poursuit les objectifs généraux suivants :

  1. Fournir une formation académique enseignant les bases techniques et théoriques de l’ATO nécessaires à sa pratique
  2. Favoriser la formation d’étudiant.e.s adaptés aux humanités numériques
  3. Décloisonner l’usage des outils en ATO pour les SHS

Au terme de cette formation, les étudiant.e.s inscrit.e.s devraient :

  • Avoir une vue d’ensemble des techniques de l’ATO
  • Comprendre pourquoi et comment les sciences humaines s’intéressent à l’ATO
  • Analyser un corpus en utilisant les techniques de l’ATO
  • Savoir distinguer les différentes dimensions d’analyse d’un corpus (métadonnée, document, structure d’un document, annotation, unité lexicale)
  • Savoir appliquer les techniques et outils en ATO à différents corpus de recherche
  • Se familiariser avec les méthodologies de l’analyse de textes assistée par ordinateur (fouille de textes) et l’ensemble des opérations d’une  chaîne de traitement: collecte de données, prétraitement, modélisation, analyse, interprétation et visualisation
  • Maîtriser les rudiments de la manipulation de scripts dans le langage de programmation R
  • Se familiariser avec l’interopérabilité des données (importation/exportation) entre différents environnements

Programmation préliminaire

Jour 1 Jour 2 Jour 3 Jour 4
Présentations générales sur l’ATO et sur l’environnement de développement R Studio Introduction au langage R et initiation à l’analyse univariée en ATO Collecter, préparer, décrire et  annoter un corpus à des fins d’analyse La sémantique vectorielle et ses unités d’analyse; Méthodes d’explorations et bivariées (co-occurrences) sur les unités lexicales.
Jour 5 Jour 6 Jour 7 Jour 8
L’analyse des spécificités lexicales et recherche d’information; Séance de monitorat L’apprentissage automatique non-supervisé : méthodes de clustering pour l’ATO La réduction dimensionnelle et l’analyse des correspondances et évaluationTopic model, analyse sémantique automatisée, analyse diachronique et croisement entre méthodes

Équipe

Comité organisateur

  • Davide Pulizzotto, associé de recherche à Polytechnique Montréal et chercheur postdoctoral au CIRST (UQAM)
  • Maxime Sainte-Marie, chercheur postdoctoral au Danish Center for Studies on Research and Research Policy (Université d’Aarhus) et professeur associé au CIRST
  • Élias Rizkallah, professeur de sociologie à l’UQAM et directeur du Centre ATO (UQAM)
  • Jean-François Chartier, professeur associé au CIRST

Collaborateurs

  • Francis Lareau, doctorant en informatique cognitive à l’UQAM
  • Jean-Guy Meunier, professeur au Département de philosophie de l’UQAM et membre titulaire de l’Académie internationale de philosophie des sciences
  • François Claveau, professeur au Département de philosophie de l’université de Sherbrooke et titulaire de la Chaire de recherche du Canada en épistémologie pratique
  • Christophe Malaterre, professeur au Département de philosophie de l’UQAM et titulaire de la Chaire de recherche du Canada en philosophie des sciences de la vie

Partenaires de l’École ATO 2020

Contact

Pour toute information, contacter: ecoleato@gmail.com


INSCRIPTION – INFORMATION

Deux modes d’inscription existent pour ce cours :
1) cours crédité (FSH8050) de maîtrise (2e cycle) ou de doctorat (3e cycle)
2) formation libre.

*** Vous devez vous présenter avec votre ordinateur portable.

1) Modalités d’inscription comme cours crédité

Le cours FSH8050 est un cours offert par la Faculté des sciences humaines de l’UQAM.

Inscription

Pour les étudiants de l’UQAM, la proédure est la même que pour un cours facultaire. La personne ressource à la Faculté des sciences humaines est madame Chantal Vézina (vezina.chantal@uqam.ca).
Ce cours peut être ajouté à votre cursus de maîtrise ou doctorat. Renseignez-vous auprès de votre département.

Les étudiant.e.s des autres universités québécoises doivent faire leur demande d’inscription sur le site du BCI (entente interuniversitaire).

Admissibilité

Voici les conditions d’accès à ce cours :

  1. Être inscrit.e dans un programme de maîtrise ou de doctorat à l’UQAM ou ailleurs au Québec
  2. Posséder quelques notions de programmation informatique ou être intéressé.e à les apprendre
  3. Posséder des connaissances de base en statistiques descriptives et inférentielles

Sélection

Aucune sélection n’est effectuée. Toutefois, le nombre de places disponibles est limité.

Frais

Les frais applicables sont ceux correspondant à un cours de trois crédits.


2) Modalités d’inscription en formation libre

Même si l’école ATO 2020 est principalement dédiée à la formation d’étudiant.e.s, d’autres profils sont aussi acceptés. Les consignes qui suivent ne s’appliquent qu’à celles et ceux qui comptent s’inscrire en formation libre (voir plus haut les consignes pour ceux et celles qui souhaitent obtenir des crédits pour ce cours).

Inscription

Pour s’inscrire, il est nécessaire d’envoyer un courriel à ecoleato@gmail.com, avec comme objet Inscription formation libre et en pièce jointe les trois documents suivants :

  1. Curriculum vitae : formation antérieure, expérience de recherche, compétence en statistiques et en informatique, s’il y a lieu
  2. Lettre de motivation : pourquoi suivre l’école ATO 2020 ?
  3. Numérisation de la preuve d’inscription de 2e / 3e cycle OU d’affiliation à un établissement (université, collège, organisme privé, gouvernemental ou sans but lucratif), le cas échéant.

Admissibilité

Les conditions d’admissibilité et la procédure de sélection s’appliquent uniquement aux personnes qui désirent s’inscrire à la formation libre.

  1. Les candidat.e.s inscrit.e.s à la maîtrise ou au doctorat dans une université québécoise auront préséance sur les autres types de profils.
  2. Indiquer clairement les besoins qui incitent à participer à la formation ainsi que l’intérêt pour l’étude du langage (fouille d’opinion, sociolinguistique, analyse de discours, sentiment analysis, analyse de contenu, etc.)
  3. Avoir suivi un cours de base en statistiques descriptives (moyenne, écart-type, pourcentage, médiane, etc.)
  4. Compétences informatiques de base :
    1. Traitement de texte : copier-coller, rechercher-remplacer, raccourcis clavier, etc.
    2. Gestion de fichiers : opérations de tri, nomenclature de fichier/dossier, extension de fichier, etc.
    3. Connaissance minimale de Excel ou Calc : copier-répéter (poignée de recopie), opérations de tri et de filtrage, etc.
    4. Être intéressé.e par la programmation informatique de base
  5. Une bonne connaissance du français est exigée, puisque les séances sont exclusivement en français
  6. Avoir un corpus spécifique d’analyse est un atout

Sélection

Chaque candidature (en formation libre seulement) sera évaluée par le comité organisateur de la formation. Ce comité se réserve le droit de choisir les candidat.e.s en fonction des objectifs de recherche et de formation visés par la formation. Les candidat.e.s retenu.e.s seront contacté.e.s dans les plus brefs délais après la date limite de dépôt des demandes. Les candidat.e.s retenu.e.s devront suivre la procédure indiquée dans la prochaine section pour être définitivement admis.e.s à l’école ATO 2020.

Frais

Pour l’admission en formation libre, l’école ATO 2020 est offerte gratuitement, grâce au soutien du Conseil de recherches en sciences humaines (CRSH). Toutefois, les personnes sélectionnées devront envoyer un chèque de 200$, qui leur sera rendu à la mi-session. Le chèque de dépôt doit être fait à l’ordre de l’Université du Québec à Montréal et envoyé à :

CIRST
Université du Québec à Montréal
C.P. 8888, succ. Centre-ville
Montréal (Québec)
H3C 3P8

Les organisateurs du cours n’offrent aucun soutien logistique ou financier pour le déplacement, l’hébergement ou la nourriture des candidat.e.s.

Dates importantes (formation libre seulement)

  • Soumission de dossier : 15 juillet 2020
  • Annonce du premier tour : 1er août 2020
  • Confirmation d’inscription par les candidat.e.s par envoi du chèque : avant le 15 août 2020

Ce contenu a été mis à jour le 8 mai 2020 à 11 h 30 min.