Entretien introductif
Ça sera facile, chercheur, dirait la donnée. Tu cherches à savoir ce que font les personnes, à quel moment, de quelle façon et les significations que renferment leurs gestes ? On dit que tu n’auras qu’à me lire pour que je te dise tout. Car ce que tu appelles gestes et significations, je les appelle variables. On dit que je vais vite et que je ne pèse rien, que j’arrive dans tous les foyers et pars de tous les écrans. On dit que grâce à moi tu ne pourras rien louper du monde.
À l’origine de mon travail de thèse, duquel je propose de tirer cet article, se trouve une commande de la part d’une équipe de chercheurs de la région toulousaine, ayant développé un « serious game ». Ces dispositifs, ou « jeux sérieux », sont des outils numériques pédagogiques, qui empruntent leur forme au jeu vidéo pour encapsuler des savoirs et les transmettre en situation d’apprentissage. Le jeu vidéo d’apprentissage présenté dans cet article est le fruit d’un ambitieux projet de recherche académique porté par une équipe de chercheurs et un groupement d’intérêt scientifique (GIS) pluridisciplinaires. Le jeu sérieux, destiné à des lycéens et des étudiants de la Seconde au bac + 3, présente au joueur un vaisseau spatial fraîchement écrasé à la surface d’une planète lointaine. La réparation du vaisseau devient alors prétexte à de petites activités d’entraînement à l’usinage et à la fabrication de pièces mécaniques. Lauréat d’un appel à projets national et objet d’expérimentations académiques successives, le projet scientifique de conception du jeu sérieux prit de l’ampleur entre 2009 et 2013 ; l’équipe universitaire se constitua progressivement pour réunir des chercheurs en informatique, en génie mécanique, en didactique et en psychologie. Je la rejoignis en 2013, en qualité de doctorant en sociologie. La commande formulée dans le cadre de cette thèse consistait à évaluer les usages qui étaient faits du jeu sérieux en classe, pour analyser la place et la fonction sociale de celui-ci dans la formation, ainsi que la capacité de l’outil à reconfigurer les activités de travail. Par ailleurs, les expérimentations déjà en cours dans les salles de classe et les dispositifs informatiques de suivi des usages semblaient assurer un accès facile et immédiat aux séances d’enseignement et aux traces informatiques de l’utilisation du jeu vidéo.
Entre 2013 et 2015, au cours des deux premières années de ma recherche, je constatai que la grande majorité des études sur l’usage du jeu sérieux se concentraient sur les utilisations qu’en faisaient les élèves et les étudiants. Moins nombreuses sont les recherches qui étudient les usages de ce jeu par les enseignants ou les acteurs institutionnels (comme les inspecteurs d’académie), pourtant en première ligne sur le terrain des innovations pédagogiques impulsées sur le plan national. En classe, ma méthodologie fut axée principalement autour d’une vidéo-ethnographie des séances de jeu, complétée par deux autres protocoles : l’analyse des données d’usage enregistrées par les serveurs informatiques du jeu sérieux situés dans les locaux universitaires de l’équipe de conception, de manière à en quantifier les usages ; ainsi que l’observation de l’activité professionnelle des enseignants au contact du jeu, à l’occasion d’une phase de test de celui-ci dans les établissements de formation d’une académie scolaire française [1] pendant toute une année scolaire. Si ces terrains devaient s’avérer « minés » (Albera 2001), ils ne furent pas stériles pour autant. Plutôt que de faire la chronique du double échec apparent qui advint quant à la quantification et l’observation des usages qui étaient faits du jeu, je montre dans cet article, comment, au regard d’une réflexion sur l’accès au terrain et les conditions de production de la recherche à l’heure des objets numériques, ces deux “accidents” sont en fait liés et productifs d’un point de vue heuristique.
Pourquoi parler de sociologie embarquée ? Lorsque je commençai ma thèse, le « serious game » en était à un moment crucial de son histoire : parvenus à la fin de son développement scientifique, les concepteurs et l’entreprise parisienne qui le développait engageaient la phase de mise en marché du prototype fonctionnel. L’embauche d’un doctorant en sociologie leur laissait alors espérer l’analyse rapide et opérationnelle des données d’usages, qui, au-delà de son intérêt scientifique, devait permettre aux concepteurs d’améliorer le dispositif en fonction des besoins des premiers usagers. La demande formulée par l’équipe de concepteurs m’embarqua donc au cœur des objectifs qu’ils poursuivaient, mais elle m’invita aussi à aller à la rencontre des bases de données informatiques que l’équipe de concepteurs commençait à produire en vue d’analyser plus tard les usages du prototype sur la base des traces informatiques laissées par les élèves. Le contact avec ces jeux de données m’inscrivit rapidement dans une vaste cosmographie d’objets informatiques et d’acteurs pluriels (équipe de concepteurs, inspecteurs académiques, partenaires industriels, enseignants, élèves et étudiants, etc.), composants de longues chaînes sociotechniques animées de multiples opérations de traduction.
En ce sens, les incidents de terrain montrent comment le sociologue se laisse également embarquer par les données numériques avec lesquelles il travaille et qui pourtant – comme ce fut le cas dans ma thèse – ne semblent pas centrales dans la recherche. Dans cet article, je défendrai donc l’idée d’une application du principe de « symétrie », défendu par la théorie de l’acteur-réseau, à la méthodologie ethnographique. Je considérerai “la data” informatique dans tout ce que cette métonymie charrie de croyances ; comme un acteur non-humain qui interagit avec les entités d’un réseau dont le chercheur embarqué est partie prenante, mais qui révèle aussi la dimension ethnographique des données informatiques, et la façon dont le chercheur construit son terrain d’enquête à leur contact.
Cette réflexion s’inscrit dans un double prolongement. Le premier est celui de la théorie de l’acteur réseau et de la réflexion qu’elle propose sur l’épaisseur sociale d’acteurs non -humains, y compris des données de la recherche (Latour, Woolgar 1988 ; Latour 1993), et sur les traductions que ces acteurs opèrent dans la stabilisation d’un réseau sociotechnique (Callon 1986). Le second prolongement est celui d’une interrogation de la relation d’enquête construite entre le chercheur et ces actants. La finesse de la relation d’enquête ethnographique tient à la capacité d’adaptation du chercheur par rapport au milieu social de l’enquêté, notamment en situation d’entretien (Beaud 1996). Dans le cadre d’une méthodologie symétrique, je proposerai donc d’analyser cette relation non plus par rapport à un enquêté humain, mais par rapport à la donnée informatique. Dans la continuité de l’anthropologie visuelle et digitale qui s’intéresse aux objets hypermédiatiques (Pink 2006, 2007) comme les données numériques, je proposerai d’adopter une posture réflexive sur les conditions de production des résultats (Renahy 2006), mais aussi sur l’incomplétude du contrat d’enquête (Fournier 2006) tacitement passé entre les données et le chercheur, et sur les systèmes de croyances, de confiance et de promesses véhiculés par ces données numériques (Cardon 2015). J’emprunterai néanmoins, par souci didactique, à l’anthropomorphisme qui sert souvent à qualifier la dimension agissante des données informatiques, pour les resituer, d’une part dans les représentations et actions humaines qui conditionnent leurs modes d’existence ; et d’autre part pour resituer ces données dans une réflexion épistémologique sur leur usage dans le processus de recherche. C’est le sens à donner à la métaphore que j’utilise pour parler “d’entretien” avec un actant ; car si tant est qu’on les fasse “parler”, les artefacts que sont les données numériques nous renseignent sur les humains qui les font et les utilisent.
Pour ce faire, j’évaluerai dans un premier temps les forces et les faiblesses heuristiques de ces actants, en discutant de ce qui tient à leur neutralité épistémologique et de leur mise sous contrôle, tout en considérant les “coûts de production” qu’ils engendrent pour la recherche. Dans un second temps, je présenterai les deux incidents qui ont marqué mon terrain, de manière à montrer en quoi peut consister une observation embarquée des données numériques, et comment en saisir la dimension socialement agissante par l’observation ethnographique. Enfin, je montrerai que l’enquête au contact des données numériques invite à “décadrer” le regard, en prêtant attention aux contrechamps du terrain, pour éviter que ces données ne fassent finalement écran à l’observation.
Forces et faiblesses heuristiques des données d’usage
Qu’est-ce qu’une donnée ?
Le dictionnaire Larousse (2013) définit une donnée [2] comme une « représentation conventionnelle d’une information en vue de son traitement informatique ». De prime abord, cette définition ne semble pas tant s’éloigner de celle d’une donnée de recherche scientifique, entendue comme l’expression d’une variable prédéfinie par le chercheur sous la forme d’un enregistrement factuel, dont l’intelligibilité ne préexiste jamais en tant que telle à l’identification de zones de méconnaissance du réel (Merton 1987) et à la production d’effets d’intelligibilité (Passeron 2006). Un point commun entre les données informatiques et les données scientifiques correspond au fait qu’elles « ne préexistent pas à leur ouverture » (Denis, Goëta 2016 : 12). Par ailleurs, une donnée informatique existe aussi sur le plan matériel : sur un disque dur, fait de métal inductif électriquement neutre, une donnée est un ensemble de minuscules surfaces polarisées par la traversée d’un courant positif ou négatif. Lues par un convertisseur analogique, ces petites zones polarisées sont converties en 0 ou en 1 composant le langage binaire, et forment une information. Le fonctionnement d’une mémoire flash est similaire, mais le disque métallique est remplacé par un matériau semi-conducteur. Physique ou langagière, une donnée est donc un artefact informationnel.
Dans le cas du jeu sérieux que j’observe, les joueurs génèrent deux types de données. Les premières sont très précises, et montrent la grande majorité des actions réalisées dans le jeu par le joueur : tel exercice est réussi, tel autre est raté, et ce à telle heure de tel jour. La progression des niveaux, les mouvements dans le vaisseau spatial, les gains collectés, ou l’augmentation des compétences du personnage représentent d’autres données appartenant à ce premier ensemble. Ces “traces” sont utiles aux analyses didactiques qui cherchent à produire une typologie des stratégies d’apprentissage des joueurs (Galaup, Amade-Escot 2014). Le second type de données regroupe les données accessibles par les usagers, en passant par Chamilo, la plateforme pédagogique qui héberge en ligne le jeu sérieux : on y trouve le score et le niveau de l’élève, le jour de sa première et de sa dernière connexion, et enfin le temps passé dans le jeu en « heure : minutes : secondes ». Toutes ces données informatiques sont stockées sur les serveurs informatiques dans les locaux universitaires des concepteurs (ill. 1) - énormes boîtes noires au sens le plus strictement latourien du terme - au côté d’autres applications de l’université (ENT ou courriels par exemple).
En dépit de leur apparente disponibilité, l’accès à ces données n’est toutefois pas évident. En traitant des processus d’ouverture des données dans l’institution publique, J. Denis et S. Goëta (2016) montrent que l’extraction et la transformation de données informatiques en artefacts intelligibles sont davantage inventées par à-coups exploratoires qu’automatisées. Les promesses de transparence, d’instantanéité et de facilité qui accompagnent souvent l’innovation numérique tendent au contraire à faire des données informatiques des « entités informationnelles à part entière », fétichisées (Denis et Goëta 2016 : 9), plutôt que des moyens d’atteindre l’information. Ces données ne sont pas sélectionnées puis lues à loisir, mais sont le fruit d’un procédé collectif d’exploration, une « enquête incertaine » (Denis et Goëta 2016 : 12) menée par la collaboration de métiers différents au sein de missions transversales dans les départements administratifs. S’ensuivent des opérations de nettoyage et de transformation des données, des choix quant aux caractéristiques à garder ou non afin d’inscrire les données dans « un univers de sens élargi » (Denis et Goëta 2016 : 21) commun à différents groupes d’acteurs. Ces processus suscitent donc des négociations permanentes dans, et entre, les groupes d’acteurs qui utilisent ces données. En ce sens, toute donnée « est toujours déjà socialisée » (Denis et Goëta 2016 : 27) par le biais des processus de son ouverture et de son intelligibilité, ce qui amène finalement J. Denis et S. Goëta à se demander « à quel moment » une donnée en devient une – plutôt que ce que serait une donnée. Une donnée est donc un artefact relationnel et interactionnel.
Mes nombreuses réunions avec l’ingénieure en informatique, membre de l’équipe de conception, pour identifier les données et inventer les formes de leur extraction et de leur nettoyage, m’ont rapidement fait prendre conscience, parfois même en amont du travail de recherche à proprement parler, de la complexité collective de ces opérations. Prises dans des enjeux techniques, scientifiques, professionnels, politiques et marchands, les données ne sont ni muettes, ni immatérielles, ni immobiles. Elles ne sont pas muettes, car dans les opérations de transformation et de nettoyage qui font leur intelligibilité, le choix des valeurs retenues définit l’information et dessine en creux des représentations et des logiques d’actions humaines. Elles ne sont pas non plus immatérielles, car comme nous l’avons vu, elles sont faites des fils, des serveurs, des boîtes noires, des ordinateurs et des écrans qui les donnent à voir, ainsi que de multiples outils qui en font des artefacts socialement façonnés. Enfin, elles ne sont pas immobiles, car comme nous le verrons, il est possible d’en produire des récits biographiques, et de transposer ainsi l’idée d’une vie sociale et observable des objets (Appadurai 1986 ; Bonnot 2004) à ces artefacts numériques. En ce sens, saisir par l’ethnographie l’épaisseur sociale des usages matériels et symboliques d’une donnée informatique revient à saisir de vastes réseaux sociotechniques locaux en tout point (Latour 1994).
Neutralité des données et coûts de production de la recherche
Cette interrogation des acteurs non-humains dans la production de savoirs scientifiques n’est pas nouvelle, puisque les Sciences et Technologies de la Société (STS) insistent depuis longtemps maintenant sur l’établissement d’un principe de symétrie généralisé, en vue d’analyser des réseaux hybrides humains et non-humains (Callon 1986). Leur mise en visibilité par les concepteurs du jeu sérieux sert à rassurer les enseignants et les responsables du monde de l’éducation sur la visée pédagogique, apparemment paradoxale, du jeu vidéo. Les enseignants en quête de progression de carrière extraient ces données pour justifier leur utilisation du jeu vis-à-vis de leurs hiérarchies. Les chercheurs analysent ces données pour les rendre intelligibles pour les concepteurs et les promoteurs du jeu, qui affinent leurs discours au fur et à mesure. Les exemples de terrain sont nombreux, et montrent que les acteurs humains et non-humains interagissent continuellement pour produire une réalité évolutive. La dimension agissante des données tient donc en la mobilisation et l’enrôlement de nouveaux alliés à la marge du réseau. Elles servent une fonction de traduction entre des mondes sociaux différents, pour serrer les mailles du tissu sans coutures (Hughes 1993) de l’innovation pédagogique. En cela, les données sont posées en « porte-paroles » traduisant la volonté de collectifs d’acteurs, ce qui nécessite d’en caractériser épistémologiquement le discours.
Une donnée informatique n’est pas une donnée scientifique, qui serait objectivée et mise sous contrôle, et ce, pour plusieurs raisons. La première, c’est que son existence tient à des choix relatifs à son nettoyage et à sa transformation, même lorsqu’elle est présentée comme « brute » (Denis et Goëta 2016). Une donnée informatique ne peut donc pas représenter une donnée scientifique sans l’objectivation et la justification de ces choix, qu’ils résultent du chercheur ou de négociations antérieures entre d’autres acteurs. Deuxièmement, une donnée ne peut être axiologiquement neutre, pas plus qu’elle ne peut moralement se positionner. N’étant jamais asociale, elle est fabriquée par l’agencement d’actions humaines qui actualisent des jugements de valeur, des croyances et des préférences. La donnée se situe donc dans un espace d’a-neutralité ; c’est l’objectivation de ses conditions de production et de ses représentations qui, dans un deuxième temps seulement, fait la neutralité de l’analyse qui en est faite. Troisièmement enfin, les données informatiques peuvent être qualifiées de données « de seconde main », s’exposant, comme les données statistiques par exemple, à d’importants risques d’interprétation (Dale 1993), en particulier lorsque le chercheur ne questionne pas le rapport qu’il peut entretenir à son objet, et que pour utiliser ces données il s’inscrit au sein des réseaux de coopération interdisciplinaire ou interprofessionnelle (de Saint Pol 2003).
L’usage des données invite alors à s’interroger sur le coût de la recherche, dans la mesure, notamment, où celle-ci nécessite de déployer d’importantes logiques de coordination entre les membres du réseau scientifique, qui s’inscrivent parfois dans des champs de compétences ou disciplinaires très différents. Sur le plan technique, comme sur le plan scientifique, la circulation d’une donnée n’est jamais parfaitement fluide, et génère des frictions. L’extraction et le nettoyage des données notamment, avant même leur analyse, supposent l’établissement de traductions pour transposer des programmes scientifiques d’une discipline à l’autre (de la sociologie au génie mécanique, à l’informatique, en passant par la psychologie, etc.). Pour les besoins de ma thèse, je dus par exemple rendre doublement intelligibles ces jeux de données, tant dans le cadre de mon analyse, que pour l’équipe pluridisciplinaire de concepteurs du jeu sérieux (didacticiens, professeurs de génie mécanique, ingénieurs informatiques entre autres) – même lorsque l’analyse de ces données d’usage révéla des dysfonctionnements pouvant être interprétés par l’équipe comme préjudiciables à la mise sur le marché du dispositif. Ces opérations ne sont pas impossibles. Mais la rencontre de catégories vernaculaires stabilisées dans des champs conceptuels différents, ou la confrontation de logiques d’actions potentiellement divergentes (scientifiques et commerciales, par exemple), représentent un coût important pour la recherche qu’il faut pouvoir arbitrer en fonction des bénéfices potentiels de l’analyse des données. Enfin, l’usage des données résulte d’un arbitrage sur la valeur scientifique d’une quantification systématique du réel ou des indicateurs utilisés (Filion 2012). Le rôle de l’expérimentateur est alors d’évaluer méthodologiquement les apports de cet usage, selon une équation méthodologique peu novatrice permettant toutefois de rendre intelligibles de grands systèmes sociotechniques stabilisés (valoriser l’observation a posteriori), ou de valoriser l’approche in medias res pleinement embarquée pour saisir les bifurcations en acte (Grossetti 2003).
Méthodologie symétrique : une ethnographie des données
Terrains minés, terrains minables ?
En regardant l’un des concepteurs du jeu vidéo m’ouvrir la salle des serveurs pour les photographier, je me dis que l’observation au contact des données informatiques mobilisait beaucoup de clefs. L’une de ces clefs était celle que le directeur de l’équipe devait utiliser pour ouvrir, au bas d’un petit escalier en colimaçon, une minuscule pièce dans laquelle les ronflements des serveurs chauds rivalisaient avec ceux de la climatisation. D’autres clefs, numériques, étaient celles détenues par l’ingénieure informatique de l’équipe de conception pour accéder aux tables de données générées par l’activité des usagers. Matérielles ou non, ces clefs montraient que les données pouvaient relier des réalités différentes comme le ferait une porte entre deux pièces. Y accéder supposait l’existence de situations d’interdépendances dans les collectifs de travail, pour déplier l’immense feuilletage sociotechnique qui allait des serveurs, situés au sous-sol, à l’ordinateur qui rendait visibles les données deux étages au-dessus. Quand tout fonctionne, nul besoin d’ouvrir ces boîtes noires. En cas de dysfonctionnement, cependant, les objets techniques révèlent leur dimension agissante (Akrich 1989, 1993). Ce fut notamment le cas lorsque survinrent consécutivement les deux incidents qui devaient marquer mon terrain.
Le premier incident vint de la découverte de l’impossibilité d’utiliser les données concernant les usages du jeu enregistrées par les serveurs entre 2012 et 2014. Pour comprendre cet incident, il faut pouvoir reconstituer le système de fonctionnement des serveurs : l’un des serveurs sert à faire fonctionner le « serious game », tandis que l’autre serveur sert à faire fonctionner Chamilo, la plateforme de Learning Management System (LMS) qui enregistre les données de jeu. Pour enregistrer les données concernant les usages du jeu, une requête informatique relie les deux serveurs. Cette requête consiste en un ordre, envoyé par le premier serveur au deuxième, pour lui demander de communiquer les informations dont il a besoin. Ici, le serveur de Chamilo demande à celui du jeu : « Que se passe-t-il dans le jeu ? » Le serveur du jeu répond : « Jean Dupont vient de jouer trois minutes trente. » Puis le serveur de Chamilo inscrit dans la ligne correspondante de la table : « À telle heure, à telle date, + trois minutes trente de temps de jeu, Jean Dupont ».
Mais cette requête informatique a dysfonctionné de manière aléatoire pendant la période d’enregistrement des données. En comparant des observations en classe, des témoignages d’élèves et d’enseignants et les données informatiques, je constatai au début de l’année 2016 qu’une partie des données n’était pas représentative des usages observés en classe. Pour autant, il m’était impossible de déterminer humainement ou techniquement quelles données étaient falsifiées sur l’ensemble de la population observée, parfois plusieurs années après la fin de l’utilisation du jeu [3]. À partir de la rentrée scolaire 2015, les concepteurs modifièrent les paramètres d’accès au jeu sérieux ; plutôt que de passer par une adresse Internet commune, chaque établissement devait désormais obtenir sa propre adresse Internet sur Chamilo pour accéder au jeu. L’architecture des tables de données fut transformée, créant une base de données séparée de la première, de manière à résoudre le dysfonctionnement de la première requête informatique (ill. 3).
Ces nouvelles tables de données étaient néanmoins très désorganisées ; les identifiants des profils étaient séparés de leurs données d’usages, qui étaient elles-mêmes éclatées en différentes tables. En avril 2016, l’ingénieure informatique de l’équipe et moi-même constatâmes lors d’une dernière réunion qu’il allait falloir réécrire un programme informatique destiné à recouper les différentes données éparses, opération impossible à réaliser avant la fin de l’été, date à laquelle mon calendrier de thèse ne me permettrait plus d’analyser de tels jeux de données. L’analyse des données, d’abord “empoisonnées” puis trop difficiles d’accès, nous fila entre les doigts.
La même année, un second incident survint. L’équipe de conception parvient à décrocher l’expérimentation de son jeu sérieux au sein d’une académie scolaire française pour l’année académique 2015 – 2016. Intéressé par l’innovation pédagogique que représentait le jeu vidéo, un inspecteur académique organisa l’utilisation du jeu par des enseignants de génie mécanique de l’académie, ainsi que leur collaboration à l’enquête sociologique. Pendant l’année, l’académie finança l’achat des licences individuelles d’utilisation du jeu, en échange de quoi les enseignants s’engagèrent à relever leurs données d’utilisation du jeu en classe sous la forme d’un carnet de bord quotidien. Je me rendis dans l’académie pour lancer l’expérimentation en septembre 2015, et m’apprêtai à y retourner au mois de mars 2016 pour recueillir les données et faire passer des entretiens aux enseignants participants. Mais, au début du mois de mars, je constatai que les taux d’utilisation du jeu étaient remarquablement faibles. Je contactai l’inspecteur académique qui m’informa par téléphone que la journée qui avait pour objet de débriefer l’usager du jeu à l’issue de l’année scolaire était annulée. Les enseignants déclarèrent que des problèmes de connexion depuis les établissements étaient en cause, ce que l’inspecteur considéra comme une manifestation de « résistance » de leur part vis-à-vis de ce qu’ils considéraient comme des « machines à gaz », à savoir les vagues annuellement renouvelées d’expérimentations lancées par l’Éducation nationale. Il en résulta néanmoins l’impossibilité pour moi d’accéder aux enseignants pour comprendre les mécanismes de ce rejet apparent [4]. Cette fois, les données ne mentirent pas, elles ne furent tout simplement pas au rendez-vous. Les tables montrèrent des taux d’utilisation minimes, qui semblaient s’inscrire dans une logique institutionnelle et professionnelle qui m’éloigna du terrain d’enquête plus qu’il ne m’en rapprocha.
Ces incidents sont représentatifs d’un terrain miné, mais pas minable pour autant. Ni raté, ni vide de significations, ce terrain s’avéra au contraire particulièrement fécond, déployant un matériau d’analyse riche. En effet, ces incidents renseignent sur le feuilletage sociotechnique qui enrobe le contexte d’usage du jeu sérieux. Ils sont notamment révélateurs des situations de médiation, d’enchaînement et de stabilisations locales qui forment les mailles d’un réseau sociotechnique reliant le laboratoire de conception aux mondes industriels, politiques institutionnels ou professionnels qui prennent part aux processus l’innovation pédagogique. Dans le premier cas, la requête dysfonctionnelle contraria autant les plans de la recherche que ceux d’une mise en marché du dispositif appuyé par l’analyse des usages. En creux, elle rendit visibles les espoirs que l’équipe faisait peser sur elle et les aboutissants du projet scientifique et pédagogique du jeu sérieux. Dans le second cas, l’absence des données attendues révéla paradoxalement l’établissement d’ordres locaux, comme autant de résultats des logiques professionnelles et institutionnelles par lesquelles les enseignants se réapproprient des marges de manœuvre vis-à-vis des injonctions ministérielles à l’innovation pédagogique (Potier 2018).
Le renouvellement de mon analyse, nécessaire au regard de ce que je perçus d’abord comme deux échecs successifs, réorienta ma problématique de thèse sur les usages que faisaient l’ensemble des acteurs du réseau d’innovation du jeu sérieux : promotion politique, négociations professionnelles, valorisation d’un projet académique pour une équipe scientifique, etc. L’analyse renouvelée de ces médiations plaça les données numériques, ou leur absence, au cœur de l’analyse des cours d’action humains et du processus de recherche. Comme actants, elles s’inscrivaient dans une culture matérielle de recherche dépassant le seul répertoire instrumental (Vinck 2006) par leur dimension normative et conceptuelle. Elles mirent en exergue l’importance des structures immatérielles (théoriques et conceptuelles) qui les composent, et coproduisirent le terrain et les conditions de production des résultats.
Mener un entretien avec un actant
L’observation ethnographique s’articule autour d’un entretien non directif, conjugué à l’observation du milieu dans lequel il se déroule. L’avantage de l’entretien est de concevoir que la donnée encapsule des représentations humaines profondément déposées, et que ce qui apparaît comme des incidents ou des échecs sont des formes d’interactions à elles dans l’élaboration de la recherche. Procéder alors par l’approche biographique de cet actant pour en faire le récit de vie (Bonnot 2004) permet d’interroger en premier lieu les procédés de son identification, de son extraction ou de son instauration en élément intelligible, et les infrastructures qui permettent de la produire, de la stocker, qui l’autorisent à bouger d’un lieu à un autre ou à se donner à voir.
Imaginons le chemin que suivraient les données informatiques [5], dans le cas d’une utilisation du jeu par un élève ou un étudiant. Ce dernier met en tension l’ordinateur dans sa salle de classe [6] et s’identifie pour démarrer le système d’exploitation de la machine. En s’identifiant, il envoie une requête au serveur de son établissement scolaire qui gère les identifiants des élèves, et autorise le démarrage de l’ordinateur. De là, l’élève lance un navigateur Internet et tape l’adresse pour se rendre sur la plateforme Chamilo. En s’y connectant, l’élève envoie une requête qui est envoyée sur un second serveur de son établissement, en charge de la sécurité, et qui étudie l’adresse de destination souhaitée. Après vérification, le serveur valide la demande de l’élève et autorise le navigateur à accéder au réseau Internet, à l’extérieur de l’établissement. L’adresse de la plateforme Chamilo envoie ainsi l’élève sur le premier serveur situé en région toulousaine, dans les locaux des concepteurs du jeu, qui lui demande une nouvelle authentification pour accéder à son profil individuel sur la plateforme. Ces identifiants sont créés par l’entreprise qui commercialise le jeu, ils sont individuels et obligatoires pour accéder à Chamilo puis au jeu sérieux.
À ce stade, les données entrent en phase de traitement sur les serveurs universitaires. Sur Chamilo, le profil individuel donne accès au « cours » du jeu sérieux, que l’élève sélectionne, et le jeu démarre. L’élève vient de basculer sur le second serveur, celui hébergeant le jeu vidéo qui, au fil des requêtes qui lui sont envoyées — les actions dans le jeu de l’élève —, inscrit les données de progression dans le jeu sur un ensemble de tables de données. Chaque seconde, l’élève envoie des données vers ce serveur. Elles transitent par l’ordinateur de l’élève, l’architecture réseau de son établissement et celle des locaux universitaires des concepteurs puis, à la même vitesse, elles reviennent vers l’élève. Le jeu réagit en fonction de l’action de l’élève, son parcours apparaît sur la plateforme Chamilo et permet le suivi en ligne par l’enseignant. Par la suite, chaque action dans le jeu suit le même chemin vers les serveurs universitaires, pour retourner ensuite vers l’apprenant. De nombreuses données sont ainsi inscrites dans les tables de sauvegarde des concepteurs, dont une partie est visible par l’enseignant afin de suivre la progression des élèves sur Chamilo.
Cette approche biographique donne à voir un système d’enseignement connecté en tout point, permettant la libre et rapide circulation des données informatiques, et assurant le recueil et la lecture panoptique des actions humaines. Du point de vue de la donnée, les actions humaines s’effacent derrière la fiabilité d’une machine automatisée, dans laquelle les entrées et les sorties sont reliées par un réseau technique stable : rapidité, facilité, modernité. Mais alors que ce discours attribue une prévisibilité aux objets informatiques mécanisés et une imprévisibilité aux humains, les incidents que j’ai décrits dans cet article montrent au contraire l’imprévisibilité des actants au sein de permanence de structures sociales et organisationnelles humaines, supposant que la technique est parfois la première à résister à l’innovation (Cochoy 2011). Ici, il s’agit d’une requête informatique qui dysfonctionne, ou de connexions fastidieuses réappropriées au sein de négociations professionnelles.
Le récit biographique ne fait pourtant pas suffisamment parler les données, bien qu’il permette de circonscrire le milieu à observer. Il manque encore à l’analyse la définition de la programmation temporelle, de la scène et de la distribution des acteurs (et des actants). Il n’y a pas d’heure, à proprement parler pour faire parler les données, mais la spécification de l’unité de temps importe selon que l’on place l’observation dans le temps court de la donnée (celui de son voyage en un clic) ou dans le temps plus long des activités humaines (la mise sur le marché du jeu sérieux). L’unité de lieu, elle, est tout aussi relative, mais elle invite à interroger la situation de l’artefact observé dans les environnements matériels qu’il occupe. Enfin, l’unité d’action revient finalement à interroger les logiques d’actions des acteurs en présence, et la façon dont les actants sont faits, ou font faire, à l’échelle des micro-tâches composant l’activité (Rot 2006), comme à l’échelle la stabilisation du système sociotechnique (Akrich 1989). Dans cette mesure, le décadrage et le contrechamp sont moins des effets de style que des opérations nécessaires à l’observation directe du milieu sociotechnique de la donnée, permettant de déconstruire les évidences des énoncés qu’elle porte (Latour, Woolgar 1988).
Éviter que la donnée fasse écran à l’observation
Décadrage et contrechamp : le travail du cadreur
L’enquête au contact des données nécessite pour le chercheur de se prémunir contre toute fétichisation des données, tout en restant conscient que le champ d’observation ainsi offert dessine un contrechamp bien plus grand à saisir pour se prémunir de tout risque de surinterprétation (Lahire 1996). Dans le cadre de mon terrain, j’identifie ainsi trois contrechamps, trois angles d’observations, qui permettent de contextualiser l’usage et la production des données, et dont l’analyse constitue une part intégrante de l’élaboration de leur significativité.
Le premier angle d’observation est celui du jeu vidéo : il montre bien la constitution du jeu et les mouvements de l’apprenant, mais il tait les contextes sociaux et techniques présidant à son usage. Pour observer le jeu sérieux en tant qu’objet technique, j’ai travaillé quatre ans au contact de l’équipe de conception, afin de recueillir des informations sur la constitution de l’outil, son cycle de développement, les arbitrages dont il avait fait l’objet, ainsi que les usages de l’outil qu’ils avaient prévus au cours du processus de conception. Cette observation ethnographique plus classique a porté sur l’observation des locaux, la culture matérielle, les réunions de projet et les processus de coordination des individus, et s’est conclue par quatre heures d’entretiens avec les deux concepteurs du jeu. Aussi l’ethnographie de ces dispositifs techniques permet-elle de caractériser les environnements techniques des mondes sociaux de la conception à l’usage.
Le second angle élargit un peu le champ, il montre l’ordinateur, le professeur ou les concepteurs qui travaillent ensemble à mettre en place le jeu et à le faire exister, à lire les traces laissées par les élèves pour rétroagir dans l’élaboration de leur activité. Le jeu est toujours dans la pièce, ou bien il se dessine en toile de fond et sert de motif aux actions, on le devine comme support de construction de l’activité. Cette activité fut captée par ma caméra ou mon appareil photo, mais aussi par les entretiens avec les individus, ou notée dans les pages de note de mes carnets de terrain. Mais surtout, elle fut contextualisée par une description fine du décor dans lequel elle se déroule, un décor qui était constitué des politiques publiques de numérisation du système de formation, des impératifs techniques locaux, des considérations pédagogiques propres à chaque protagoniste présent, ou des logiques économiques qui animent leurs dialogues [7]. J’appuyai cette observation sur l’analyse d’un corpus de littérature grise et des ressources numériques déployées par l’État à l’intention des personnels éducatifs, pour discerner les logiques de numérisation de l’apprentissage et les débats financiers et logistiques suscités, ainsi que les registres de justification institutionnelle censés impulser les processus d’innovation pédagogique.
Troisième angle enfin : c’est un plan large qui donne à voir les apprenants en train d’utiliser le jeu avec leur enseignant, à la marge du réseau d’innovation. On y comprend le déroulement du processus d’innovation dans sa complexité, entre horizontalité et verticalité, toujours séquencé et simultané en tout lieu. Pour cette observation pragmatique du travail « en train de se faire » (Bidet 2010), j’ai mis en place un dispositif vidéo-ethnographique composé de deux caméras filmant la classe en plan large et un groupe d’apprenants en plan serré. Dans la classe, on voit la signification de postures répétitives dans l’apprentissage et la structuration des relations sociales incluant l’outil technique (Bateson 1977). Comme avec des champs et des contrechamps, on comprend alors que les lieux d’usage et de production des données informatiques font partie du même agencement : des acteurs communs s’y croisent et s’y répondent, et les données supportent l’établissement de chaînes d’action parfois transversales au réseau.
Observation directe du milieu sociotechnique
L’observation directe du milieu sociotechnique dans lequel se trouvent les données représente donc un décadrage nécessaire du regard pour permettre, ensuite, d’identifier une série de contrechamps heuristiques utiles à son analyse. Premièrement, quelles informations apporte l’ethnographie du milieu sociotechnique au sein duquel se déroule l’entretien (Beaud 1996) ? Deuxièmement, que dit la donnée des schémas de perception et des logiques d’action des acteurs qui gravitent dans son champ ? Troisièmement, quels idéologies et systèmes de croyances permet-elle d’actualiser ?
Interroger les données nécessite d’ouvrir les boîtes noires au sein desquelles elles circulent – les architectures réseau locales – pour déconstruire leur cadre d’usage sociotechnique (Flichy 1995). C’est ce que je dus faire avec les serveurs de l’équipe de conception pour comprendre de quelle façon dysfonctionnait la requête informatique, mais également avec les architectures locales des établissements qui utilisaient le jeu. Or, l’analyse de ces environnements matériels est consubstantielle à celle des politiques publiques qui les engendre. Ainsi, l’étude d’un corpus de littérature grise [8] sur les politiques publiques de numérisation du système d’enseignement montre que chaque partie de ces architectures ne sont pas financées pas les mêmes organismes (département, région, État), ni au même moment. Cette absence d’uniformisation des financements publics d’équipement donne lieu, par exemple, à des situations dans lesquelles la bibliothèque de l’établissement bénéficie d’un meilleur débit Internet que les salles de classe, car elle a bénéficié à un moment donné d’un financement spécifique ne couvrant que cette partie du bâtiment.
Ce type de situation entraîne les enseignants à adapter leurs usages du jeu, soit en l’abandonnant, soit en le reportant à l’extérieur de la classe. Par ailleurs, ces politiques publiques s’accompagnent d’une multiplication des sigles, des procédures techniques, et plus globalement des procédures institutionnelles liées à l’innovation pédagogique (multiplication des outils, des journées de formation, des injonctions d’usage, etc.). En remontant le chemin par lequel aurait dû me parvenir la donnée (dans le cas de l’expérimentation académique, par exemple), je vis se dessiner un faisceau d’indices expliquant le désengagement des enseignants vis-à-vis de l’utilisation du jeu. Leurs espaces de travail se dématérialisent et s’hyperspécialisent (Monjaret 2006), ce qui diminue la probabilité d’une appropriation matérielle et symbolique uniforme par l’ensemble des enseignants.
Par ailleurs, le chemin emprunté par les données permet de cartographier le système sociotechnique et ses différentes ramifications, montrant l’ensemble des acteurs impliqués dans la conception à l’usage du « serious game », ainsi que leurs logiques d’actions. Cette cartographie donne à voir trois grands pôles : les lieux de conceptions habités par les porteurs de projet initiaux, les canaux de diffusion de l’innovation et les acteurs clefs de la mise en marché du jeu, et les lieux d’usages du jeu sérieux en situation d’apprentissage (ill. 4).
En tant qu’observateur privilégié, de par mon accès aux jeux de données, ces dernières me placèrent dans une position d’intermédiaire entre les usagers et les concepteurs, notamment pour faire transiter l’information dans un sens ou dans l’autre. D’une certaine façon, je me retrouvai embarqué par les données, inscrit dans le collectif de leurs usages. Mais ces données informatiques devinrent aussi un moyen d’accès privilégié aux logiques d’action des membres du réseau. Prenons l’exemple de la structuration des tables de données. Quand la structure de ces tables fut repensée en 2015 pour fournir à chaque établissement une adresse Internet personnalisée, il fut possible d’identifier, dans le désordre informatique qui en résulta, la collusion de visées différentes. Pour l’entreprise parisienne qui produisait le jeu et structure les tables de données, l’objectif était de viser la satisfaction rapide des clients, donc personne ne pensa à rendre les données accessibles ou intelligibles pour les chercheurs de l’équipe. Pour les concepteurs, l’ambition était de valoriser le produit efficacement, tant pour séduire de nouveaux usagers potentiels (enseignants ou institutions), que sur le plan scientifique, dans le cadre universitaire. Ils se retrouvèrent alors pris entre deux impératifs contradictoires ; augmenter rapidement la qualité de service pour les usagers, ou prendre davantage pour m’aider et favoriser l’analyse scientifique des données concernant l’utilisation du jeu. En d’autres termes, la structure des bases de données permet ici de retracer en creux la chronique d’une bifurcation au sein du réseau sociotechnique, et donc les logiques d’action animant plusieurs groupes d’acteurs à travers leurs empêchements mutuels.
Par ailleurs, les données sont significatives par le simple fait d’exister ou non. Par exemple, si très peu de données concernant l’utilisation du jeu furent enregistrées dans le cas de l’expérimentation académique, je pus quand même valider une hypothèse résultant d’observations antérieures : certains enseignants, plutôt jeunes, s’investissaient fortement dans ces projets d’innovation au côté de l’inspecteur académique dans une perspective de progression de carrière. C’était l’un des facteurs qui expliquaient que peu de classes avaient utilisé le jeu, mais que celles qui l’avaient fait s’étaient activement engagées dans l’expérimentation. Cela signifie qu’en tout point du réseau se jouent des négociations et des stratégies [9], comme ici sur le plan socioprofessionnel (Potier 2018).
Enfin, les données relatent des systèmes de croyances, des jugements de préférence et des structures de perceptions pour lesquels plusieurs niveaux d’analyse sont possibles. Dans le cas qui m’occupe, un premier niveau d’analyse consista ainsi à relever que pour chaque profil, les tables étaient composées des variables « expérience », « Pièces d’or » (servant de monnaie dans le jeu), « point », « score » ou encore « succès ». Ces marqueurs pragmatiques de jeu (Genvo 2011), culturellement situés dans la sphère ludique, renfermaient une idéologie compétitive aux valeurs masculines qui n’étaient pas sans rappeler les rapports désormais bien balisés entre genre et jeu vidéo (Lignon 2015). Mais on relève aussi que ces tables servent à l’enregistrement compulsif des actions des apprenants dans chaque activité, rendant ainsi visible une partie du travail des concepteurs ayant consisté à rendre le jeu vidéo, en tant que dispositif pédagogique, intelligible pour l’enseignant désirant monitorer la progression pédagogique de sa classe. Aussi ces données montraient-elles le rôle de traduction qu’elles occupaient pour reterritorialiser le jeu dans la sphère sérieuse de l’enseignement. Un second niveau d’analyse pourrait alors relever le paradoxe entre le retour de ces marqueurs culturellement situés de réussite chiffrée, de tableaux de scores publics et de compétition explicite, dans un système éducatif qui bannit, depuis plusieurs dizaines d’années déjà, notes et classements entre élèves. Enfin, un dernier niveau d’analyse permet d’éclairer ce paradoxe à la lumière des jugements de préférence et des croyances qu’instiguent les promesses formulées par les promoteurs des dispositifs numériques : rapidité, efficacité, facilité, modernité. Paradoxe culturel ou non, le jeu sérieux fait miroiter la promesse d’un apprentissage performant.
De cette façon, l’approche anthropologique, les entretiens, la production d’image et l’analyse des systèmes techniques permettent de redonner de l’épaisseur et de la chaleur à des données initialement muettes ; le chercheur s’affranchit de données qui, affichées seules, faisaient écran à l’analyse.
Entretien conclusif
En réalité, dirait la donnée, je suis faillible. Mes variables résultent de catégories de jugements humains et comprendre les croyances qu’elles portent est déjà un résultat en soi. Le processus de mon écriture passe par des fils dont je ne sais pas toujours d’où ils partent, dans quels lieux ils arrivent, ni même s’ils passent par des interrupteurs ouverts ou fermés. Depuis mon cyberespace, j’ai le loisir de m’étendre à volonté, mais je ne suis pas l’outil révolutionnaire qui permettrait de relier des réalités éloignées, de donner pleine vision aux actions individuelles, d’être crue sur parole. Je ne peux tenir ces promesses que d’autres ont faites pour moi.
Fortes sont les croyances de celui qui se porte au-devant des données informatiques pour la première fois : elles seraient faciles d’accès et de compréhension, dématérialisées et instantanément accessibles pour tous, tout en servant des fonctions panoptiques qui seraient presque sans limites. Néanmoins, la mise à distance de ces prénotions possède une portée heuristique qui vaut autant pour l’analyse finale que pour le procédé de recherche lui-même. Leur déconstruction permet de saisir les espoirs que le chercheur peut placer dans les données numériques, le conduisant à mal mener son entretien et à ne plus pouvoir les faire parler. Ce faisant, ces apparents échecs – dont la chronique mériterait d’être faite dans le cadre de chaque recherche – deviennent des incidents heuristiques parés d’une vertu méthodologique.
Cette expérience de recherche au contact de données qui s’avérèrent tantôt “empoisonnées”, tantôt fuyantes, montre que la technologie ne facilite pas nécessairement la recherche, et tend parfois à la complexifier. Par ailleurs, il ne semble pas nécessaire au chercheur d’innover en matière de méthodologie pour observer ou utiliser des innovations technologiques. Bien au contraire, la résolution des incidents qui ont ponctué ma recherche n’aurait pu se faire sans l’affirmation du caractère ethnographique de ces données informatiques, tant par les significations symboliques dont elles sont porteuses que par la matérialité et les actions humaines qui caractérisent leurs conditions d’existence.
« Décidément, on ne devrait jamais parler de “données”, mais “d’obtenues” », note habilement Bruno Latour (1993 : 188) [10]. En l’occurrence, les données sont des artefacts informationnels construits en porte-paroles bien éloignés des standards scientifiques de neutralité, d’homogénéité et de reproductibilité. Des incidents à la production des résultats, il m’a donc fallu considérer ces données informatiques comme des actants avec lesquels construire la méthodologie d’enquête ethnographique, sans les fétichiser, ni les désincarner, mais en cherchant à saisir leurs aspects techniques, matériels, et symboliques par le recours d’un strict principe de symétrie appliqué à l’approche qualitative. Cette observation multisituée répond ainsi à des exigences d’ordre scientifique, mais aussi d’ordre pratique, dans la mesure où l’analyse de données informatiques suppose celle, plus complexe, d’usages éclatés et asynchrones au sein de vastes réseaux sociotechniques. La sociologie embarquée au cœur des données numériques vise donc la continuité de l’observation par une narration anthropologique qui tient le terrain auprès d’elle, ainsi que le dépassement des positionnements moraux activés par les acteurs ou inscrits dans les objets.