[Projets 2018] GoOW – Guillaume Marrel (LNBC)

[Projets 2018] GoOW – Guillaume Marrel (LNBC)

📜 Titre : GoOW – Gouvernance des corpus scientifiques d’étude du Web 2.0

🧑‍🤝‍🧑 Équipe : 

  • Guillaume MARREL (LBNC) – Porteur
  • Martine LE FRIANT (LBNC)
  • BĂ©rengère GLEIZE (LBNC)
  • Samuel PRISO (LBNC)
  • Ouassim HAMZAOUI (LBNC)
  • Éric SANJUAN (LIA)
  • Pierre JOURLIN (LIA)
  • Malek HAJJEM (LIA)

📌 RĂ©sumĂ© : Toutes les donnĂ©es qui constituent et que gĂ©nèrent en continu, le Web 2.0 (Tillinac, 2006), sont caractĂ©risĂ©es par une grande instabilitĂ©, Ă  cause de la labilitĂ© de leurs cadres juridiques (Pellegrini & Canevet, 2012), mais aussi du caractère Ă©volutif des techniques informatiques dĂ©veloppĂ©es pour les saisir, ainsi que des opportunitĂ©s qu’elles constituent en termes d’analyses sociologiques et socio-politiques (Venturini & al., 2014). C’est dans cet environnement instable que nombre d’institutions universitaires et de recherche scientifique construisent et exploitent de larges corpus de donnĂ©es issus des rĂ©seaux sociaux numĂ©riques (RSN) et d’autres supports comme les blogs. Autrement dit, un ensemble de matĂ©riaux qui contrevient intrinsèquement et de façon croissante, non seulement aux conditions spĂ©cifiques d’usage de ces mĂ©dias aux contenus plus ou moins indexĂ©s, mais aussi Ă  la jurisprudence et/ou aux textes juridiques nationaux et europĂ©ens (Polidori, 2015 ; Foegle, 2017) qui instituent notamment le « droit Ă  l’oubli numĂ©rique » (Blanchette & Johnson, 2002 ; Dechenaud & al. 2015). Aussi, est-il possible que des chercheurs des sciences informatiques et sociales soient demain confrontĂ©s Ă  d’intempestives demandes provenant d’utilisateurs de RSN ; et dont l’objet serait l’effacement et le dĂ©rĂ©fĂ©rencement de tels ou tels de ces messages « publics ». Plusieurs universitĂ©s de renom international s’inquiètent dĂ©jĂ  de ce que la conservation de ces « archives numĂ©riques » par un organisme tiers puisse dĂ©boucher sur des plaintes. Ă€ cette Ă©volution de l’environnement des activitĂ©s numĂ©riques, s’ajoute la montĂ©e en puissance des logiques de data lock-in qui consacrent une tendancielle hĂ©gĂ©monie des dĂ©tenteurs de donnĂ©es et qui dĂ©multiplient les enjeux juridiques, scientifiques et politiques de la gouvernance des jeux de donnĂ©es. Prenons-en pour exemple les rĂ©centes Ă©volutions de la politique d’usage des donnĂ©es de Twitter, objet d’étude privilĂ©giĂ© (Smyrnaios & Ratinaud, 2013) de la « puissance sociale » (Elias, 1990) des RSN dans cet espace public du Web (Cardon, 2010) : sur la dernière dĂ©cennie, le “petit oiseau” a placĂ© l’accès aux donnĂ©es hors de la portĂ©e des capacitĂ©s d’investissement des acteurs publics de la recherche. Dès 2010 et 2012, et au terme de coĂ»teuses transactions4, seules les structures Ă  but lucratif comme Gnip, Datasift, Topsy, et NTT Data ont obtenu l’accès au firehose (le flux exhaustif de ses donnĂ©es brutes5) afin de produire des analyses poussĂ©es de datamining Ă  finalitĂ©s commerciales. Puis en 2014, Twitter a durci radicalement son modèle Ă©conomique par le rachat de Gnip et la fin de tous les accords conclus prĂ©cĂ©demment. La firme a pris diverses mesures pour dissuader les pratiques libres d’archivage de tweets et assure de façon monopolistique la revente de ces data Ă  des prix bien trop Ă©levĂ©s pour les utilisateurs Ă  finalitĂ©s scientifiques et/ou non-directement commerciales. Parmi ces derniers, les institutions de la recherche publique se retrouvent de facto empĂŞchĂ©es de procĂ©der Ă  une quelconque analyse scientifique des donnĂ©es de ces rĂ©seaux, de leur architecture, fonctionnement et usages.

đź’° Instrument : Projet blanc

🆔 Identifiant : 18-BLC-3