Utiliser la production participative (« crowdsourcing ») pour explorer la morpholoige visuelle des lettres

Olivier Morin 

Pierre Déléage

Les créateurs de symboles visuels parviennent à créer des formes à la fois diverses et distinctes les unes des autres, en combinant entre eux un petit nombre d’éléments de base ; par exemple, dans les minuscules de l’alphabet latin, l’arche du « n » est répétée dans le « h », redoublée dans le « m », etc. Les symboles écrits sont des symboles combinatoires. Certaines écritures font de ce principe combinatoire un usage plus étendu que d’autres. Certaines, comme le Syllabaire Autochtone Canadien (dont voici un fragment typique : « ᐁᐘᑺᒪ ᓃᔩᓇ ») recombinent de multiples façons un petit nombre de formes de base. Dans d’autres, comme l’écriture Vai du Libéria (un fragment typique : « ꕉꕐꕮ ꔔꗌ  ꖸ ꔰ E« ), les éléments de base qui forment les lettres sont beaucoup plus nombreux, et rarement inclus dans la majorité des lettres. Nous cherchons à savoir dans quelle mesure les écritures font usage de ce principe combinatoire, et si elles l’utilisent de façon efficace ou non, l’efficacité revenant ici à créer des formes nombreuses quoique toujours distinctes. Or il n’existe pas de jeu de données approprié à cette tâche. Les typologies descriptives qui existent pour diverses écritures sont propres à une écriture donnée ou à quelquesunes, et autorisent rarement des comparaisons interculturelles. Pour contourner cette difficulté, nous aurons recours à la production participative de données (crowdsourcing), par le biais d’une app accessible par navigateur internet. Nous inviterons un grand nombre de participants à classer les lettres de systèmes d’écriture inconnus d’eux, selon des règles intuitives. Un système de points encouragera les participants à produire autant de classifications distinctes qu’ils le peuvent. Pour chaque écriture, nous ferons la liste des classifications les plus fréquemment proposées. Un tel jeu de classifications nous fournira une typologie utilisable pour répondre à un certain nombre de questions comparatives. Premièrement, nous serons capables de mesurer la régularité de diverses écritures : dans certaines la diversité des formes de lettres se laisse capturer par un petit nombre de règles, alors que d’autres sont rétives à des classifications aussi simples. Nous pourrons quantifier cette distinction de façon précise, et construire des modèles permettant de la prédire. Deuxièmement, nous chercherons à savoir dans quelle mesure la forme des lettres est aussi distincte qu’elle peut l’être. Dans n’importe quelle écriture, les éléments de base d’une écriture et par les règles présidant à leurs combinaisons définissent un espace des formes possibles. Il se peut que les lettres soient réparties de façon à être maximalement distantes, aux quatre coins de cet espace ; il se peut en revanche que toutes les lettres soient confinées dans un coin de cet espace. S’agissant des langues parlées, l’on sait que le premier principe l’emporte : la dispersion est maximale. Nous saurons s’il en va de même pour la forme des lettres. 

Projet précédent Projet suivant