notes

L'internet culturel c'est maintenant

Internet : le choix culturel se fera à Genève.
Y sommes-nous préparés ?

 

L'internet est tellement intimement lié à notre vie économique, culturelle, politique quotidienne qu'il les conditionne. Le Dr. Lessig a dit "la constitution de l'Internet est dans le code", c'est à dire dans ses standards. C'est ce qui se jouera en fait à Genève. Nous avons notre mot à dire. Si nous le disons nous serons sans doute entendus par les ingénieurs et les politiques qui sont réellement responsables et qui n'ont jamais eu un tel forum pour nous entendre.

La question fondamentale est celle des noms de domaine multilingues. Pour de multiples raisons elle doit - enfin - être résolue cette année. Elle le sera dans tous les cas à l'usure. Aprés des années de travail trop souvent seulement technico/politique par absence d'une entité culturelle au sein de l'ISOC (l'ISTF a été fermée). L'ouverture permise par l'IGF et la coopération de l'UIT pour cette réunion étaient trés attendues pour ceux qui veulent représenter l'usage et les cultures au sein de l'IETF.

L'on peut penser qu'une technologie informatique se préoccupe à priori peu des langues et des cultures. Ce n'est pas totalement exact au niveau de la technologie du réseau internet (à ne pas confondre avec les applications séparées que l'on assimile souvent à lui). L'internet est le niveau qui permet d'accéder à des ordinateurs distants avec un numéro "IP" souvent trouvé à partir d'un nom de domaine et qui peut rendre compte de ses opérations par e-mail. Viennent au-dessus le web, les téléchargements, skype, le spam, etc. Ce qui intéresse nos amis de l'UIT est le niveau internet lui-même.

Rendre d'évidence le besoin du support linguistique

L'Internet est ce que techniquement l'on appelle "linguistiquement biaisé". Ceci vient du fait qu'il utilise des mots au coeur de ses protocoles ("To", "From", "Subject" font partie de la technologie Internet. Les autres technologies utilisent en général des chiffres). Ceci crée des contraintes techniques inhabituelles. Ceci donne, sans raison particulière, une prédominance certaine à l'anglais pour ce qui concerne la culture technique (développeurs, clavier, formation, support, etc.).

L'effort de multilinguisation de l'Internet passe donc d'abord par la suppression de ce biais. Ceci est possible car l'architecture internet est vieillissante. Plusieurs grandes réflexions (UIT, NSF, IAB, etc.) sont engagées pour la reconstruire. Notre effort est donc un effort et une aide d'entraînement pour que cette réflexion envisage la multilinguisation dès l'abord. Plus des applications et des usages vernaculaires seront demandés, supportés et acceptés par tous, plus la composante linguistique et la prise en compte des cultures seront d'évidence aux architectes des projets NGN, GENI, Internet 2 qui conduiront au nouvel internet universel.

Le problème des suffixes des noms de domaine linguistiques

L'usage de l'internet est linguistique en ce qu'il use des noms de domaine, qui conditionnent la langue, le style, les moyens (claviers) utilisés par les sites et les services. Il est fondamental à la défense des cultures que ces noms de domaine cessent le plus rapidement d'atrophier les langues par une écriture limitée à "0-Z". Tout le monde en est d'accord. Mais comment faut-il faire ?

La réunion de Genève permettra de faire le point sur ce sujet, les différents protagonistes étant présents.

Il y a deux niveaux : celui des caractères et celui des langues. Nous entendrons des présentations au niveau des langues (multilinguisation) pour la protection de la propriété intellectuelle, par exemple. Mais le débat sera essentiellement celui des jeux de caractères (internationalisation).

L'IETF a proposé une solution technique qui permet de supporter les caractères Unicode. Mais elle laisse une difficulté majeure : pour des raisons de contrôle politique les suffixes des noms de domaine (.com,.net,.org, .sn, .cn, .fr, etc.) sont restés en ASCII: on a donc des noms "chinois.cn", "cyrilique.ru", etc. ce qui rend ces noms très peu utilisés. La pression est actuellement très forte pour trouver une solution.

Deux solutions techniquement sont proposées. Elles sont controversées et un projet de test est prévu par l'ICANN et l'IAB pour en savoir plus. Elles ne sont pas controversées quant à leurs mérites techniques. Mais n'ayant pas été planifiées, la mise à niveau des moyens et la réaction aux changements commerciaux soulèvent bien des questions.

L'impact culturel du choix technique pour les suffixes linguistiques

Il se trouve que ces solutions ne sont culturellement pas neutres. Et donc que le REDILI a une réflexion à conduire.

- la première utilise des "DNAMEs". Ce sont en fait des alias. Les utilisateurs entrent un nom de domaine "nom-en-chinois.suffixe-en-chinois" qui est transcodé en caractères "0-Z". Le "suffixe-en-chinois" transcodé a été entré comme un DNAME (alias) de ".com" dans les tables. Il est dans un premier temps traduit en ".com". La demande est ensuite recommencée de façon standard.

- la seconde consiste à considérer que le suffixe transcodé, est un suffixe à part entière. Du même niveau que .com, .net, .us, etc.

La première solution fait qu'il reste 260 registres commerciaux de suffixes. La seconde qu'à terme il peut y en avoir des dizaines de milliers, qui a priori seront des associations linguistiques. Nous sommes là dans la pleine application de l'encapitation linguistique.

Un exemple

Imaginons le Bambara. Si l'on veut un nom de domaine en Bambara,

- dans la première hypothèse on se tourne vers un vendeur de ".com" en Bambara. Pour $ 20 payés au revendeur et à Verisign Inc. Dans un contexte internationalisé où toutes les langues se côtoient, avec des conflits d'écriture. Mais "IBM" sera enregistré qu'une fois dans chaque écriture (environ 100).

- dans la deuxième hypothèse on pourra se tourner vers l'association de défense du Bambara, qui proposera (comme le fait ".cat" pour le catalan), un nom de domaine en ".bam". L'on ne pourra enregistrer que des mots en bambara. Et donc soutenir une politique culturelle. Tout en ayant des subsides pour cela. Si IBM s'interesse aux clients parlant bambara il lui appartient de payer les $5 ou $10 d'une adhésion annuelle.

Le travail nécessaire

Le premier travail est de concrètement recenser et documenter les entités linguistiques. D'harmoniser leurs suffixes - pas uniquement pour Internet - dans les diverses écritures, etc. correspond à une ontologie multilingue des réseaux numériques et de leur répartition. Il va permettre les deux hypothèses, mais la seconde est impossible sans lui.

Vous trouverez un projet de présentation de l'architecture MDRS (multilingual distributed referential system) à http://intlnet.org/mdrs.pdf pour assurer ce travail et en faire le fondement de l'Internet Multilingue. D'autres approches comparables sont possibles. Elle est toutefois à ce jour la seule identifiée.

Vous trouverez une introduction sur la manière dont elle peut conduire à un internet multilingue sous http://intlnet.org/intro.htm.

Ce travail est un premier pas sur un sujet complexe et très vaste. J'ai proposé l'adhésion au REDILI de certains des membres initiaux à ce travail qui a été fortement inspiré par les travaux de David Dalby.

Dans un premier temps nous cherchons toute liste stable de codage des langues (nous travaillons sur les listes ISO, Linguasphere, etc.). Nous avons commencé à regarder SIL, mais pour l'instant la priorité est encore celles des outils prototypes de gestion.

Une fois que le projet langroot aura apporté une expérience et des outils, d'autres projets complémentaires seront engagés. Nous aimerions envisager comment organiser une ontologie informatisée des cultures et des pratiques culturelles.