L'internet est tellement intimement
lié à notre vie économique, culturelle,
politique quotidienne qu'il les conditionne. Le Dr. Lessig a
dit "la constitution de l'Internet est dans le code",
c'est à dire dans ses standards. C'est ce qui se jouera
en fait à Genève. Nous avons notre mot à
dire. Si nous le disons nous serons sans doute entendus par les
ingénieurs et les politiques qui sont réellement
responsables et qui n'ont jamais eu un tel forum pour nous entendre.
La question fondamentale est
celle des noms de domaine multilingues. Pour de multiples raisons
elle doit - enfin - être résolue cette année.
Elle le sera dans tous les cas à l'usure. Aprés
des années de travail trop souvent seulement technico/politique
par absence d'une entité culturelle au sein de l'ISOC
(l'ISTF a été fermée). L'ouverture permise
par l'IGF et la coopération de l'UIT pour cette réunion
étaient trés attendues pour ceux qui veulent représenter
l'usage et les cultures au sein de l'IETF.
L'on peut penser qu'une technologie
informatique se préoccupe à priori peu des langues
et des cultures. Ce n'est pas totalement exact au niveau de la
technologie du réseau internet (à ne pas confondre
avec les applications séparées que l'on assimile
souvent à lui). L'internet est le niveau qui permet d'accéder
à des ordinateurs distants avec un numéro "IP"
souvent trouvé à partir d'un nom de domaine et
qui peut rendre compte de ses opérations par e-mail. Viennent
au-dessus le web, les téléchargements, skype, le
spam, etc. Ce qui intéresse nos amis de l'UIT est le niveau
internet lui-même.
Rendre d'évidence
le besoin du support linguistique
L'Internet est ce que techniquement
l'on appelle "linguistiquement biaisé". Ceci
vient du fait qu'il utilise des mots au coeur de ses protocoles
("To", "From", "Subject" font partie
de la technologie Internet. Les autres technologies utilisent
en général des chiffres). Ceci crée des
contraintes techniques inhabituelles. Ceci donne, sans raison
particulière, une prédominance certaine à
l'anglais pour ce qui concerne la culture technique (développeurs,
clavier, formation, support, etc.).
L'effort de multilinguisation
de l'Internet passe donc d'abord par la suppression de ce biais.
Ceci est possible car l'architecture internet est vieillissante.
Plusieurs grandes réflexions (UIT, NSF, IAB, etc.) sont
engagées pour la reconstruire. Notre effort est donc un
effort et une aide d'entraînement pour que cette réflexion
envisage la multilinguisation dès l'abord. Plus des applications
et des usages vernaculaires seront demandés, supportés
et acceptés par tous, plus la composante linguistique
et la prise en compte des cultures seront d'évidence aux
architectes des projets NGN, GENI, Internet 2 qui conduiront
au nouvel internet universel.
Le problème
des suffixes des noms de domaine linguistiques
L'usage de l'internet est linguistique
en ce qu'il use des noms de domaine, qui conditionnent la langue,
le style, les moyens (claviers) utilisés par les sites
et les services. Il est fondamental à la défense
des cultures que ces noms de domaine cessent le plus rapidement
d'atrophier les langues par une écriture limitée
à "0-Z". Tout le monde en est d'accord. Mais
comment faut-il faire ?
La réunion de Genève
permettra de faire le point sur ce sujet, les différents
protagonistes étant présents.
Il y a deux niveaux : celui des
caractères et celui des langues. Nous entendrons des présentations
au niveau des langues (multilinguisation) pour la protection
de la propriété intellectuelle, par exemple. Mais
le débat sera essentiellement celui des jeux de caractères
(internationalisation).
L'IETF a proposé une solution
technique qui permet de supporter les caractères Unicode.
Mais elle laisse une difficulté majeure : pour des raisons
de contrôle politique les suffixes des noms de domaine
(.com,.net,.org, .sn, .cn, .fr, etc.) sont restés en ASCII:
on a donc des noms "chinois.cn", "cyrilique.ru",
etc. ce qui rend ces noms très peu utilisés. La
pression est actuellement très forte pour trouver une
solution.
Deux solutions techniquement
sont proposées. Elles sont controversées et un
projet de test est prévu par l'ICANN et l'IAB pour en
savoir plus. Elles ne sont pas controversées quant à
leurs mérites techniques. Mais n'ayant pas été
planifiées, la mise à niveau des moyens et la réaction
aux changements commerciaux soulèvent bien des questions.
L'impact culturel
du choix technique pour les suffixes linguistiques
Il se trouve que ces solutions
ne sont culturellement pas neutres. Et donc que le REDILI a une
réflexion à conduire.
- la première utilise
des "DNAMEs". Ce sont en fait des alias. Les utilisateurs
entrent un nom de domaine "nom-en-chinois.suffixe-en-chinois"
qui est transcodé en caractères "0-Z".
Le "suffixe-en-chinois" transcodé a été
entré comme un DNAME (alias) de ".com" dans
les tables. Il est dans un premier temps traduit en ".com".
La demande est ensuite recommencée de façon standard.
- la seconde consiste à
considérer que le suffixe transcodé, est un suffixe
à part entière. Du même niveau que .com,
.net, .us, etc.
La première solution fait
qu'il reste 260 registres commerciaux de suffixes. La seconde
qu'à terme il peut y en avoir des dizaines de milliers,
qui a priori seront des associations linguistiques. Nous sommes
là dans la pleine application de l'encapitation linguistique.
Un exemple
Imaginons le Bambara. Si l'on
veut un nom de domaine en Bambara,
- dans la première hypothèse
on se tourne vers un vendeur de ".com" en Bambara.
Pour $ 20 payés au revendeur et à Verisign Inc.
Dans un contexte internationalisé où toutes les
langues se côtoient, avec des conflits d'écriture.
Mais "IBM" sera enregistré qu'une fois dans
chaque écriture (environ 100).
- dans la deuxième hypothèse
on pourra se tourner vers l'association de défense du
Bambara, qui proposera (comme le fait ".cat" pour le
catalan), un nom de domaine en ".bam". L'on ne pourra
enregistrer que des mots en bambara. Et donc soutenir une politique
culturelle. Tout en ayant des subsides pour cela. Si IBM s'interesse
aux clients parlant bambara il lui appartient de payer les $5
ou $10 d'une adhésion annuelle.
Le travail
nécessaire
Le premier travail est de concrètement
recenser et documenter les entités linguistiques. D'harmoniser
leurs suffixes - pas uniquement pour Internet - dans les diverses
écritures, etc. correspond à une ontologie multilingue
des réseaux numériques et de leur répartition.
Il va permettre les deux hypothèses, mais la seconde est
impossible sans lui.
Vous trouverez un projet de présentation
de l'architecture MDRS (multilingual distributed referential
system) à http://intlnet.org/mdrs.pdf pour assurer ce
travail et en faire le fondement de l'Internet Multilingue. D'autres
approches comparables sont possibles. Elle est toutefois à
ce jour la seule identifiée.
Vous trouverez une introduction
sur la manière dont elle peut conduire à un internet
multilingue sous http://intlnet.org/intro.htm.
Ce travail est un premier pas
sur un sujet complexe et très vaste. J'ai proposé
l'adhésion au REDILI de certains des membres initiaux
à ce travail qui a été fortement inspiré
par les travaux de David Dalby.
Dans un premier temps nous cherchons
toute liste stable de codage des langues (nous travaillons sur
les listes ISO, Linguasphere, etc.). Nous avons commencé
à regarder SIL, mais pour l'instant la priorité
est encore celles des outils prototypes de gestion.
Une fois que le projet langroot
aura apporté une expérience et des outils, d'autres
projets complémentaires seront engagés. Nous aimerions
envisager comment organiser une ontologie informatisée
des cultures et des pratiques culturelles. |