Codage des caractères chinois
CJC désigne les écritures chinoise, japonaise et coréenne, qui utilisent toutes les trois les caractères Han, caractères chinois dits hanzi en chinois, kanji en japonais, ou hanja en coréen, ainsi que des caractères nationaux. La polémique concerne surtout le chinois simplifié (de République Populaire de Chine et, officiellement Singapour et Hong-Kong), le chinois traditionnel (à Taiwan, Singapour, Hong-Kong et en Corée) et le japonais.
Ces caractères ont évolué au fil des siècles dans ces différents pays et ont aujourd'hui des tracés bien différents. Les Chinois continentaux les ont beaucoup simplifiés, les Japonais y ont apporté des modifications mineures, tandis que les pays ou villes utilisant le chinois traditionnel ont gardé les caractères d'origine sans aucune modification. Les Japonais y ont ajouté leurs syllabaires hiragana et katakana et les Coréens leur syllabaire hangŭl, mais ceux-ci étant codés séparement dans Unicode, leur utilisation informatique ne pose pas problème.
Le sens ayant également devié, la prononciation elle-même étant différente, de nombreux linguistes asiatiques considèrent ces caractères comme étant bien différents.
Cependant, le Consortium Unicode et l'ISO considèrent que les caractères chinois, coréens et japonais sont les mêmes, que seuls les glyphes (Œils en français) diffèrent. La différence serait comparable aux langues latines : traditionnellement en allemand la police de caractères gothique est privilegiée, en français une police à sérifs et en anglais une police sans sérifs. Par conséquent, ils sont codés de la même façon et il faut utiliser une police appropriée pour afficher les caractères dans le style qui convient le mieux aux habitudes locales.
Par conséquent :
- Il est impossible de savoir dans quelle langue est écrit un caractère (donc quel glyphe utiliser pour le représenter), ce n'est d'ailleurs pas un problème unique au CJC (comment savoir si un A est allemand ou français ?),
- mélanger japonais et chinois (par exemple, en citant une parole de Confucius dans sa langue dans un ouvrage japonais) dans un texte non balisé ou sans utiliser les étiquettes linguistiques d'Unicode peut poser des problèmes d'esthétique,
- un ouvrage concernant le japonais ancien unifiera des caractères qui n'existent plus dans la langue moderne mais font appel à des concepts bien différents pour un spécialiste.
Pour cette raison, beaucoup de Japonais refusent de voir en Unicode un système de codage universel. Un professeur de l'université de Tokyo a d'ailleurs proposé un nouveau système de codage intégré à un système d'exploitation embarqué : TRON. Celui-ci permet de coder tous les caractères existant ou ayant existé, ce qui est utile pour les linguistes ou historiens japonais citant les caractères disparus dans leurs publications.
