Langage de description de format de document

Cet article est une ébauche à compléter, vous pouvez partager vos connaissances en le modifiant.

Un langage de description de format de document est un langage permettant de définir un jeu de règles et contraintes qui seront utilisées pour savoir si une instance de document est valide par rapport à ce même jeu de règles et contraintes.

Sommaire

Exemples

Par exemple, si on invente un format dont la principale caractéristique est de préciser les contraintes par rapport à la taille du fichier que nous essayons de catégoriser (valide ou non valide). On utilisera une syntaxe proche de la syntaxe mathématique, en définisant une ou plusieurs équations vérifiées par la variable TailleFichier :

TailleFichier = 3
 

Ainsi un fichier contenant le mot « non » qui fait trois lettres en ASCII est un fichier valide par rapport à ce jeux de règles.

Extensions

Un langage de description de format n'est pas nécessairement définitif, dans le sens où, il peut être complété pour fournir d'autres règles, permettant de catégoriser plus finement.

Si on définit un ensemble de règle A pour dire si un document est une instance de A. Il suffit d'ajouter un ensemble de règle B, non contradictoire avec celle de A, pour créer un sous-langage de A, vérifiant A et B.

Les fichiers binaires

Les fichiers textes

La syntaxe BNF

Voir l'article : BNF.

Les langages balisés

La famille SGML

En SGML, il y a trois niveaux de description d'un document :

Ce sont ces trois niveaux qui ont fait de SGML, une norme très difficile à perçevoir et à mettre en œuvre.

La famille dérivée : XML

...

Langages de description de textes

roff

HTML

LaTeX

...

See also: Langage de description de format de document, ASCII, Document, Forme de Backus-Naur, Mathématique, SGML, Syntaxe, Syntaxe abstraite, Syntaxe concrète