1. La structure des textes ↓
  2. Etapes de la conception ↓
  3. Codage et formats ↓
  4. Choix d'une application ↓
Références ↓

Il convient de distinguer le sens, la structure du document et sa présentation.

1 La structure des textes

Les niveaux de structure : Bien entendu, la structure découle du sens, chaque type de texte correspondant à un plan particulier. De même la présentation mettra en valeur la structure en associant à chaque niveau une mise en forme particulière (souvent nommée styles).

2 Etapes de la conception

philippe geluck
Par rapport à l'écriture à la main, la facilité de modification qu'offre l'écriture numérique modifie profondément la façon d'écrire. Il n'est pas nécessaire de définir au départ la perspective et le plan du texte qui peut prendre un sens différent du sens initial. Attention, ne pas connaitre le plan ou le modifier au fur et à mesure de l'écriture n'empêche pas d'en créer un dès le départ. Il est plus facile de travailler sur un document long si les éléments qui le constituent sont structurés (par un ou deux niveaux de titre), par une numérotation des illustrations, etc.

L'écriture est plus créative, mais surtout, est est différente.

Si les variations de présentation offertes par les premiers systèmes informatiques (surtout les imprimantes) étaient limitées, il n'en est plus de même aujourd'hui avec le développement des imprimantes laser, puis à jet d'encre et des écrans graphiques mobiles ou non.

Les différents formats de texte pourront être distingués en fonction des possibilités de mise en forme qu'ils offrent, de la destination finale du document et de la séparation ou non des étapes de conception. En théorie, ces étapes restent distinctes : A noter qu'il est prudent d'enregistrer souvent son travail sans attendre la finalisation de l'entrée du texte ou de la mise en page, ce qui devient évident avec un long document !

Voir le résultat final
Les éditeurs modernes ont profité des écrans graphiques et affichent le texte à l'écran à peu près dans son aspect final : wysiwyg (what ou see is what you get), ce qui fait que l'on travaille souvent sur les trois étapes en même temps. Mais on ne peut que conseiller de séparer le contenu (sens et structure) de la mise en page qui peut être différée. Avec le wysiwyg le codage de la mise en page devient transparent à l'utilisateur (et même le plus souvent inaccessible).

Un traitement de texte standard assure toutes les possibilités de mise en forme citées plus haut, et même l'ajout de notes de bas de page, la réalisation plus ou moins automatique d'une table des matières ou d'un index. De nombeux logiciels permettent de masquer ou non les sous paragraphes ou certains corps de texte pendant la frappe : mode plan, ce qui peut faciliter considérablement l'écriture de longs documents. Un traitement de texte classique gère la pagination et même la disposition du texte en colonnes. Le texte s'écoule d'une page à l'autre en fonction de l'encombrement des caracatères et de la largeur des paragraphes. Le texte peut inclure des images, soit entre les paragraphes soit placées à droite ou à gauche du texte qui les encadre.

Un logiciel de publication assistée (PAO) offre en principe plus de souplesse en permettant la disposition des textes sous forme de blocs; surtout les blocs (ou calques) peuvent se superposer sur différents plans. Il est aussi possible d'insérer des formes vectorielles simples (filets, encadrements).

Traitement de texte et logiciel de PAO permettent la préparation des données en vue de la réalisation d'un document imprimé. Au contraire les pages web écrites en HTML sont principalement concues pour être visualisées à l'écran, et la notion d'hypertexte y est largement exploitée.

Si le livre le plus classique (essai ou roman), proche du format A5, est souvent associé à une mise en forme simple (pas ou peu d'illustrations, texte sur une colonne, variations de police limitées au titres de chapitres et notes facultatives de bas de page), la multiplicité des objets (livres illustrés, plaquette "publicitaire", journal, etc. ) conduit à des mises en forme plus sophistiquées et plus variées dont le but est de favoriser la perception de la structure ou de tenir compte des contraintes de lecture (il est difficile de lire des lignes longues, d'où une mise en page en colonnes pour les documents de grande largeur).

Les habitudes culturelles jouent évidemment: les livres tibétains (pécha) sont constitués de feuillets non reliés de plus de 30cm de largeur (la dimension d'une flèche) et de très faible hauteur (il s'agit de faciliter leur transport), sans mise en colonne, donc avec des lignes très longues (c'est peut-être pourquoi le texte est souvent lu à voix haute).

La tentation de tout faire
Dans la pratique, les choses sont moins claires puisque les traitements de texte les plus utilisés gèrent aussi bien qu'une application de PAO les blocs de texte chaînés. Il est possible d'insérer des hyperliens entre documents différents comme avec des pages web.

A l'inverse, des éditeurs de texte "simples" (ils ne sont pas si simples que cela car généralement conçus pour les programmeurs, il permettent souvent de changer le codage des caractères ou des fins de ligne) n'assurent aucun formatage. Bien que les éléments de structure tels que chapitres, titres et paragraphes ne soient pas gérés, certains en défendent l'utilisation en apprentissage. Leur "détournement" en situation de classe permet de centrer la production sur le contenu du texte et non sur sa mise en forme.

L'hypertexte et le web
La même évolution s'est emparée des pages web qui aujourd'hui, gèrent parfaitement les données nécessaires à la mise en page à travers les CSS (Cascading Style Sheet) ou feuilles de style. La séparation (facultative mais de plus en plus nécessaire) des données nécessaires à la mise en page dans un ou plusieurs fichiers distincts du contenu aide à distinguer contenu et mise en forme et favorise la cohérence globale d'un site, toutes les pages utilisant la ou les mêmes feuilles de style. Les media queries apparues plus récemment permettent aux pages web de constituer un format universel adaptable aussi bien à une sortie imprimée qu'à des écrans de tailles très différentes. Le développement des smartphones a révolutionné la mise en forme des pages web en obligeant à concevoir des présentations multiples adaptées à la taille de chaque écran. Contrairement au support imprimé c'est en effet l'utilisateur final qui choisit la taille de son écran et non le producteur de la page web.

Une des caractéristes des page web par rapport aux autres formats de texte est que tous les marqueurs de structure sont explicites et représentés par des balises: ainsi <p></p> définissent le début et la fin d'un paragraphe.

On considère comme totalement anti-ergonomique la nécessité pour l'utilisateur de déplacer le contenu à la fois verticlement et horizontalement (par les "ascenceurs" placés en bord de fenêtre ou par glissement du doigt sur un écran tactile). De ce fait la mise en page tend à disposer les éléments d'une page les uns en dessous des autres sur un petit écran alors qu'il seront placés les uns à côté des autres sur un support plus large. La mise en colonnes automatique est peu répandue sur le web du fait qu'elle est encore peu normalisée et qu'elle interagi avec le découpage en hauteur du document (afficher un texte en colonnes est problématique si les colonnes ne sont pas intégralement visbles en hauteur).

Une mise en page privilégiant un défilement horizontal est très rarement utilisé sur le web sauf pour des pages à contenu artistique prononcé. Un certain moteur de recherche risque aujourd'hui de les considérer comme non adaptées aux smartphones.

Pour optimiser les temps de transfert sur le réseau, les images sont elles aussi conservées dans des fichiers à part, ce qui économise globalement de l'espace disque mais est plus complexe pour l'utilisateur (une bonne maîtrise des déplacements dans l'arborescence des dossiers est nécessaire). Cette séparation que l'on peut mettre en oeuvre avec un traitement de texte ou un logiciel de PAO est obligatoire pour le web.

Pour bénéficier des avantages des deux situations (fichier unique ou fichiers séparés), certains formats de fichiers comme le format epub (destiné à la publication de livres sous un format numérique) sont une encapsulation dans un fichier unique d'éléments séparés (le format epub est une encapsulation de HTML, de CSS et d'images).

The browsers and their futures. www.upsdell.com/BrowserNews/overview.htm

3 Codage et formats

Le codage des textes porte le poids de l'histoire: pour occuper le moins de mémoire possible le nombre de bit utilisés pour coder chaque caractère est le plus limité possible; le codage ASCII défini aux Etats-Unis ne gére pas les accents. L'augmentation du nombre de bits utilisés pour coder chaque caractère permet aujourd'hui la gestion d'alphabets plus complexes. Cependant, le passé a laissé quelques traces source de difficultés quand un texte passe d'un système d'exploitation à un autre (1)... Le seul marqueur de structure vraiment universel est l'espace qui sépare les mots; les retours à la la ligne qui peuvent définir la fin de phrase sont codés différemment d'un système d'exploitation à un autre.

Le principal défaut de nombreux traitements de textes et logiciels de PAO est d'utiliser un format propriétaire, qui fait que le texte ne peut-être relu que par l'application qui l'a créé. Ces formats peuvent évoluer avec le temps et une version récente d'une application peut être incapable d'afficher un document créé avec une version plus ancienne, sans compter que les applications sont mortelles (d'excellentes applications ont été abandonnées par leurs éditeurs). Il convient d'être très prudent lorsque vous créez des documents destinés à une large diffusion ou lorsque vous espérez pouvoir relir le texte dans plusieurs années... D'où l'intérêt d'utiliser un format standard et libre ou tout au moins d'un format largement utilisé aujourd'hui.

D'une manière générale, les logiciels commerciaux utilisent des formats propriétaires et les logiciels libres utilisent des standards. Les formats qui suivent appartiennent à cette dernière catégorie. Ils permettent, avec plus ou moins de réussite, un affichage identique par des applications différentes sur des machines différentes. l'application Open Office utilise le format Open document qui encapsule entre autres un fichier de contenu et un fichier de style tous deux codés en XML. Il est à noter que le PDF est surtout destiné à l'impression et ne permet plus de modifier des documents complexes, mais c'est le seul standard pour échanger des documents issus de logiciels de PAO.

Pour comparer les différents types de textes, cliquez sur les liens :

TXT ASCII (American Standard) (1) affichage Contenu réél
TXT (en unicode, UTF-8) (1) affichage Contenu réél
RTF (Rich Text Format) affichage Contenu réél
HTML affichage Contenu réél
PDF (Portable Document File) affichage Contenu réél

4 Choix d'une application

Comme l'indique ce qui précède, le choix de l'application dépend du type de texte à produire.

Un éditeur de texte orienté programmation permet d'écrire des textes sans mise en page, mais aussi des pages web et des feuilles de style, du fait du codage explicite de la structure des pages web.

Latex est un éditeur complexe et puissant qui permet de générer des documents destinés a être traduits ensuite sous plusieurs formes; malheureusement, il code la mise en page à partir de l'insertion de balises spécifiques et comme pour les éditeurs orientés programmation, vous ne disposez pas du wysiwyg.

Si vous devez produire de longs documents, Open Office et Word généreront automatiquement une table des matères ou un index. Word peut travailler en mode plan. Open Office peut masquer des paragraphes ou une section de document, mais vous devrez passer par la création d'une variable, donc c'est moins pratique; un autre élément appaortant une partie des fonctions du mode plan est le navigateur qui vous permet d'aller facilement à un titre donné ou une illustration (pour l'utiliser il faudra créer un document structuré dès le départ).

S'il s'agit d'assurer une mise en page précise du texte ou d'insérer de nombreuses illustrations, les deux applications précédentes pourront remplacer des applications plus professionnelles de PAO. Elles gèrent correctement les blocs de texte chaînés et l'illustration.

Pour écrire des documentations consultables à l'écran expoitant l'hypertexte, utilisez le standard HTML grâce à un éditeur web permettant à la fois l'édition du code source et le wysiwyg. Dreamweaver est l'un des plus puissants.


(1) A l'époque des premiers ordinateurs, chaque lettre est codée sur 7 bits ce qui ne gère bien que l'anglais. Certains codes représentent alors des lettres différentes d'un pays européen à un autre. On est passé aujourd'hui à un codage sur 8 ou même 16 bits dans certains cas (unicode) qui permet la gestion des caractères accentués, voir des langues non-européennes comme le chinois.

Le format .txt peut cacher des textes codés sur 8 bits, les caractères au delà du code 128 étant différents d'un système à l'autre (DOS, Windows 9x, Mac OS 9, Unix), ou 16 bits (unicode) qui n'est géré correctement que par Max OS X, Windows XP et Java sur ces systèmes.

Références

Yves Perrousseaux. 1996. Mise en page et impression, notions élémentaires. Atelier Perrousseaux.
latex-project.org