Si propone una normalizzazione del set di caratteri. A tal fine si stabilisce:
- Si prova l'effetto.
- In SGML questi caratteri dovrebbero essere gestiti senza bisogno di un escape.
- In HTML si provano nei due browser principali tutti i caratteri e si vede che succede.
- In Tex si provano tutti i caratteri e si vede che succede.
- Si definisce così un set funzionante.
- In input:
- Notes: si traducono in SGML solo i caratteri '<', '>', '&'.
- Auto: Dai programmi si:
- Traducono le accentate italiane da Latin-1 a PC.
- Si traduce il risultato da PC a Latin-1
- Si mettono le entità per i soliti '<', '>', '&'.
- Il set di caratteri di tutti i files SGML è Latin-1 (con le estensioni windows). I tre caratteri speciali sono gestiti con l'escape. Nessun altro carattere prvede l'escape.
- In output:
- HTML: Bisognerà trdurre di nuovo i '&', '<', '>' in entità.
- Tex: Bisognerà effettuare le traduzioni richieste dal TeX operando su stringhe dove le entità sono già espanse.
N.B. E' utile prevedere anche l'entità -"-. Inoltre le entità sono gestite in SGML traducendo direttamente al codice numerico con l'eslusione di & < > ". E' stata soppressa la distinta gestione delle entità tra html e TeX.