Set di caratteri: latin-1


Si propone una normalizzazione del set di caratteri. A tal fine si stabilisce:

  • Si prova l'effetto.
    • In SGML questi caratteri dovrebbero essere gestiti senza bisogno di un escape.
    • In HTML si provano nei due browser principali tutti i caratteri e si vede che succede.
    • In Tex si provano tutti i caratteri e si vede che succede.
    • Si definisce così un set funzionante.
  • In input:
    • Notes: si traducono in SGML solo i caratteri '<', '>', '&'.
    • Auto: Dai programmi si:
      • Traducono le accentate italiane da Latin-1 a PC.
      • Si traduce il risultato da PC a Latin-1
      • Si mettono le entità per i soliti '<', '>', '&'.
  • Il set di caratteri di tutti i files SGML è Latin-1 (con le estensioni windows). I tre caratteri speciali sono gestiti con l'escape. Nessun altro carattere prvede l'escape.
  • In output:
    • HTML: Bisognerà trdurre di nuovo i '&', '<', '>' in entità.
    • Tex: Bisognerà effettuare le traduzioni richieste dal TeX operando su stringhe dove le entità sono già espanse.

N.B. E' utile prevedere anche l'entità -"-. Inoltre le entità sono gestite in SGML traducendo direttamente al codice numerico con l'eslusione di &amp; &lt; &gt; &quot;. E' stata soppressa la distinta gestione delle entità tra html e TeX.

amm.3r3n6t2 • LastModified: 14-9-2009 • John Peter Arnold