|
Traduzione accentate da IBM-PC a Win Latin-1Una traduzione ridotta dal set di caratteri ibm-pc a win latin-1 può essere eseguita limitandosi alle sole accentate. Questo metodo è vantaggioso quando esiste un'incertezza sulla codifica dell'input. Ad esempio un nostro programma dovrebbe essere eseguito in console è cioè in cp437, ma viene editato in cp1252. Il vantaggio di questo metodo è quello di cercare di sistemare almeno le sei lettere accentate minuscole utilizzate in italiano: àèéìòù. Ovviamente è necessario conoscere la codifica di destinazione. Si stabilisce la corrispondenza tra sei codici cp437 ( x85 x8A x82 x8D x95 x97) e sltrettanti codici cp1252 (xE0 xE8 xE9 xEC xF2 xF9). In quanto i codici non si sovrappongono si sostituiscono solo quelli. Il risultato è il seguente:
Esaminiamo i relativi frammenti delle tabelle di codifica per poter cogliere i pro e contro di questa tecnica. Codici Alti (128 -- 255)
Come si vede i simboli 224, 232, 233, 236, 242 sono essenzialmente simboli matematici. L'unico simbolo veramente usato è il 249 (bullet). Questa tecnica di traduzione non permette di usare questo simbolo nella codifica ibm-pc.
Tutta questa zona è libera nella codifica Latin-1. Nella codifica cp1252 il simbolo 141 non è definito, i simboli 130 e 138 sono sicuramente di utilizzo rarissimo, metre i simboli 133, 149 e 151 possono sicuramente essere usati. E' curioso che il bullet appaia in ambedue le tabelle di scontro. Il danno in questo caso è più sensibile. Links verso
|
| dsg.dtd.body.trans LastModified: 14-9-2007 John Peter Arnold |
|
This documentation as well as any accompanying software is an
exclusive property of AR Enterprise Spa ®. It is not allowed to reproduce copy, translate it without express permission. |