On Sat, 29 Nov 2008 16:16:21 -0800 (PST), Lucian Constantin wrote: > Este ca și când oo.org ar lucra într-un mod de 8 biți (CP1250?), > unde orice caracter utf8 cu diacritice este înlocuit de două > caractere dintr-un set de 8 biți. Deci, utilizatorul se uită la > fișierul ro_RO.aff atât din ooo Writer cât și din din > ProgrammersNotepad și diacriticele sunt înlocuite de două caractere > ciudate.
Păi UTF-8 asta și face, pentru caractere mai sus de 007F în Unicode. Numărul de octeți reprezentat de un caracter transformat este variabil, se calculează cumva și poate rezulta între 1 și 4 octeți, parcă. Caracterele banale (ASCII) rămân ca atare (netransformate), iar pentru caracterele noastre românești întâmplarea face că sunt ransformate la 2 octeți, astfel că dacă te uiți la text cu un ceva care nu știe sau nu vrea să interpreteze caracterele ca UTF-8 vei vedea din loc în loc căte doi octeții separați, fiecare în parte complet aiurea dacă îl afișezi textual. Probabil că omul a văzut că i se subliniază cuvinte scrise cu ş și ţ cu sedile și s-a uitat la dicționar cu un program care nu știe ce-i aia UTF-8. Sugerează-i una din asta: - dacă este neastâmpărat și vrea să se uite fizic la dicționar, să o facă cu PSPad, de exemplu (http://www.pspad.com) - să foloseaacă dicționarul cu sedile, dacă schimbă documente cu alți XP-iști - să instaleze tastatura care scrie cu virgule (http://www.secarica.ro/html/ro_kbd_winxp.html și să o folosească pe aia Standard) Cristi -- Cristian Secară http://www.secarica.ro/ --------------------------------------------------------------------- To unsubscribe, e-mail: [EMAIL PROTECTED] For additional commands, e-mail: [EMAIL PROTECTED]
