2009/9/18 Podlesak Kamil <[email protected]>: >> Hmmm... no to by me ani ve snu nenapadlo, ze ve 21. stoleti existuje >> prostredi, kde je nutne znak, ktery lze napsat na klavesnici >> a korektne zobrazit na obrazovce, zejmena kdyz prostredi predstira, >> ze je Unicode awared, zadavat jak pred 30 lety escape sekvenci. >> (Ale asi melo, kdyz v .properties lze pres veskery pokrok v IT >> zadavat stale jen Latin-1...) > > Pokrok v IT totiz neni linearni a v mnoha ohledech je spise reverzni - > smerem k mensim moznostem. Typickym prikladem je prave to, ze soubory nemaji > zadne metainformace o svem obsahu - je to jen hromada byte.
A taky jen tak nebude. V dobe, kdy je Microsoft ochotny vyjit ven se znacne prepsanym operacnim systemem (Vista) se souborovym system, ktery nema ani zurnal... (ano, Vista SP1 ma konecne moderni filesystem (v tomto pripade transakcni, rucne ovladany programatorem, takze doufam, ze atomicke oprace jsou samy o sobe transakcni, ale nevim)), huraaaa! Pokud si dobre vzpominam, tak na nejobsahlejsi metainformace k souboru jsem narazil u ZX-Spectrum, kdy v hlavicce byla mimo jine informace, jestli se jedna o program, data (odkud pokud), pole(velikosti) nebo obrazovku. UNIXove priznaky jsou pouze o typu souboru (adresar, soubor, link, zarizeni,...), pripony v MS světě, které pochází z dob CP/M, nejsou nicim jinym nez jmennou konvenci... Ted si uvedomuju, ze prvni radek shelloveho skriptu ve tvaru napr. #!/usr/bin/perl je take metainformaci, a to pomerne vyznamnou, protoze nam rika, ktery program ma byt spusten k jeho interpretaci, a to nezavisle na nejake pripone... > Jazyku to samozrejme nevadi, viz JLS. > Ovsem kompilator musi nekde vzit informaci, jak ma prevest sekvenci bytu v > souboru na sekvenci unicode znaku - a to se mu musi predat jako parametr. > Takze se to musi nastavit v mavenu, ale i v IDE a vsech dalsich toolech > (napriklad VCS v tom dokazi nadelat docela paseku). > Cele je to hodne komplikovano pri pouziti Windows, kde se neda kodovani v > locale, takze default je vzdy 1250 nebo 1252. Toto je samozrejme cely prapuvod vsech komplikaci. Programy se naucily :vestit z kristalove koule" a kodovani odhadovat (nekdy strilet od pasu). V dobe, kdy se ukazalo, ze UTF-8 je tou spravnou cestou a kdy vsechny "rozumne" systemy na UTF-8 presly, zustal Microsoft na svem starem pristupu - sadou proprietarnich 8-bitovych kodovani. Kdo z vas kdy provozoval anglicke Wokna a na nich ceske aplikace, vi sve... A kdyz si vzpomenu na Windows 3.1 ve trech u nas pouzivanych provedenich US, Central Eurpean a CS, kdy kazde se chovaly uplne jinak... Oto 'tapik' Buchta
