Kamen TOMOV wrote:

On Fri, Apr 16, 2004 at 11:42:48PM +0300, Doncho N. Gunchev wrote:


Като гледам колко/как се обсъжда темата, струва ми се че явно
проблема е сериозен. Едно време, когато поддържката на кирилица
куцаше на всяка стъпка, си пишехне ба 'чатица', 'шльо...' и т.н. и
никой не се оплакваше, но... времената се менят (и ние остаряваме).
Докато четях това писмо ми хрумна една идея, която е вече на 40-50
секунди :).С риск да изтърся някоя голяма глупост, за което се из-
винявам предварително, ето я (някой ден ще се науча да не тръгвам
да пиша писма посреднощ може би):



На мен идеята ми допада :)




Да се направи 'филтър', който да 'коригира' максимално получе-
ните от листата писма вместо да ги трие? Грешната кодировка мисля
може да се познае на база съдържащите се знаци при достатъчно дъл-
го писмо. Ако писмото е 2 реда, дори на китайски да е, мисля никой
няма да му направи впечатление. Yahoo примерно винаги, ама абсо-
лютно винаги праща US кодировка каквото и да става, но не променя
сърържанието - само се променя на CP1251/UTF-8....



Според мен първото нещо, което може да се направи е да се пратят
към /dev/null писма с грешно зададен Content-Type. Т.е. проверява се
дали в бодито на писмото има повече от примерно 10 символа, които не
идват от клавиатурата във декларираното кодиране и ако да писмото изчезва. И без това малко хора успяват да декодират подобни писма.


Т.е. филтъра трябва да може да пропуска само писма, чието тяло нищо
друго освен символите от клавиатурата, които са във вярно кодиране.

По-добро от това трудно може да се направи.



   Допълнително към тази 'услуга/филтър' може би може да се доба-
ви правило за преобразуване на 'Chatitza' към 'Чатица', (само ако
резултата прилича на кирилица примерно). Правилата за работа с
листата могат да включат инструкций. Обратната операция също може
да се окаже полезна (сещам се за http://www.linux-bg.org). Аз мо-
га да продължа да си мечтая за опционално прекодиране според же-
ланието на получателя още на сървъра... но ако продължа в тоя дух
скоро ще дотрябва да се пише нов mail сървър и да се намерят поне
още 10 машини за работата му... така че спирам дотук.

пс: Сещам се, че надали всеки ще му допадне идеята някой да му
прекодира/коригира или каквото там се случи пощата (най-малкото
GPG подписите отиват....), но надявам се малко мислене по темата
няма да навреди. Та, други идеи? Web интерфейс?



След като отсеем писмата с правилно кодиране остава да се справим с
чатицата. Наскоро написах едно скриптче, от което може да се почне. То е тотален кирилизатор - трябва да се постави на сървъра
и да се настрои да филтрира тялото на писмата преди да ги изпраща.


Ще останат следните проблеми:
1. Да, сигнатурите отпадат, ама си мисля, че може да ги пожертваме?
2. Английските думи ще бъдат "кирилизирани". 3. Т.нар. шльокавица не е стандартизирана и декодирания текст може да изглежда малко странно.


Последното не е истински проблем. Даже би било допълнителен стимул за хората да си настроят правилно кирилицата.

Синтаксиса на скрипта е:
$ ./lat2cyr.pl <име на файл на шльокавица>|iconv -futf-8


iconv филтъра се ползва, за настройка на кодирането на изходния
текст, в случай, че терминала ви не е УТФ-8.


Скрипта го сложих тук:
ftp://zlatenlist.homelinux.net:8021/pub/cyr2lat.pl

Поздрави,


Според мен идеята за кирилизатор от чатица и шльокавица (моля, светнете ме каква е разликата между чатица и шльокавица - няма да цитирате RFC :)) е просто безумна. В голям процент от писмата се цитират команди или извадки на английски, които сами се сещате какво ще стане с тях след като скрипта ги омаже. За да съм по "образен ще симулирам малко скрипт от горния пасаж:

-> $ ./lat2cyr.pl <име на файл на шльокавица>|iconv -futf-8 +> $ ./лат2цър.пл <име на файл на шльокавица>|иконв -футф-8


-> ftp://zlatenlist.homelinux.net:8021/pub/cyr2lat.pl +> фтп://златенлист.хомеликукс.нет:8021/пуб/цър2лат.пл

Мисля, че ясно виждате какво се получава...
Да не говорим, че понякога на човек му се налага да ползва стари терминали, дето трудно могат да се 
кирилизират...

поздрави,
        ибро



============================================================================
A mail-list of Linux Users Group - Bulgaria (bulgarian linuxers).
http://www.linux-bulgaria.org - Hosted by Internet Group Ltd. - Stara Zagora
To unsubscribe: http://www.linux-bulgaria.org/public/mail_list.html
============================================================================

Reply via email to