On Tue, 5 Mar 2002 18:30:45 +0200
George Danchev <[EMAIL PROTECTED]> wrote:

> да се поправя, малко :)
> първо терминала имаше следните нстройки:
> style uni
> size 16
> encoding cp1251
> layout bg_phon
> options lwin_toggle
> ttys /dev/tty[1-11]
> 
> това е конфига на console-cyrillic 
> (сентенция на bglinux доколкото разбирам)
> 
> второ, nsgmls не е от пакета "jade", а от "sp". 
> 
> > ne znaja kak raboti 'nsgmls' no izxozdajki ot opita mi s XML/XSLT
> > transformaciite, simvolite se opeobrazuvat vatreshno kam UTF-16 i taka se
> > obrabotvat. Poradi fakta che ISO8859-1 encoding-a definira 'я' kato
> > specialen simvol, obratnoto mu vrushtane kam 8-bit vodi do zaguba na
> > stojnostta mu. 
> 
> нещо не ми се изясни много много какво става, но няма значка :)
> 
> >V tozi sluchaj po pravilno bi bilo da polzvash &#xff; ili
> > &#177; vmesto simvol s cod 255. 
> 
> с горния конфиг нито едното нито другото помогнаха. 
> Вместо "я" в SGML сложих &#xff , но:
> nsgmls:apt-howto-en.sgml:14:2:E: "XFF" is not a function name
> 
> а с &#177 парсването минава ОК, но пък в HTML-то се получи странен символ , 
> плюс и минус едно над друго :)
> 

Tochno tova imax predvid, che shte minesh prez paketa s transformaciite, no tova ne 
oznachava che shte vidish tova koeto iskash. :-))


> >No po dobre bi bilo da se pishat
> > documentite koito sadarzat symvoli nad 128 izpolzvajki UNICODE, UTF-16,
> > UTF-8 ili s dve dumi multibyte format. Vsqko drugo reshenie bi bilo
> > netochno.
 
> 
> Тука май си много прав, не се сетих, че май е време да поизбягаме от cp1251. 
> Та /etc/console-cyrillic:
> style uni
> size 16
> encoding utf-8
> layout bg_phon
> options lwin_toggle
> ttys /dev/tty[1-11]
> 
> ребуут за по-сигурно :) ,  създавам SGML файл съдържащ "я". От документацията 
> на "sp" и nsgmls, разбрах:   
> 
> export SP_CHARSET_FIXED=1
> export SP_ENCODING=utf-8
> 
> debiandoc2html -l en apt-howto-en.sgml
> # това е ОК, но пък:
> debiandoc2html -l bg apt-howto-en.sgml
> Warning: locale bg not supported, using default en_US.ISO8859-1
> 
> генерира хтмл -то, но пък се налага смяна на charset-a...
> 
> за -l не помага нищо от :
> ls /usr/share/locale/ |grep bg
> bg
> bg_BG.CP1251
> bg_BG.ISO8859-5
> bg_BG.ISO-IR-111
> bg_BG.KOI8-R
> bg_BG.KOI8-U
> 
> или може би гледам не където трябва? дава Warning ... и ползва default-a ... 

Suzaljavam, ne polzvam Debian a FreeBSD, za da pogledna kade moze da e problema v 
debiandoc2html, no pogledni za configuracionni files na paketa, noito ne sa svarzani s 
locale-a na mashinata. Po pravilno spored men shte e da se opitash s '-l windows-1251' 
vmesto s '-l bg', no do kolkoto razbiram 'bg' locale-a e baziran na en_US.ISO8859-1.

> Дори да ползвам и uxterm няма напредък. 
> 
> НО ПЪК следния опит е с успех:
> 
> style uni
> size 16
> encoding koi8-r
> layout ru
> options lwin_toggle
> ttys /dev/tty[1-11]
>  
> създавам SGML файл, вече с малко руско "я".
> debiandoc2html -l ru apt-howto-en.sgml
> 
> всичко е ток, няма проблеми с локала (-l ), генерира html files  
> charset=koi8-r, и най-важното "я"-то се чете и в html файловете.
> Нещо повече, не можах да разбера как в html-то се появиха иманата на секцийте 
> на руски език : "Анотация", "Заметка об авторских правах", "Содержание" и так 
> далие .... Братушките както винаги са пред нас (което леко ме изнервя), 
> съвсем тихо хората си локализират нещата, а не се изхвърлят на сухо като нас 
> да правят цели дистрибуции ...  но както и да е.  

Tova sushto moze da e specifichna localozacia na paketa. 

> 
> > > и после в хтмл документа се налага да сменя charset=iso-8859-1 на 
> > > charset=windows-1251 и да сложа [я]-тата по местата им. Вече всичко е
> > > ОК:).
 
> > > Мисля да ъпдейтна превода на APT-HOWTO, 
> > > но тази процедура "could be a bitch" :-(
> 
> е има и dirty решение както винаги:
> 
> #!/bin/bash
> FIXDIR=apt-howto-en.html
> DUMMYCHAR1=bgia
> REALCHAR1=я
> 
> for i in $FIXDIR/*.html; do
>         cat "$i" | sed \
>         -e "s/charset=iso-8859-1/charset=windows-1251/" \
>         -e "s/$DUMMYCHAR1/$REALCHAR1/g" > "$i.new" \
>         -e 's/Next/Напред/g' \
>         -e 's/Previous/Назад/g' \
>         -e 's/Contents/Съдържание/g' \
>         -e 's/Abstract/Цел на документа/g' \
>         -e 's/Copyright Notice/Правна бележка/g'
>         mv "$i".new "$i"
> done
> 
> модификация на fix-a от linux-book-a :) 
> това естествено минава само пред текстовите оутпути, 
> pdf не става да се модери така грубо :)
> 

Ot nsgmls ne mozesh li da napravish LaTeX? Tam mislha che shte e po lesno.

> > > Ако проблема е в nsgmls (от пакета jade), може ли да го 
> > > сборим някак или ще се мъчим като прабългари ? 
> 
> май наистина проблема не е във валидатора - nsgmls. 
> Та задачката е много проста: как в unicode терминал да създадем SGML файл 
> (например сдържащ думи като - София, България, етц - все български уж ;)


Izpolzvaj EMACS. Ako iskash da ti pratja neshto po temata?

 
> след това с debiandoc2{output} да се генерират разни outputs. За html 
> специално ако може да се сетва charset-a, без допълнителни българизиращи 
> fix-ове като горните и разбира се "я"-то в outputs да не се изражда в random 
> symbols :). 
> Да знам че през debiandoc2*, могат да се подават и опций към nsgmls, опитах 
> разни комбинации, но нещо неоцелвам. Ще се развам ако някой ме светне по 
> въпроса. 
> 
> 10x
> -- 
> Greets,
> fr33zb1
> ===========================================================================
> A mail-list of Linux Users Group - Bulgaria (bulgarian linuxers)
> http://www.linux-bulgaria.org/ Hosted by Internet Group Ltd. - Stara Zagora
> 


-- 
Dimitar Peikov
Programmer Analyst
Globalization Group
"We Build e-Business"  

RILA Solutions  
27 Building, Acad.G.Bonchev Str.  
1113 Sofia, Bulgaria  

phone: (+359 2) 9797320 
phone: (+359 2) 9797300 
fax:   (+359 2) 9733355  
http://www.rila.com 
===========================================================================
A mail-list of Linux Users Group - Bulgaria (bulgarian linuxers)
http://www.linux-bulgaria.org/ Hosted by Internet Group Ltd. - Stara Zagora



Reply via email to