On Tue, 5 Mar 2002 18:30:45 +0200
George Danchev <[EMAIL PROTECTED]> wrote:
> да се поправя, малко :)
> първо терминала имаше следните нстройки:
> style uni
> size 16
> encoding cp1251
> layout bg_phon
> options lwin_toggle
> ttys /dev/tty[1-11]
>
> това е конфига на console-cyrillic
> (сентенция на bglinux доколкото разбирам)
>
> второ, nsgmls не е от пакета "jade", а от "sp".
>
> > ne znaja kak raboti 'nsgmls' no izxozdajki ot opita mi s XML/XSLT
> > transformaciite, simvolite se opeobrazuvat vatreshno kam UTF-16 i taka se
> > obrabotvat. Poradi fakta che ISO8859-1 encoding-a definira 'я' kato
> > specialen simvol, obratnoto mu vrushtane kam 8-bit vodi do zaguba na
> > stojnostta mu.
>
> нещо не ми се изясни много много какво става, но няма значка :)
>
> >V tozi sluchaj po pravilno bi bilo da polzvash ÿ ili
> > ± vmesto simvol s cod 255.
>
> с горния конфиг нито едното нито другото помогнаха.
> Вместо "я" в SGML сложих ÿ , но:
> nsgmls:apt-howto-en.sgml:14:2:E: "XFF" is not a function name
>
> а с ± парсването минава ОК, но пък в HTML-то се получи странен символ ,
> плюс и минус едно над друго :)
>
Tochno tova imax predvid, che shte minesh prez paketa s transformaciite, no tova ne
oznachava che shte vidish tova koeto iskash. :-))
> >No po dobre bi bilo da se pishat
> > documentite koito sadarzat symvoli nad 128 izpolzvajki UNICODE, UTF-16,
> > UTF-8 ili s dve dumi multibyte format. Vsqko drugo reshenie bi bilo
> > netochno.
>
> Тука май си много прав, не се сетих, че май е време да поизбягаме от cp1251.
> Та /etc/console-cyrillic:
> style uni
> size 16
> encoding utf-8
> layout bg_phon
> options lwin_toggle
> ttys /dev/tty[1-11]
>
> ребуут за по-сигурно :) , създавам SGML файл съдържащ "я". От документацията
> на "sp" и nsgmls, разбрах:
>
> export SP_CHARSET_FIXED=1
> export SP_ENCODING=utf-8
>
> debiandoc2html -l en apt-howto-en.sgml
> # това е ОК, но пък:
> debiandoc2html -l bg apt-howto-en.sgml
> Warning: locale bg not supported, using default en_US.ISO8859-1
>
> генерира хтмл -то, но пък се налага смяна на charset-a...
>
> за -l не помага нищо от :
> ls /usr/share/locale/ |grep bg
> bg
> bg_BG.CP1251
> bg_BG.ISO8859-5
> bg_BG.ISO-IR-111
> bg_BG.KOI8-R
> bg_BG.KOI8-U
>
> или може би гледам не където трябва? дава Warning ... и ползва default-a ...
Suzaljavam, ne polzvam Debian a FreeBSD, za da pogledna kade moze da e problema v
debiandoc2html, no pogledni za configuracionni files na paketa, noito ne sa svarzani s
locale-a na mashinata. Po pravilno spored men shte e da se opitash s '-l windows-1251'
vmesto s '-l bg', no do kolkoto razbiram 'bg' locale-a e baziran na en_US.ISO8859-1.
> Дори да ползвам и uxterm няма напредък.
>
> НО ПЪК следния опит е с успех:
>
> style uni
> size 16
> encoding koi8-r
> layout ru
> options lwin_toggle
> ttys /dev/tty[1-11]
>
> създавам SGML файл, вече с малко руско "я".
> debiandoc2html -l ru apt-howto-en.sgml
>
> всичко е ток, няма проблеми с локала (-l ), генерира html files
> charset=koi8-r, и най-важното "я"-то се чете и в html файловете.
> Нещо повече, не можах да разбера как в html-то се появиха иманата на секцийте
> на руски език : "Анотация", "Заметка об авторских правах", "Содержание" и так
> далие .... Братушките както винаги са пред нас (което леко ме изнервя),
> съвсем тихо хората си локализират нещата, а не се изхвърлят на сухо като нас
> да правят цели дистрибуции ... но както и да е.
Tova sushto moze da e specifichna localozacia na paketa.
>
> > > и после в хтмл документа се налага да сменя charset=iso-8859-1 на
> > > charset=windows-1251 и да сложа [я]-тата по местата им. Вече всичко е
> > > ОК:).
> > > Мисля да ъпдейтна превода на APT-HOWTO,
> > > но тази процедура "could be a bitch" :-(
>
> е има и dirty решение както винаги:
>
> #!/bin/bash
> FIXDIR=apt-howto-en.html
> DUMMYCHAR1=bgia
> REALCHAR1=я
>
> for i in $FIXDIR/*.html; do
> cat "$i" | sed \
> -e "s/charset=iso-8859-1/charset=windows-1251/" \
> -e "s/$DUMMYCHAR1/$REALCHAR1/g" > "$i.new" \
> -e 's/Next/Напред/g' \
> -e 's/Previous/Назад/g' \
> -e 's/Contents/Съдържание/g' \
> -e 's/Abstract/Цел на документа/g' \
> -e 's/Copyright Notice/Правна бележка/g'
> mv "$i".new "$i"
> done
>
> модификация на fix-a от linux-book-a :)
> това естествено минава само пред текстовите оутпути,
> pdf не става да се модери така грубо :)
>
Ot nsgmls ne mozesh li da napravish LaTeX? Tam mislha che shte e po lesno.
> > > Ако проблема е в nsgmls (от пакета jade), може ли да го
> > > сборим някак или ще се мъчим като прабългари ?
>
> май наистина проблема не е във валидатора - nsgmls.
> Та задачката е много проста: как в unicode терминал да създадем SGML файл
> (например сдържащ думи като - София, България, етц - все български уж ;)
Izpolzvaj EMACS. Ako iskash da ti pratja neshto po temata?
> след това с debiandoc2{output} да се генерират разни outputs. За html
> специално ако може да се сетва charset-a, без допълнителни българизиращи
> fix-ове като горните и разбира се "я"-то в outputs да не се изражда в random
> symbols :).
> Да знам че през debiandoc2*, могат да се подават и опций към nsgmls, опитах
> разни комбинации, но нещо неоцелвам. Ще се развам ако някой ме светне по
> въпроса.
>
> 10x
> --
> Greets,
> fr33zb1
> ===========================================================================
> A mail-list of Linux Users Group - Bulgaria (bulgarian linuxers)
> http://www.linux-bulgaria.org/ Hosted by Internet Group Ltd. - Stara Zagora
>
--
Dimitar Peikov
Programmer Analyst
Globalization Group
"We Build e-Business"
RILA Solutions
27 Building, Acad.G.Bonchev Str.
1113 Sofia, Bulgaria
phone: (+359 2) 9797320
phone: (+359 2) 9797300
fax: (+359 2) 9733355
http://www.rila.com
===========================================================================
A mail-list of Linux Users Group - Bulgaria (bulgarian linuxers)
http://www.linux-bulgaria.org/ Hosted by Internet Group Ltd. - Stara Zagora