да се поправя, малко :)
първо терминала имаше следните нстройки:
style uni
size 16
encoding cp1251
layout bg_phon
options lwin_toggle
ttys /dev/tty[1-11]

това е конфига на console-cyrillic 
(сентенция на bglinux доколкото разбирам)

второ, nsgmls не е от пакета "jade", а от "sp". 

> ne znaja kak raboti 'nsgmls' no izxozdajki ot opita mi s XML/XSLT
> transformaciite, simvolite se opeobrazuvat vatreshno kam UTF-16 i taka se
> obrabotvat. Poradi fakta che ISO8859-1 encoding-a definira 'я' kato
> specialen simvol, obratnoto mu vrushtane kam 8-bit vodi do zaguba na
> stojnostta mu. 

нещо не ми се изясни много много какво става, но няма значка :)

>V tozi sluchaj po pravilno bi bilo da polzvash ÿ ili
> ± vmesto simvol s cod 255. 

с горния конфиг нито едното нито другото помогнаха. 
Вместо "я" в SGML сложих &#xff , но:
nsgmls:apt-howto-en.sgml:14:2:E: "XFF" is not a function name

а с &#177 парсването минава ОК, но пък в HTML-то се получи странен символ , 
плюс и минус едно над друго :)

>No po dobre bi bilo da se pishat
> documentite koito sadarzat symvoli nad 128 izpolzvajki UNICODE, UTF-16,
> UTF-8 ili s dve dumi multibyte format. Vsqko drugo reshenie bi bilo
> netochno.
 

Тука май си много прав, не се сетих, че май е време да поизбягаме от cp1251. 
Та /etc/console-cyrillic:
style uni
size 16
encoding utf-8
layout bg_phon
options lwin_toggle
ttys /dev/tty[1-11]

ребуут за по-сигурно :) ,  създавам SGML файл съдържащ "я". От документацията 
на "sp" и nsgmls, разбрах:   

export SP_CHARSET_FIXED=1
export SP_ENCODING=utf-8

debiandoc2html -l en apt-howto-en.sgml
# това е ОК, но пък:
debiandoc2html -l bg apt-howto-en.sgml
Warning: locale bg not supported, using default en_US.ISO8859-1

генерира хтмл -то, но пък се налага смяна на charset-a...

за -l не помага нищо от :
ls /usr/share/locale/ |grep bg
bg
bg_BG.CP1251
bg_BG.ISO8859-5
bg_BG.ISO-IR-111
bg_BG.KOI8-R
bg_BG.KOI8-U

или може би гледам не където трябва? дава Warning ... и ползва default-a ... 
Дори да ползвам и uxterm няма напредък. 

НО ПЪК следния опит е с успех:

style uni
size 16
encoding koi8-r
layout ru
options lwin_toggle
ttys /dev/tty[1-11]
 
създавам SGML файл, вече с малко руско "я".
debiandoc2html -l ru apt-howto-en.sgml

всичко е ток, няма проблеми с локала (-l ), генерира html files  
charset=koi8-r, и най-важното "я"-то се чете и в html файловете.
Нещо повече, не можах да разбера как в html-то се появиха иманата на секцийте 
на руски език : "Анотация", "Заметка об авторских правах", "Содержание" и так 
далие .... Братушките както винаги са пред нас (което леко ме изнервя), 
съвсем тихо хората си локализират нещата, а не се изхвърлят на сухо като нас 
да правят цели дистрибуции ...  но както и да е.  

> > и после в хтмл документа се налага да сменя charset=iso-8859-1 на 
> > charset=windows-1251 и да сложа [я]-тата по местата им. Вече всичко е
> > ОК:).
 
> > Мисля да ъпдейтна превода на APT-HOWTO, 
> > но тази процедура "could be a bitch" :-(

е има и dirty решение както винаги:

#!/bin/bash
FIXDIR=apt-howto-en.html
DUMMYCHAR1=bgia
REALCHAR1=я

for i in $FIXDIR/*.html; do
        cat "$i" | sed \
        -e "s/charset=iso-8859-1/charset=windows-1251/" \
        -e "s/$DUMMYCHAR1/$REALCHAR1/g" > "$i.new" \
        -e 's/Next/Напред/g' \
        -e 's/Previous/Назад/g' \
        -e 's/Contents/Съдържание/g' \
        -e 's/Abstract/Цел на документа/g' \
        -e 's/Copyright Notice/Правна бележка/g'
        mv "$i".new "$i"
done

модификация на fix-a от linux-book-a :) 
това естествено минава само пред текстовите оутпути, 
pdf не става да се модери така грубо :)

> > Ако проблема е в nsgmls (от пакета jade), може ли да го 
> > сборим някак или ще се мъчим като прабългари ? 

май наистина проблема не е във валидатора - nsgmls. 
Та задачката е много проста: как в unicode терминал да създадем SGML файл 
(например сдържащ думи като - София, България, етц - все български уж ;) и 
след това с debiandoc2{output} да се генерират разни outputs. За html 
специално ако може да се сетва charset-a, без допълнителни българизиращи 
fix-ове като горните и разбира се "я"-то в outputs да не се изражда в random 
symbols :). 
Да знам че през debiandoc2*, могат да се подават и опций към nsgmls, опитах 
разни комбинации, но нещо неоцелвам. Ще се развам ако някой ме светне по 
въпроса. 

10x
-- 
Greets,
fr33zb1
===========================================================================
A mail-list of Linux Users Group - Bulgaria (bulgarian linuxers)
http://www.linux-bulgaria.org/ Hosted by Internet Group Ltd. - Stara Zagora



Reply via email to