Re: Форматы создания д окументации и статей

2007-11-02 Thread Иван Лох
On Thu, Nov 01, 2007 at 09:03:07PM +0300, Alexey Pechnikov wrote:
> Есть задача ручного написания указанных материалов и автоматической генерации 
> контента. Долгое время пользовался dokuwiki, но это довольно кривой способ 
> превращения plain text и формат для отображения (html). Есть ли что-нибудь из 
> системных утилит для выполнения указанных задач? Требуются списки, таблицы, 
> заголовки, абазцы и проч. стандартные вещи. Самому писать парсер не хочется, 
> а то, что я нашел в движках разных вики, внушает... в общем, не будем 
> уточнять. Даже в wikit парсер ужасный (таблиц нет, вложенные элементы 
> обрабатываются криво, списки вообще всегда строятся криво...). Хочется найти 
> что-то, что можно как из консоли использовать, так и встроить в свои сайты на 
> радость пользователям. Тиклевский скрипт доставит глубокое удовлетворение.

Если Вы любите perl, то

apt-get install txt2html

Все, что Вы хотите есть. Когда-то, пытаясь понять как работает генератор простых
таблиц из Text2HTML.pm я просто обалдел как это красиво было сделано. В порыве
энтузиазма, я даже дописал к нему генератор рамочных многострочных таблиц. Все 
хотел связаться с автором, да так и забыл.


-- 
To UNSUBSCRIBE, email to [EMAIL PROTECTED]
with a subject of "unsubscribe". Trouble? Contact [EMAIL PROTECTED]



Re: Форматы создания д окументации и статей

2007-11-04 Thread Stanislav Maslovski
On Fri, Nov 02, 2007 at 12:20:14PM +0300, Иван Лох wrote:
> On Thu, Nov 01, 2007 at 09:03:07PM +0300, Alexey Pechnikov wrote:
> > Есть задача ручного написания указанных материалов и автоматической 
> > генерации 
> > контента. Долгое время пользовался dokuwiki, но это довольно кривой способ 
> > превращения plain text и формат для отображения (html). Есть ли что-нибудь 
> > из 
> > системных утилит для выполнения указанных задач? Требуются списки, таблицы, 
> > заголовки, абазцы и проч. стандартные вещи. Самому писать парсер не 
> > хочется, 
> > а то, что я нашел в движках разных вики, внушает... в общем, не будем 
> > уточнять. Даже в wikit парсер ужасный (таблиц нет, вложенные элементы 
> > обрабатываются криво, списки вообще всегда строятся криво...). Хочется 
> > найти 
> > что-то, что можно как из консоли использовать, так и встроить в свои сайты 
> > на 
> > радость пользователям. Тиклевский скрипт доставит глубокое удовлетворение.
> 
> Если Вы любите perl, то
> 
> apt-get install txt2html
> 
> Все, что Вы хотите есть. Когда-то, пытаясь понять как работает генератор 
> простых
> таблиц из Text2HTML.pm я просто обалдел как это красиво было сделано.

Только, насколько я понимаю, в исходном тексте таблица должна быть
отформатирована, иначе алгоритм запутается. А это немного не то, чего
в данном контесте хотелось бы, например, привычному к TeX пользователю.

Но вот для случая, когда по форматированному тексту (например, по тому, что
выдала какая-нибудь программа) надо восстановить логическую разметку - тулз
будет очень и очень полезен.

-- 
Stanislav



Re: Форматы создания д окументации и статей

2007-11-15 Thread Иван Лох
On Fri, Nov 02, 2007 at 04:19:24PM +0300, Alexey Pechnikov wrote:
> > Все, что Вы хотите есть. Когда-то, пытаясь понять как работает генератор
> > простых таблиц из Text2HTML.pm я просто обалдел как это красиво было
> > сделано. В порыве энтузиазма, я даже дописал к нему генератор рамочных
> > многострочных таблиц. Все хотел связаться с автором, да так и забыл.
> 
> И правда все есть. И даже лишних наворотов нет, что удивительно.
> 
> P.S. А может, все-таки напишете автору? Задолбали уже php вики, но хорошие 
> парсеры в подобных изделиях не редкость. 

Труднее всего вспомнить, что и как сделал несколько лет назад. И потом... Сейчас
мне кажется, что все это не нужно, потому, что идеологически плохо. Все, это 
(1) HTML как формат в котором что-то можно хранить, (2) обработка текста на
стороне сервера. 

Все-таки, с XML удобней обращаться. Гибче. Строже. Понятней. Конвертировать в
печатную форму проще. Оказалось проще написать DTD и десяток XSLT чем
поддерживать кучу кода на перле. В моем случае, еще и кода сомнительного
качества с точки зрения безопасности. Смотреть даже lynx можно, если апаческий 
xslt
модуль поставить. 

А небольшой конвертер Plain Text -> XML я, в конечном счете, написал на 
javascript... 
Причем не на XML DOM, а на E4X. И проще, и запускается, при необходимости, как 
текстовая
утилита со спайдерманки или rhino, нормально же используется из Gecko-based 
броузеров.
Но мне проще. Это хобби и возможность работы с IE мне просто не нужна.


-- 
To UNSUBSCRIBE, email to [EMAIL PROTECTED]
with a subject of "unsubscribe". Trouble? Contact [EMAIL PROTECTED]



Re: Форматы создания д окументации и статей

2007-11-15 Thread Kirill Frolov
On Thu, Nov 01, 2007 at 09:03:07PM +0300, Alexey Pechnikov wrote:

> Есть задача ручного написания указанных материалов и автоматической генерации 
> контента. Долгое время пользовался dokuwiki, но это довольно кривой способ 
> превращения plain text и формат для отображения (html). Есть ли что-нибудь из 
> системных утилит для выполнения указанных задач? Требуются списки, таблицы, 
> заголовки, абазцы и проч. стандартные вещи. Самому писать парсер не хочется, 

  Есть такая штука -- docbook. Современный, основанный на xml. Для
технищенской документацией не изобилующей векторной графикой и хитрой
разметкой (для чего лучше подойдёт LaTeX) -- IMHO неплохое решение.
Можно всегда подправить css и xsl для генерации вполне конкретного html.
Смотреть в сторону http://docbook.org -- книжки, что на сайте, вполне
достаточно для начального освоения.

  Вот как получить из docbook-xml то же самое но в PDF -- да задача.
Когда я в последний раз интересовался было всё плохо, особенно с
поддержкой русского языка. Если вкратце -- через xsltproc в xsl-fo
и далее в PDF (например с использованием passivetex), или из docbook-xml
в latex... Да ещё можно прямо из html получать PDF (качества с оценкой
"едва удовлетворительно") посредством применения html2ps с
русифицирующим патчем.

> а то, что я нашел в движках разных вики, внушает... в общем, не будем 
> уточнять. Даже в wikit парсер ужасный (таблиц нет, вложенные элементы 
> обрабатываются криво, списки вообще всегда строятся криво...). Хочется найти 
> что-то, что можно как из консоли использовать, так и встроить в свои сайты на 
> радость пользователям.

  Wiki не созданы для создания сколько-нибудь объёмных текстов со
сложным форматированием, ссылками и т.п.

> Тиклевский скрипт доставит глубокое удовлетворение.

  Да этот ваш тикль -- поделки финских студентов. То ли дело C#.
Когда наступит полный .NET, вас микрософт туда со своими ламухами не
пустит.

> P.S. Понимаю, что в линуксе уйма инструментов для обработки plain text, а вот 
> подходящий никак не могу найти :-(

  А, да. Ещё groff есть. С русификацией, правда, тоже как-то... И texinfo
ещё. Просто LaTeX уже упоминал. html, правда, из него не очень, через
latex2html. Зато PDF идеальные получаются. Или Lout. Идеальная штука, но
из неё только PDF получаются.

  Забыл как же. Microsoft Wor^W^W Open Office ещё. И Abiword. Или
музейный экспонат -- Word Perfect (на диске с 7-м Mandrake был, вроде).
А ещё TeXmacs...


-- 
 * Origin: fido.probapribor.spb.ru (2:5030/1559)


-- 
To UNSUBSCRIBE, email to [EMAIL PROTECTED]
with a subject of "unsubscribe". Trouble? Contact [EMAIL PROTECTED]



Re: Форматы создания д окументации и статей

2007-11-18 Thread Иван Лох
On Thu, Nov 15, 2007 at 10:14:59PM +0300, Alexey Pechnikov wrote:
> не интересно. "Современный, основанный на xml." - да, звучит красиво. Но xml 
> это язык для машинного взаимодействия, а для человека удобнее другие способы 
> разметки.

Очень IMHO, но различия в сложности строгих форматов разметки незначительны.
Включая столь нелюбимый Вами XML. По крайней мере, во вменяемом текстовом 
редакторе.

On Thu, Nov 15, 2007 at 06:10:37PM +0300, Alexey Pechnikov wrote:
> > необходимости, как текстовая утилита со спайдерманки или rhino, нормально
> > же используется из Gecko-based броузеров. Но мне проще. Это хобби и
> > возможность работы с IE мне просто не нужна.
> 
> Может быть, поделитесь примером plain text документа и соответствующего xml? 
> Не могу определиться с теми возможностями верстки, которые необходимы 
> пользователям (таблицы, например, точно нужны) и как делать оформление в 
> plain text документе (вариантов видел уже много, но вот не лежит к ним душа). 

Это все фигня. Есть пользователи способные писать в _любом_ разумном формате, а 
есть
необучаемые. Поэтому толку от всех этих форматов очень мало. "Птичий" язык Wiki
ничуть не легче XML, по-моему. А парсить надо натуральный текст. Он может хинты
иметь (которые будут 15% пользователей использовать) и сложные синтаксические
конструкции, (для Вас самих), но работать он должен предельно тупо. 

> Сам склоняюсь к мысли использовать тиклевский интерпретатор, а текстовый 
> документ верстать в виде:
> 
> Таблица 1 {Заголовок таблицы} {
> ячейка 11,...,ячейка 1N
> ...

И это кто-то может освоить? И скобки правильно поставит?

> и т.д. Соответственно, создать тиклевские функции Таблица, Список, 
> Заголовок1, ..., Заголовок6, Ссылка. И скорость обработки получится высокая, 
> и реализация красивая. Плюс к тому, можно хоть в html, хоть в любой другой 

В смысле, Вы хотите в серверном скрипте раскрывать функции переданные со стороны
клиента? Не думаю, что это хорошая идея.

> формат конвертировать, а возможные ошибки интерпретатор сам найдет (вывод 
> сообщения об ошибке можно немного отформатировать, чтоб пользователей не 
> пугать). А далее в аол вебсервер поправить функции отображения листинга 

Их все-равно никто не будет читать. Будет 100 неудачных попыток послать одно и
тоже.

> Может быть, поделитесь примером plain text документа и соответствующего xml? 
> Не могу определиться с теми возможностями верстки, которые необходимы 
> пользователям (таблицы, например, точно нужны) и как делать оформление в 
> plain text документе (вариантов видел уже много, но вот не лежит к ним душа). 

Ткнитесь на http://www.1917.com/AgitPropV/AgitProp5.html 
Там видно, как парсятся таблицы. Натуральные и с & разделителем. 





-- 
To UNSUBSCRIBE, email to [EMAIL PROTECTED]
with a subject of "unsubscribe". Trouble? Contact [EMAIL PROTECTED]