Re: Что есть для обработки html в командной строке?

2009-04-18 Пенетрантность Serhiy Storchaka
Тихон Тарнавский wrote: > On Fri, 17.04.2009 12:48:02 , Serhiy Storchaka wrote: >> -asxml и добиться, чтобы кодировка была указана правильная (возможно >> только utf-8). Возможно вручную перекодировать и приклеить > version="1.0" encoding="utf-8"?> до или после tidy. > Первое что попробовал. Увы.

Re: Что есть для обработки html в командной строке?

2009-04-17 Пенетрантность Serhiy Storchaka
Тихон Тарнавский wrote: > On Wed, 15.04.2009 22:05:16 , Dmitry Nezhevenko wrote: >> эээ. это tidy ругнулся? Если да, то лучше глянуть, где именно. >> > Хм.. Это ругнулся xml_grep, разве не видно? Ругнулся на файлы, которые > tidy по идее должен был "validate, correct and pretty-print". Судя по >

Re: Что есть для обработки html в командной строке?

2009-04-16 Пенетрантность Aleksey Cheusov
> Hello! > On Tuesday 07 April 2009 16:21:09 Mikhail Gusarov wrote: >> VW> Но вот что забавно, многие из распространенных XML-парсеров (gnome >> VW> XML например) имеют специальный режим разбора HTML. Что при этом >> VW> имеется в виду, не особенно разбирался. Но возможно, некоторое >> VW>

Re: Что есть для обработки html в командной строке?

2009-04-15 Пенетрантность Alexey Pechnikov
Hello! On Tuesday 07 April 2009 16:21:09 Mikhail Gusarov wrote: > VW> Но вот что забавно, многие из распространенных XML-парсеров (gnome > VW> XML например) имеют специальный режим разбора HTML. Что при этом > VW> имеется в виду, не особенно разбирался. Но возможно, некоторое > VW> тайное знан

Re: Что есть для обработки html в командной строке?

2009-04-04 Пенетрантность Oleg Gashev
2009/4/4 Тихон Тарнавский : > Собственно, вопрос в теме. В идеале хочется что-то вроде cat + > split/csplit + grep, но не для построчной, а для потеговой обработки > (а аналог cat должен обрезать на стыках шапку и обрамляющие теги). xml_grep? -- Best regards, Oleg Gashev.

Что есть для обработки html в командной строке?

2009-04-04 Пенетрантность Тихон Тарнавский
Собственно, вопрос в теме. В идеале хочется что-то вроде cat + split/csplit + grep, но не для построчной, а для потеговой обработки (а аналог cat должен обрезать на стыках шапку и обрамляющие теги). aptitude search и гугль выдают множество "где-то близко", но ничего "в точности", потому интересуют