Я бы посоветовал сразу силениум. На новые версии браузера часто проблемно найти расширение. У силениума есть сервер и модуль для перла на CPAN.
02.06.2012 14:09 пользователь "Ali Ramazanov" <[email protected]> написал: > > Как вариант использовать > https://metacpan.org/module/WWW::Mechanize::Firefox и собственно сам > firefox с плагином Mozrepl. Решение рабочее, но не производительное. > Firefox нужно периодически рестартить, из-за отжирания памяти) > > 2 июня 2012 г., 9:52 пользователь Alessandro Gorohovski > <[email protected]> написал: > > Гнатына Александр <[email protected]> писал(а) в своём письме Fri, 01 Jun 2012 > > 23:03:05 +0300: > > > >> wget > >> > >> Огласите требования. > > > > > > Требования, вроде бы, не хитрые --- нужно сохранить всю инфу web-страницы в > > html -файл. > > > > Обычно, поступал так, например: > > > > my $url = 'http://www.адрес <http://www.xn--80aid7bg>'; > > > > > > my $agent = LWP::UserAgent->new; > > $agent->agent("Opera"); > > > > my $request = HTTP::Request->new( GET => $url ); > > $request->header('Accept' => 'text/html'); > > > > open(FILE, ">info.html"); > > print FILE_S $response->content; > > close FILE; > > > > Но сейчас столкнулся с тем, что для Web-страниц, содержащих JavaScript > > все содержимое не могу получить, > > т.е. то что вижу в броузере (Opera or others) нет в сохранённом файле. > > > > Понимаю, что здесь проблема для меня с отработкой JavaScript, которые > > выполняются в броузере. > > > > Вопрос в том, есть ли какой Perl-модуль или что-то консольное, выполняющее > > все что делает броузер > > с возможностью сохранения этого результата? > > > > > > > >> В Птн, 01/06/2012 в 21:58 +0300, Alessandro Gorohovski пишет: > >>> > >>> Уважаемое сообщество, > >>> Доброго времени суток! > >>> > >>> Посоветуйте модуль (кому реально приходилось пользоваться) > >>> хорошего Web-spider. > >>> > >>> P.s. > >>> На CPAN смотрел, их бескрайнее множество. > >>> > >>> Спасибо > >> > >> > >> > > > > > > -- > > Alessandro > > > > -- > > Moscow.pm mailing list > > [email protected] | http://moscow.pm.org > -- > Moscow.pm mailing list > [email protected] | http://moscow.pm.org
-- Moscow.pm mailing list [email protected] | http://moscow.pm.org
