RE: RES: [java-list] Pesquisa em HTML
Cláudio, Atenção que um documento HTML não é um XML. O XML exige por exemplo que toda tag seja finalizada e que os atributos estejam entre aspas. O XML é case sensitive e o HTML não é. Há outras diferenças. O HTML abaixo não é um XML: A href=pagina.html link br /a Em XML deveria ser: A HREF=pagina.html link BR/ /A abraços Jorge -Original Message- From: Claudio Miranda [mailto:[EMAIL PROTECTED]] Sent: sexta-feira, 15 de fevereiro de 2002 15:04 To: [EMAIL PROTECTED] Subject: Re: RES: [java-list] Pesquisa em HTML O Denis não disse se a pesquisa era em um site http, ou arquivos html no sistema de arquivos. Como html é um documeto XML, pode ser utilizado o Xerces (ou qualquer outro parser), ou parsers específicos para documentos HTML, como o JTidy - http://lempinen.net/sami/jtidy. A própria api em java dispõe do pacote javax.swing.text.html, para tratar de arquivos HTML. Clauddio Miranda Marcílio Mendonça wrote: Denis, http://httpunit.sourceforge.net/ deve resolver bem teu problema. s. Marcílio. -Mensagem original- *De:* Denis Nietto [mailto:[EMAIL PROTECTED]] *Enviada em:* quinta-feira, 14 de fevereiro de 2002 13:57 *Para:* Java-List *Assunto:* [java-list] Pesquisa em HTML Preciso fazer uma pesquisa de texto em arquivos tipo HTML. Só que não posso fazer a pesquisar como se fosse um arquivo texto qualquer. A pesquisa deve ser feita somente no que é mostrado no browser do usuário. Alguém tem alguma idéia de como posso fazer isso? Existe alguma package que explore HTML? Agradeço desde já! Denis Nietto - ICQ#131752389 -- LISTA SOUJAVA http://www.soujava.org.br - Sociedade de Usuários Java da Sucesu-SP dúvidas mais comuns: http://www.soujava.org.br/faq.htm regras da lista: http://www.soujava.org.br/regras.htm historico: http://www.mail-archive.com/java-list%40soujava.org.br para sair da lista: envie email para [EMAIL PROTECTED] - -- LISTA SOUJAVA http://www.soujava.org.br - Sociedade de Usuários Java da Sucesu-SP dúvidas mais comuns: http://www.soujava.org.br/faq.htm regras da lista: http://www.soujava.org.br/regras.htm historico: http://www.mail-archive.com/java-list%40soujava.org.br para sair da lista: envie email para [EMAIL PROTECTED] -
RES: [java-list] Pesquisa em HTML
Denis, http://httpunit.sourceforge.net/deve resolver bem teu problema. s. Marcílio. -Mensagem original-De: Denis Nietto [mailto:[EMAIL PROTECTED]]Enviada em: quinta-feira, 14 de fevereiro de 2002 13:57Para: Java-ListAssunto: [java-list] Pesquisa em HTML Preciso fazer uma pesquisa de texto em arquivos tipo HTML. Só que não posso fazer a pesquisar como se fosse um arquivo texto qualquer. A pesquisa deve ser feita somente no que é mostrado no browser do usuário. Alguém tem alguma idéia de como posso fazer isso? Existe alguma package que "explore" HTML? Agradeço desde já! Denis Nietto - ICQ#131752389-- LISTA SOUJAVA http://www.soujava.org.br - Sociedade de Usuários Java da Sucesu-SP dúvidas mais comuns: http://www.soujava.org.br/faq.htm regras da lista: http://www.soujava.org.br/regras.htm historico: http://www.mail-archive.com/java-list%40soujava.org.br para sair da lista: envie email para [EMAIL PROTECTED] -
Re: RES: [java-list] Pesquisa em HTML
O Denis não disse se a pesquisa era em um site http, ou arquivos html no sistema de arquivos. Como html é um documeto XML, pode ser utilizado o Xerces (ou qualquer outro parser), ou parsers específicos para documentos HTML, como o JTidy - http://lempinen.net/sami/jtidy. A própria api em java dispõe do pacote javax.swing.text.html, para tratar de arquivos HTML. Clauddio Miranda Marcílio Mendonça wrote: Denis, http://httpunit.sourceforge.net/ deve resolver bem teu problema. s. Marcílio. -Mensagem original- *De:* Denis Nietto [mailto:[EMAIL PROTECTED]] *Enviada em:* quinta-feira, 14 de fevereiro de 2002 13:57 *Para:* Java-List *Assunto:* [java-list] Pesquisa em HTML Preciso fazer uma pesquisa de texto em arquivos tipo HTML. Só que não posso fazer a pesquisar como se fosse um arquivo texto qualquer. A pesquisa deve ser feita somente no que é mostrado no browser do usuário. Alguém tem alguma idéia de como posso fazer isso? Existe alguma package que explore HTML? Agradeço desde já! Denis Nietto - ICQ#131752389 -- LISTA SOUJAVA http://www.soujava.org.br - Sociedade de Usuários Java da Sucesu-SP dúvidas mais comuns: http://www.soujava.org.br/faq.htm regras da lista: http://www.soujava.org.br/regras.htm historico: http://www.mail-archive.com/java-list%40soujava.org.br para sair da lista: envie email para [EMAIL PROTECTED] -