RE: RES: [java-list] Pesquisa em HTML

2002-02-19 Por tôpico Jorge Martins

Cláudio,

Atenção que um documento HTML não é um XML. O XML exige por exemplo que toda
tag seja finalizada e que os atributos estejam entre aspas. O XML é case
sensitive e o HTML não é. Há outras diferenças.

O HTML abaixo não é um XML:

A href=pagina.html  link br /a


Em XML deveria ser:

A HREF=pagina.html  link BR/ /A


abraços

Jorge



-Original Message-
From: Claudio Miranda [mailto:[EMAIL PROTECTED]]
Sent: sexta-feira, 15 de fevereiro de 2002 15:04
To: [EMAIL PROTECTED]
Subject: Re: RES: [java-list] Pesquisa em HTML



O Denis não disse se a pesquisa era em um site http, ou arquivos
html no 
sistema de arquivos.

Como html é um documeto XML, pode ser utilizado o Xerces (ou
qualquer 
outro parser), ou parsers específicos para documentos HTML, como o JTidy 
- http://lempinen.net/sami/jtidy.

A própria api em java dispõe do pacote javax.swing.text.html, para
tratar 
de arquivos HTML.

Clauddio Miranda


Marcílio Mendonça wrote:
  
 
 Denis, http://httpunit.sourceforge.net/ deve resolver bem teu problema.
 
 s.
 
 Marcílio.
 
 -Mensagem original-
 *De:* Denis Nietto [mailto:[EMAIL PROTECTED]]
 *Enviada em:* quinta-feira, 14 de fevereiro de 2002 13:57
 *Para:* Java-List
 *Assunto:* [java-list] Pesquisa em HTML
 
 Preciso fazer uma pesquisa de texto em arquivos tipo HTML.
 
 Só que não posso fazer a pesquisar como se fosse um arquivo texto
 qualquer. A pesquisa deve ser feita somente no que é mostrado no
 browser do usuário.
 
  
 
 Alguém tem alguma idéia de como posso fazer isso?
 
 Existe alguma package que explore HTML?
 
  
 
 Agradeço desde já!
 
 
 Denis Nietto - ICQ#131752389


-- LISTA SOUJAVA  
http://www.soujava.org.br  -  Sociedade de Usuários Java da Sucesu-SP 
dúvidas mais comuns: http://www.soujava.org.br/faq.htm
regras da lista: http://www.soujava.org.br/regras.htm
historico: http://www.mail-archive.com/java-list%40soujava.org.br
para sair da lista: envie email para [EMAIL PROTECTED] 
-

-- LISTA SOUJAVA 
http://www.soujava.org.br  -  Sociedade de Usuários Java da Sucesu-SP
dúvidas mais comuns: http://www.soujava.org.br/faq.htm
regras da lista: http://www.soujava.org.br/regras.htm
historico: http://www.mail-archive.com/java-list%40soujava.org.br
para sair da lista: envie email para [EMAIL PROTECTED]
-




RES: [java-list] Pesquisa em HTML

2002-02-15 Por tôpico Marcílio Mendonça




Denis, 
http://httpunit.sourceforge.net/deve 
resolver bem teu problema.
s.
Marcílio.

  -Mensagem original-De: Denis Nietto 
  [mailto:[EMAIL PROTECTED]]Enviada em: quinta-feira, 14 de 
  fevereiro de 2002 13:57Para: Java-ListAssunto: 
  [java-list] Pesquisa em HTML
  Preciso fazer uma pesquisa de texto em arquivos tipo HTML.
  Só que não posso fazer a pesquisar como se fosse um arquivo texto 
  qualquer. A pesquisa deve ser feita somente no que é mostrado no browser do 
  usuário.
  
  Alguém tem alguma idéia de como posso fazer isso?
  Existe alguma package que "explore" HTML?
  
  Agradeço desde já!
  Denis Nietto - 
  ICQ#131752389-- LISTA SOUJAVA 
   http://www.soujava.org.br - Sociedade de Usuários 
  Java da Sucesu-SP dúvidas mais comuns: http://www.soujava.org.br/faq.htm 
  regras da lista: http://www.soujava.org.br/regras.htm historico: 
  http://www.mail-archive.com/java-list%40soujava.org.br para sair da lista: 
  envie email para [EMAIL PROTECTED] 
  - 



Re: RES: [java-list] Pesquisa em HTML

2002-02-15 Por tôpico Claudio Miranda


O Denis não disse se a pesquisa era em um site http, ou arquivos html no 
sistema de arquivos.

Como html é um documeto XML, pode ser utilizado o Xerces (ou qualquer 
outro parser), ou parsers específicos para documentos HTML, como o JTidy 
- http://lempinen.net/sami/jtidy.

A própria api em java dispõe do pacote javax.swing.text.html, para tratar 
de arquivos HTML.

Clauddio Miranda


Marcílio Mendonça wrote:
  
 
 Denis, http://httpunit.sourceforge.net/ deve resolver bem teu problema.
 
 s.
 
 Marcílio.
 
 -Mensagem original-
 *De:* Denis Nietto [mailto:[EMAIL PROTECTED]]
 *Enviada em:* quinta-feira, 14 de fevereiro de 2002 13:57
 *Para:* Java-List
 *Assunto:* [java-list] Pesquisa em HTML
 
 Preciso fazer uma pesquisa de texto em arquivos tipo HTML.
 
 Só que não posso fazer a pesquisar como se fosse um arquivo texto
 qualquer. A pesquisa deve ser feita somente no que é mostrado no
 browser do usuário.
 
  
 
 Alguém tem alguma idéia de como posso fazer isso?
 
 Existe alguma package que explore HTML?
 
  
 
 Agradeço desde já!
 
 
 Denis Nietto - ICQ#131752389


-- LISTA SOUJAVA  
http://www.soujava.org.br  -  Sociedade de Usuários Java da Sucesu-SP 
dúvidas mais comuns: http://www.soujava.org.br/faq.htm
regras da lista: http://www.soujava.org.br/regras.htm
historico: http://www.mail-archive.com/java-list%40soujava.org.br
para sair da lista: envie email para [EMAIL PROTECTED] 
-