Buenas pessoal

Tenho alguns arquivos textos contendo artigos científicos e estou
desenvolvendo um aplicativo que bota ordem na bagunça, buscando as
palavras chave no meio do texto.

Como a fonte dos artigos é variada, posso obter, por exemplo as
palavras-chave nos seguintes formatos:

Palavras-chave: Adiposidade corporal. Capacidade funcional. Composição corporal.
Key words: Body composition. Body adiposity. Functional capacity.
--> Identificador + DOIS PONTOS + valores separados por ponto

Keywords: Boost pressure Diesel engine Neuro-fuzzy ANFIS
--> Identificador + DOIS PONTOS + Valores separados por inicial maiúscula

<meta name="Keywords" content="low level laser therapy, endodontic
surgery, postoperative pain.">
--> Padrão tag, com valores separados por vírgula e terminados por ponto

Key words: low level laser therapy; endodontic surgery; postoperative pain.
--> Identificador + DOIS PONTOS + valores separados por
ponto-e-vírgula + terminador CR+LF

Key Words: ankle instability, subtalar joint injury, ankle dysfunction
--> Identificador + DOIS PONTOS + valores separados por vírgula +
terminador CR+LF

Pensei em usar Expressões regulares para identificar estes textos, mas
não sei como fazer para montar estas expressões.
Alguém tem uma sugestão de como posso fazer esta "captura" de dados?

Grato por qualquer ajuda

Aquele abraço

-- 
Timeo hominem unius libri
Cogito ergo sum - Carpe diem

[]s
Guionardo Furlan
http://guionardo.blogspot.com

Responder a