Preciso remover as tags de um html e só imprimir o texto.

cat teste.html

<tag1> abc </tag1> <tag2>
<tag3> abcdef </tag2></tag3>

Tentei com:

sed "s/<.*>\(.*\)/\1/g" teste.html

mas como o * é guloso, o resultado é vazio.

tentei assim
sed "s/<.*>\(.*\)<\/.*>/\1/g" teste.html

mas o resultado é apenas a primeira ocorrência
abc


Alguma dica?


[As partes desta mensagem que não continham texto foram removidas]

Responder a