x = c('o rato roeu a roupa do rei de roma', 'o cachorro eh preto', 'eu nao
tenho cachoro', 'o caxoro dele eh mau', 'o passarinho canta')
comCachorro = grep("cachorro", x, value=TRUE)
comQuaseCachorro = agrep("cachorro", x, value=TRUE)
comQuaseCachorro2 = agrep("cachorro", x, value=TRUE, max.distance=.3)b 2011/6/7 Leandro Marino <[email protected]> > Gustavo, obrigado por ajudar. > > > > Aproveitando a função que estou desenvolvendo, gostaria de saber como > localizar determinado texto no meio de uma frase. Ex.: Quero todos que > tenham citado a palavra “cachorro” em qualquer posição de uma palavra. > Acredito que seria possível, mas não sei trabalhar com expressões regulares. > > > > > > > > Atenciosamente, > *Leandro Lins Marino** > **Centro de Avaliação** > **Fundação CESGRANRIO** > **Rua Santa Alexandrina, 1011 - 2º andar** > **Rio de Janeiro, RJ - CEP: 20261-903** > **(** **(21) 2103-9600 R.:236 ** > ***** [email protected]* > > > > P* **Antes de imprimir* *pense em sua responsabilidade e compromisso com > o* *MEIO AMBIENTE* > > > > Esta mensagem, incluindo seus anexos, pode conter informacoes privilegiadas > e/ou de carater confidencial, nao podendo ser retransmitida sem autorizacao > do remetente. Se voce nao e o destinatario ou pessoa autorizada a recebe-la, > informamos que o seu uso, divulgacao, copia ou arquivamento sao proibidos. > > Portanto, se você recebeu esta mensagem por engano, por favor, nos informe > respondendo imediatamente a este e-mail e em seguida apague-a. > > > > *De:* [email protected] [mailto: > [email protected]] *Em nome de *Gustavo Henrique de > Carvalho > *Enviada em:* terça-feira, 7 de junho de 2011 14:29 > *Para:* [email protected] > *Assunto:* Re: [R-br] Semelhança de textos > > > > ?agrep > > > > Tem uma ferramente homônima no Linux/Mac OS X e etc que também é bastante > poderosa, especialmente combinada com awk, sed, grep, etc. > > 2011/6/7 Leandro Marino <[email protected]> > > Caros, > > Alguém saberia me dizer se o R tem alguma função implementada que forneça > um percentual de concordância de textos dentro de um determinado data.frame? > Preciso testar todos contra todos, em geral, são diversos conjuntos de 15 a > 20 pequenos textos. > > Na realidade estou preparando uma função para encontrar registros > duplicados que possam ter pequenas diferenças de grafia. > > Atenciosamente, > *Leandro Lins Marino** > **Centro de Avaliação > Fundação CESGRANRIO > Rua Santa Alexandrina, 1011 - 2º andar > Rio de Janeiro, RJ - CEP: 20261-903 > **(** (21) 2103-9600 R.:236 > ***** [email protected]* > > > > P* **Antes de imprimir* *pense em sua responsabilidade e compromisso com > o* *MEIO AMBIENTE* > > > > Esta mensagem, incluindo seus anexos, pode conter informacoes privilegiadas > e/ou de carater confidencial, nao podendo ser retransmitida sem autorizacao > do remetente. Se voce nao e o destinatario ou pessoa autorizada a recebe-la, > informamos que o seu uso, divulgacao, copia ou arquivamento sao proibidos. > > Portanto, se você recebeu esta mensagem por engano, por favor, nos informe > respondendo imediatamente a este e-mail e em seguida apague-a. > > > > > _______________________________________________ > R-br mailing list > [email protected] > https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br > > > > _______________________________________________ > R-br mailing list > [email protected] > https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br > > -- Successful people ask better questions, and as a result, they get better answers. (Tony Robbins)
<<image001.jpg>>
_______________________________________________ R-br mailing list [email protected] https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
