On Thu, Jul 28, 2011 at 5:04 AM, Daniel de Oliveira Mantovani < daniel.oliveira.mantov...@gmail.com> wrote: > Olá pessoal, vocês já ouviram falar de algum algoritmo que separe o > sujeito, predicado e objeto de uma frase ? De frases simples, como > títulos de notícias. >
Oi Daniel :-) Primeiramente isto não é análise semântica, e sim sintática. Os algorítmos indicado baseiam-se no conjunto de técnicas conhecidas como *Part-of-Speech Tagging* (esse é o nome que vc deve buscar no google ehehehe). Você vai precisar de um léxico da língua (acho que português)... o sucesso de QUALQUER algoritmo depende exclusivamente de ter um léxico, um corpus anotado como casos de aplicação, e tempo de treinamento. O algoritmo em si varia pouco!! Eu costumava usar Python e NLTK <http://www.nltk.org/> pra isso, principalmente porquê ele já trás excelente suporte a nossa lingua: http://nltk.googlecode.com/svn/trunk/doc/howto/portuguese_en.html Deve haver soluções boas e tools (nivel NLTK) em Perl tb! Mas considere usar os léxicos e corpus disponíveis no NLTK, caso opte por usar outra tool Perl: my two cents! ;-) Outras opções de toolboxes e Libs: http://en.wikipedia.org/wiki/List_of_natural_language_processing_toolkits Espero ter ajudado. Boa sorte, Carlos.
=begin disclaimer Sao Paulo Perl Mongers: http://sao-paulo.pm.org/ SaoPaulo-pm mailing list: SaoPaulo-pm@pm.org L<http://mail.pm.org/mailman/listinfo/saopaulo-pm> =end disclaimer