Cara, nao sei se vai ajudar em algo,
eu com meu conhecimento limitado hoje faria o seguinte,
Em uma tabela temporaria eu jogaria destes 80mil registros palavra por
palavra cada um em um registro. tipo
cruzeta de aço para 1113
insert into tbl_tmp (palavra) values('cruzeta');
insert into tbl_tmp (palavra) values('de');
insert into tbl_tmp (palavra) values('aço');
insert into tbl_tmp (palavra) values('para');
insert into tbl_tmp (palavra) values('1113');

anel o'ring 12mm
insert into tbl_tmp (palavra) values('anel');
insert into tbl_tmp (palavra) values('o''ring');
insert into tbl_tmp (palavra) values('12mm');

e depois eu consultaria nesta tabela temporaria as palavras que mais se
repetem.
Esta rotina de jogar para a tabela temporaria poderia ir filtrando palavras
como  12mm de para, etc, pois estas certamente se repetirao com mais
frecuencia.

Nao sei se minha ideia ajuda em algo, mas fica aqui.




2008/9/30 Jorge Vilela <[EMAIL PROTECTED]>

> Olá pessoal!
>
> Preciso da ajuda de vocês, estou implementando um "Voçê quis dizer?" para
> as buscas que não retornam resultados.
>
> A função já está pronta e ela se baseia em palavras-chave para comparação,
> por exemplo:
> array dicionario = ('banana', 'maçã', 'abacaxi');
> Se o usuário pesquisar por maca ele retornará algo como: você quis dizer
> maçã?
>
> O meu problema está justamente na formação deste dicionário, eu tenho uma
> base de produtos com cerca de 80 mil registros. Gostaría de buscar os termos
> com maior incidência nesta tabela, distinct não funcionaria pois não preciso
> do campo todo e sim dos termos mais encontrados neste campo.
>
> Por exemplo, em uma base de dados de produtos de uma autopeças (os produtos
> estariam +- assim: cruzeta de aço para 1113, anel o'ring 12mm, cruzeta da
> transmissão p/ f-250, ...), provavelmente os termos mais frequentes seriam:
> cruzeta, parafuso, retentor etc..
>
> Como eu poderia visualizar os termos mais frequentes em meu banco de dados?
> Alguém tem idéia?
>
> Brigadão!
> Jorge Vilela
>
> _______________________________________________
> pgbr-geral mailing list
> pgbr-geral@listas.postgresql.org.br
> https://listas.postgresql.org.br/cgi-bin/mailman/listinfo/pgbr-geral
>
>


-- 
*:-.,_,.-:*'``'*:-.,_,.-:*:-.,_,.-:*'``'*:-.,_,.-:
      :: Rodrigo Machado ::
          FlaRo Sistemas

        Linux User #338262
Lat S25º49'20.11' - Lon W55º07'12.05''
*:-.,_,.-:*'``'*:-.,_,.-:*:-.,_,.-:*'``'*:-.,_,.-:
_______________________________________________
pgbr-geral mailing list
pgbr-geral@listas.postgresql.org.br
https://listas.postgresql.org.br/cgi-bin/mailman/listinfo/pgbr-geral

Responder a