O grande problema na area de TI eh a falta de conceitos. Muitas decisoes
sao tomadas baseadas em achismos ou casos isolados de sucesso. Os
profissionais da nossa area nao tem o costume de ler artigos tecnicos,
cientificos, pesquisas... Ai podemos perceber porque mais de 60% dos
projetos de TI fracassam. Com relacao ao topico vou deixar aqui meus 2
cents.

Em 6 de novembro de 2015 18:15, Rogério F.Santo <rogeriofsan...@gmail.com>
escreveu:

> So para deixar claro os termos usados como todo termo é usado diante de
> contexto e uma literatura e bom saber isso antes de apontar falhas. No caso
> dados não estrurados a que me refiro e o que consenso entre os grandes
> players de mercado e no caso são documentos, vídeos,  fotos e etc coisas
> que se você quiser quardar em 8m banco diretamente você teria um campo blob
> e não acho que alguém queira fazer um Where em um blob. Os nosql em geral
> funcionam melhor com estes dados e tem implementação mais fácil.
>

Existe uma grande confusao aqui. Estamos misturando os conceitos de
armazenamento, extracao, pesquisa, indexacao... Para armazenar arquivos a
melhor alternativa ainda eh o sistema de arquivos. Arquivos binarios ou
nao, seja qual for o formato, deixe a responsabilidade para o sistema de
arquivos.

Sobre indexar midias existem varios desafios e podemos perceber que de fato
o termo "nao estruturado" nao cabe aqui pois todos possuem uma estrutura
muito bem definida. Os desafios aqui remetem exatamente em decodificar tal
estrutura. Eu vou considerar os documentos como "documentos texto", nao
confundir com formato texto puro, tais como PDF's, arquivos M$ Word e
formatos livre como ODT. Neste caso eh muito simples decodifica tais
documentos, extrair os dados relevantes e indexa-los. O problema maior eh
quando precisamos indexar imagens e videos. Nesse caso temos que utilizar
tecnicas mais sofisticadas como visao artificial e existem muitas pesquisas
nessa area e ate "concursos" que envolvem grandes empresas e universidades.
Mas tudo isso nao tem absolutamente nada a ver com o banco de dados. Os
dados sao extraidos utilizando-se tais
tecnicas/algoritmos/bibliotecas/magica/vodoo.


> Os relacionais para suprir este problema implementam o full text sach mas
> nem todos ainda possuem está características. E por favor toda estrutura de
> dados tem um algoritmo mas eficaz para realizar buscas sobre elas. Acho que
> deixei bem claro estar falando do algoritmo e não dá forma como eles são
> organizados no banco.
>
Novamente uma confusao sobre os conceitos. Para simplificar o conceito
sobre full text search podemos pensar nele como uma pesquisa linguistica
onde pode operar em palavras e frases com base em uma determinada regra a
qual geralmente eh baseada em padroes linguisticos de idiomas especificos
como ingles, chines, portugues, etc...

Para finalizar, muito se fala em como os noSQL sao adotados "la fora". Bem,
aqui fora os dados importantes ainda sao tratados com muito criterio e
ainda precisa-se provar muita coisa. Existe muita publicidade sobre os
noSQL e muitas empresas de fato estao ganhando muito dinheiro com isso. Eu
ja conversei com no minimo uns 7 "consultores" noSQL apenas este ano os
quais falavam das vantagens e de tudo o que poderiamos ganhar se
adotassemos as solucoes deles. Eu acho muito interessante para armazenar
sessao de usuario, cache, e em alguns casos como auxilio para DW e geracao
de relatorios, graficos, etc... Eles tem sim seu uso mas nao sao tudo isso
que falam e propagam por ai.


PS. Desculpem-me pela falta de acentos mas ainda estou brigando com o meu
teclado :-\

Abc,


Charly Batista
_______________________________________________
pgbr-geral mailing list
pgbr-geral@listas.postgresql.org.br
https://listas.postgresql.org.br/cgi-bin/mailman/listinfo/pgbr-geral

Responder a