Re: Sorl

2019-10-15 Conversa Narcis Garcia
__
I'm using this express-made address because personal addresses aren't
masked enough at this mail public archive. Public archive administrator
should fix this against automated addresses collectors.
El 14/10/19 a les 23:30, Adrià ha escrit:
> On Mon, Oct 14, 2019 at 07:48:05PM +0200, Narcis Garcia wrote:
>>
>> Així que no es pot obtenir un programari DDG amb el qual muntar-te el
>> teu propi sistema d'indexació i cerca del web general, amb el teu propi
>> fons de dades web.
>> Amb Gigablast si, i això és el què busco amb més alternatives.
> 
> I amb Lok lak també! https://loklak.org
>>

Gràcies Adrià; és complicat obrir aquest portal de loklak amb seguretat
perquè està farcit de components i rastrejadors de Google.
La part servidor és interessant perquè sembla federable i hom es pot fer
la pròpia interfície o portal web (com amb Gigablast). De tota manera
sembla enfocat a indexar missatges de Twitter i similars; no pas el web
general.

Gigablast està compilat i empaquetat (.deb) i cerca tot el web (o allò
que se seleccioni).



Re: Sorl

2019-10-14 Conversa Adrià
On Mon, Oct 14, 2019 at 07:48:05PM +0200, Narcis Garcia wrote:
> 
> Així que no es pot obtenir un programari DDG amb el qual muntar-te el
> teu propi sistema d'indexació i cerca del web general, amb el teu propi
> fons de dades web.
> Amb Gigablast si, i això és el què busco amb més alternatives.

I amb Lok lak també! https://loklak.org
> 


signature.asc
Description: PGP signature


Re: Sorl

2019-10-14 Conversa Narcis Garcia
__
I'm using this express-made address because personal addresses aren't
masked enough at this mail public archive. Public archive administrator
should fix this against automated addresses collectors.
El 14/10/19 a les 19:14, Alex Muntada ha escrit:
> No sé com de difícil deu ser de muntar, però diria que el
> DuckDuckGo és programari lliure i a github hi ha una pila de
> repositoris a la seva organització. Espero que et serveixi.

Els projectes que veig a Github són per a utilitzar els serveis de
DuckDuckGo (API), apart d'elements del seu web, com són la documentació
i la traducció a idiomes (que els va molt bé la mà d'obra gratis).

El seu programari essencial és privatiu, apart de què no és descarregable
https://en.wikipedia.org/wiki/DuckDuckGo
(igual com passa amb Google, Bing, etc.)

Així que no es pot obtenir un programari DDG amb el qual muntar-te el
teu propi sistema d'indexació i cerca del web general, amb el teu propi
fons de dades web.
Amb Gigablast si, i això és el què busco amb més alternatives.



Re: Sorl

2019-10-14 Conversa Alex Muntada
Hola Narcis,

> Entenc que Xapian és programari auxiliar per a dotar una
> aplicació a fer cerques sobre les seves pròpies dades

Efectivament, jo entenc el mateix.

> Gigablast és un programari per a posar en marxa un cercador
> equivalent al DuckDuckGo, Google, Bing, etc: Amb la seva
> interfície web, API, el seu robot per a explorar el web
> d'Internet, etc.

No sé com de difícil deu ser de muntar, però diria que el
DuckDuckGo és programari lliure i a github hi ha una pila de
repositoris a la seva organització. Espero que et serveixi.

Salut!
Alex

--
  ⢀⣴⠾⠻⢶⣦⠀
  ⣾⠁⢠⠒⠀⣿⡁   Alex Muntada 
  ⢿⡄⠘⠷⠚⠋   Debian Developer  log.alexm.org
  ⠈⠳⣄



signature.asc
Description: PGP signature


Re: Sorl

2019-10-11 Conversa Narcis Garcia
__
I'm using this express-made address because personal addresses aren't
masked enough at this mail public archive. Public archive administrator
should fix this against automated addresses collectors.
El 10/10/19 a les 22:46, Alex Muntada ha escrit:
> Hola Narcis,
> 
>> Algú coneix alternatives (lliures, és clar) a Gigablast i del
>> mateix tipus?
> 
> Del mateix tipus no t'ho sabria dir però diversos serveis de
> debian.org utilitzen https://xapian.org/ com a indexador per a
> les cerques.

Entenc que Xapian és programari auxiliar per a dotar una aplicació a fer
cerques sobre les seves pròpies dades (?).

Gigablast és un programari per a posar en marxa un cercador equivalent
al DuckDuckGo, Google, Bing, etc: Amb la seva interfície web, API, el
seu robot per a explorar el web d'Internet, etc.



Re: Sorl

2019-10-10 Conversa Alex Muntada
Hola Joan,

> la sol·lució natural és deixar de banda la cerca en BBDD i
> usar Apache Sorl.

Veig que poses Sorl en diversos llocs i en realitat és Solr
(Solar però amb l'a muda). Ho comento perquè si busques
referències i informació sobre sorl potser no trobis gaires
resultats.

> D'entrada pensava simplement agafar un servidor

Vols dir que no hi ha coses més lleugeres que puguis tenir
al mateix servidor on hi ha el drupal? La primera que em ve
al cap és la que comentava fa una estona: xapian.

Salut,
Alex

--
  ⢀⣴⠾⠻⢶⣦⠀
  ⣾⠁⢠⠒⠀⣿⡁   Alex Muntada 
  ⢿⡄⠘⠷⠚⠋   Debian Developer  log.alexm.org
  ⠈⠳⣄



signature.asc
Description: PGP signature


Re: Sorl

2019-10-10 Conversa Alex Muntada
Hola Narcis,

> Algú coneix alternatives (lliures, és clar) a Gigablast i del
> mateix tipus?

Del mateix tipus no t'ho sabria dir però diversos serveis de
debian.org utilitzen https://xapian.org/ com a indexador per a
les cerques.

Salut,
Alex

--
  ⢀⣴⠾⠻⢶⣦⠀
  ⣾⠁⢠⠒⠀⣿⡁   Alex Muntada 
  ⢿⡄⠘⠷⠚⠋   Debian Developer  log.alexm.org
  ⠈⠳⣄



signature.asc
Description: PGP signature


Re: Sorl

2019-10-08 Conversa Narcis Garcia
Algú coneix alternatives (lliures, és clar) a Gigablast i del mateix tipus?



__
I'm using this express-made address because personal addresses aren't
masked enough at this mail public archive. Public archive administrator
should fix this against automated addresses collectors.
El 7/10/19 a les 17:26, Narcis Garcia ha escrit:
> En això del programari de cerca web, jo només he tocat Gigablast.
> Malgrat que no està gaire mantingut, segueix funcionant i fa el què se
> li demana.
> 
> 
> 
> __
> I'm using this express-made address because personal addresses aren't
> masked enough at this mail public archive. Public archive administrator
> should fix this against automated addresses collectors.
> El 7/10/19 a les 16:21, Joan Cervan ha escrit:
>> Hola,
>>
>> En una web que porto, amb drupal, les cerques son molt lentes, i la
>> sol·lució natural és deixar de banda la cerca en BBDD i usar Apache
>> Sorl.
>>
>> D'entrada pensava simplement agafar un servidor (VPS o cloud), amb 8Gb
>> de RAM, 4 o 8 processadors i 100 o 200Gb de disc SSD, bàsicament perquè
>> em penso que son els paràmetres que li van bé a java i Sorl (no hi ha
>> formules màgiques de "requeriments mínims, etc.", perquè depèn molt de
>> la quantitat d'info a indexar, el volum de cerques a fer, etc. Els meus
>> requisits, potser amb excepció de la quantitat d'info, i ni això, no
>> son molt alts (em penso), i per tant volia tirar de la configuració
>> superior i plantejar-me el servidor per donar servei a clients
>> diversos...
>>
>> Però el que estic veient és que, com tot, això del Sorl és una ciència
>> i no tinc clar si optar per un SaaS (acostumen a ser cars) o opcions
>> preinstal·lades / modulars (he vist per sobre Bitnami). De moment
>> encara vaig una mica peix, i només us ho comentava per si algú de
>> valtros en te experiència, en això del Sorl, o les JVE i em podia
>> orientar (per acabar-ho d'adobar he descobert per a què serveix Tomcat,
>> i ara tinc un dubte més: muntar Sorl sobre Tomcat a Debian? Te sentit,
>> això? És una alternativa més lliure que muntar-ho amb el java
>> d'Oracle??
>>
>> Apa, ja em direu,
>>
>> Salutacions,
>>
> 



Re: Sorl

2019-10-08 Conversa Joan Cervan
De fet no necessito una eina tant potent com per treballar en cluster.
Simplement voldria algo més potent que una cerca en BBDD. I he vist que
Sorl és relativament complexa d'instal·lar i administrar (o més ben dit
de configurar/afinar). Possiblement per l'ús que li vull donar no
caldria ni afinar massa, si la màquina te recursos de sobres, però
vaja, veig que no és un instal·la i funciona, sinó un intal·la,
analitza el funcionament, i ves afinant... Si és que vols millorar el
rendiment, clar... igual això és com compilar-se a ma un kernel, que en
general, no fem :-p (Gentoo a banda, si no ho tinc mal entès).

-- 
Joan Cervan Andreu
Desenvolupament web / Web developer
Drupal - Moodle - CiviCRM
+34 635 40 31 04
https://www.calbasi.net



El Tue, 08 Oct 2019 20:00:14 +0200
roger.sic...@gmail.com va escriure:

> Bones,
> 
> com a motor d'indexació també hi ha Elasticsearch, que està pensat
> per treballar en mode clúster. Sinó també pots mirar de configurar
> algun sistema de caché aplicatiu amb redis o memcache. Les dues
> solucions són complementàries.
> 
> Salut !
> 
> On October 7, 2019 8:17:31 PM GMT+02:00, Antoni Villalonga
>  wrote:
> >On Mon, Oct 07, 2019 at 04:21:54PM +0200, Joan Cervan wrote:  
> >> Hola,
> >> 
> >> En una web que porto, amb drupal, les cerques son molt lentes, i la
> >> sol·lució natural és deixar de banda la cerca en BBDD i usar Apache
> >> Sorl.  
> >
> >Hola,
> >
> >Com a alternativa pots provar sphinx. És un motor full-text search.
> >
> >Jo vaig fer un petit script que recull dades de la bd i les volca al
> >sphinx (un
> >cop cada hora, amb el cron).
> >
> >La cerca es pot fer amb comandes sql, emprant el connector mysql cap
> >al sphinx.
> >
> >Salut!
> >
> >-- 
> >Antoni Villalonga
> >http://friki.cat/  
> 



-- 
Joan Cervan Andreu
Desenvolupament web / Web developer
Drupal - Moodle - CiviCRM
+34 635 40 31 04
https://www.calbasi.net



Re: Sorl

2019-10-08 Conversa Joan Cervan
Em descuidava de dir que elasticsearch si que està molt suportat per
drupal, i pel que veig, molt usat... M'ho he apuntat com a opció a
analitzar i tenir en compte.

Merci!

-- 
Joan Cervan Andreu
Desenvolupament web / Web developer
Drupal - Moodle - CiviCRM
+34 635 40 31 04
https://www.calbasi.net



El Tue, 08 Oct 2019 20:00:14 +0200
roger.sic...@gmail.com va escriure:

> Bones,
> 
> com a motor d'indexació també hi ha Elasticsearch, que està pensat
> per treballar en mode clúster. Sinó també pots mirar de configurar
> algun sistema de caché aplicatiu amb redis o memcache. Les dues
> solucions són complementàries.
> 
> Salut !
> 
> On October 7, 2019 8:17:31 PM GMT+02:00, Antoni Villalonga
>  wrote:
> >On Mon, Oct 07, 2019 at 04:21:54PM +0200, Joan Cervan wrote:  
> >> Hola,
> >> 
> >> En una web que porto, amb drupal, les cerques son molt lentes, i la
> >> sol·lució natural és deixar de banda la cerca en BBDD i usar Apache
> >> Sorl.  
> >
> >Hola,
> >
> >Com a alternativa pots provar sphinx. És un motor full-text search.
> >
> >Jo vaig fer un petit script que recull dades de la bd i les volca al
> >sphinx (un
> >cop cada hora, amb el cron).
> >
> >La cerca es pot fer amb comandes sql, emprant el connector mysql cap
> >al sphinx.
> >
> >Salut!
> >
> >-- 
> >Antoni Villalonga
> >http://friki.cat/  
> 



-- 
Joan Cervan Andreu
Desenvolupament web / Web developer
Drupal - Moodle - CiviCRM
+34 635 40 31 04
https://www.calbasi.net



Re: Sorl

2019-10-08 Conversa Joan Cervan


Sphinx em sonava, però els mòduls per drupal estan majoritàriament en
desús, el que no em donava gaire confiança... De fet, hi ha mòdul per
la versió 8 de drupal.

Merci igualment!
 
-- 
Joan Cervan Andreu
Desenvolupament web / Web developer
Drupal - Moodle - CiviCRM
+34 635 40 31 04
https://www.calbasi.net



El Mon, 7 Oct 2019 18:17:31 +
Antoni Villalonga  va escriure:

> On Mon, Oct 07, 2019 at 04:21:54PM +0200, Joan Cervan wrote:
> > Hola,
> > 
> > En una web que porto, amb drupal, les cerques son molt lentes, i la
> > sol·lució natural és deixar de banda la cerca en BBDD i usar Apache
> > Sorl.  
> 
> Hola,
> 
> Com a alternativa pots provar sphinx. És un motor full-text search.
> 
> Jo vaig fer un petit script que recull dades de la bd i les volca al
> sphinx (un cop cada hora, amb el cron).
> 
> La cerca es pot fer amb comandes sql, emprant el connector mysql cap
> al sphinx.
> 
> Salut!
> 



-- 
Joan Cervan Andreu
Desenvolupament web / Web developer
Drupal - Moodle - CiviCRM
+34 635 40 31 04
https://www.calbasi.net



Re: Sorl

2019-10-08 Conversa roger . sicart
Bones,

com a motor d'indexació també hi ha Elasticsearch, que està pensat per 
treballar en mode clúster.
Sinó també pots mirar de configurar algun sistema de caché aplicatiu amb redis 
o memcache.
Les dues solucions són complementàries.

Salut !

On October 7, 2019 8:17:31 PM GMT+02:00, Antoni Villalonga  
wrote:
>On Mon, Oct 07, 2019 at 04:21:54PM +0200, Joan Cervan wrote:
>> Hola,
>> 
>> En una web que porto, amb drupal, les cerques son molt lentes, i la
>> sol·lució natural és deixar de banda la cerca en BBDD i usar Apache
>> Sorl.
>
>Hola,
>
>Com a alternativa pots provar sphinx. És un motor full-text search.
>
>Jo vaig fer un petit script que recull dades de la bd i les volca al
>sphinx (un
>cop cada hora, amb el cron).
>
>La cerca es pot fer amb comandes sql, emprant el connector mysql cap al
>sphinx.
>
>Salut!
>
>-- 
>Antoni Villalonga
>http://friki.cat/

-- 

Roger Sicart Rams

Re: Sorl

2019-10-07 Conversa Antoni Villalonga
On Mon, Oct 07, 2019 at 04:21:54PM +0200, Joan Cervan wrote:
> Hola,
> 
> En una web que porto, amb drupal, les cerques son molt lentes, i la
> sol·lució natural és deixar de banda la cerca en BBDD i usar Apache
> Sorl.

Hola,

Com a alternativa pots provar sphinx. És un motor full-text search.

Jo vaig fer un petit script que recull dades de la bd i les volca al sphinx (un
cop cada hora, amb el cron).

La cerca es pot fer amb comandes sql, emprant el connector mysql cap al sphinx.

Salut!

-- 
Antoni Villalonga
http://friki.cat/