Zdravim konferenciu,
potreboval by som poradit s analyzou textu. Texty su v slovencine a
potreboval by som v nich vyhladat klucove slova, ktore mam dopredu
definovane. Napriklad:
Definovana mnozina klucovych slov:
{Bratislava, Zvolen, Košice, Poprad}
text na analyzu:
Vitajte na oficiálnej
Zdravím,
to, co hledáte, je buď lemmatizace vstupního textu (převedení na základní
tvary), nebo naopak stemming klíčových slov (odvození dalších tvarů ze
základního tvaru). Nějaké knihovny určitě existují pro Lucene.
Filip Jirsák
2014-06-11 16:48 GMT+02:00 Ivan Polak ivan.po...@f4s.sk:
Prisaham, ze to neni pokus o Czech/Slovak flame :-),
ale kdyz existuje [1], urcite by to slo implementovat i slovensky...
[1]
http://www.elasticsearch.org/guide/en/elasticsearch/reference/current/analysis-lang-analyzer.html#czech-analyzer
On 06/11/2014 04:48 PM, Ivan Polak wrote:
Zdravim
dakujem za reakcie :-) doteraz som pouzival SOLR pre Lucene, skusim
pozriet ElasticSearch a pripadne ako pisete spravit pre Slovencinu.
zacal som tu, je to stemmer pre slovensky jazyk:
http://vi.ikt.ui.sav.sk/Projekty/Projekty_2008%2F%2F2009/Hana_Pifkov%C3%A1_-_Stemer
je to celkom dobre
Někde jsem to řešili, že jako klíčová slova jsme dávali slovní základ a
ten pak hledali. Celkem to fungovalo.
Takže
{Bratislav, Zvolen, Košic, Poprad}
Michal
Dne 11.6.2014 16:48, Ivan Polak napsal(a):
Zdravim konferenciu,
potreboval by som poradit s analyzou textu. Texty su v slovencine a
Pozdravujem,
skuste pozriet niektory z projektov v [1]. Prakticke skusenosti sice
nemam, ale viackrat sa spominalo pouzitie hunspellu, napr. v [2].
[1] http://www.sk-spell.sk.cx/
[2]
http://www.zdrojak.cz/clanky/elasticsearch-vyhledavame-hezky-cesky-ii-a-taky-slovensky/
On 11.6.2014 16:48,
Zdravím konferenci,
trápím se s autentizací uživatelů v Apache DS.
Rád bych tu našel člověka, který mi příslušnou funkcionalitu rozchodí - a
to tak, že ho posadím ke svému počítači a nechám ho problém vyřešit, a
následně mu za vyřešení zaplatím smluvenou odměnu. V danou chvíli si už
nejsem jistý,
Ahojte,
jestli jde pouze o LDAP a nepotřebujete Kerberos, tak by to mělo být dost
přímočaré - jednoduchý bind s danými credentials pro ověření hesla. Nebojte
se toho. :-)
Já pro testování s ApacheDS občas používám all-in-one JAR, který má sice
hard-codované jméno partition dc=jboss,dc=org, ale
Netvrdím že je to těžké, jen se už nějakou dobu nemohu dostat přes LDAP:
error code 34 - invalid DN while bind, přestože čtení přes search chodí.
A protože se potřebuji věnovat i něčemu jinému, rád bych to někomu zadal k
vyřešení a zaplatil za tu práci.
Jirka
Dne 11. června 2014 23:13 Josef