Živijo, Matija Šuklje je 22/12/2019 ob 17:42 napisal: > Najbližje kot sem prišel je<http://bos.zrc-sazu.si/besede.html>, kjer bi > lahko enostavno HTML format predelal v plaintext seznam besed
taiste besede brez HTML so dostopne na http://hdl.handle.net/11356/1038, pa tudi sicer je na CLARIN.SI repozitoriju kar nekaj leksikalnih virov za slovenščino. Največji je Sloleks, http://hdl.handle.net/11356/1230, je pa tu problem, da je samo za nekomercialno rabo. Za kombinacije besed bi mogoče prišli kaj prav razni seznami n-gramov, cf. https://www.clarin.si/repository/xmlui/discover?filter=n-grams&filter_relational_operator=equals&filtertype=subject lp, Tomaž _______________________________________________ lugos-slo mailing list [email protected] http://liste2.lugos.si/cgi-bin/mailman/listinfo/lugos-slo
