GitHub - nmingazov/uext-search: Search Engine for UIMA.Ext

Где я?

Это модуль, интегрирующий UIMA.Ext ( https://github.com/CLLKazan/UIMA-Ext/ ) c поисковым сервером (предположительно Solr) и key-value базой (пока не определенной).

Как запускать?

Помимо стандартного maven понадобится apache tomcat 7 (http://tomcat.apache.org/download-70.cgi). Параметры VM: -Xmx2048m -Dfile.encoding=UTF-8; Так же понадобится настроенная MongoDB(http://mongodb.org/).

Затем, необходимо перенастроить под себя properties, находящиеся в src/main/resources.

database.properties - параметры MongoDB: host, port, username, password и dbname (имя базы). Предварительно также нужно сконфигурировать пользователя внутри MongoDB.
uima.properties - нужно указать путь до dict.opcorpora.ser.

Что за dict.opcorpora.ser?

Это сериализованный словарь. Забудь, зачем. Для его получения нужно выкачать xml-словарь:

Скачать архив по адресу http://opencorpora.org/files/export/dict/dict.opcorpora.xml.bz2
Распаковать, получив dict.opcorpora.xml Затем в свободной папке:
git clone https://github.com/CLLKazan/UIMA-Ext.git
cd UIMA-Ext/UIMA.Ext.Morph.OpenCorpora
mvn install
mvn exec:exec -Dexec.executable="java" -Dexec.classpathScope="test" -Dexec.args="-Xmx1500m -cp %classpath ru.ksu.niimm.cll.uima.morph.opencorpora.resource.XmlDictionaryParser /path/to/dict.opcorpora.xml /serialized/dictionary/output/path"

В последней строке первый путь - это путь непосредственно к словарю dict.opcorpora.xml, второй - путь до формирующегося dict.opcorpora.ser (включая сам файл).

Тесты! Где же тесты?

Для них достаточно сделать mvn clean test

Name		Name	Last commit message	Last commit date
Latest commit History 36 Commits
src		src
.gitignore		.gitignore
pom.xml		pom.xml
readme.md		readme.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Где я?

Как запускать?

Что за dict.opcorpora.ser?

Тесты! Где же тесты?

About

Releases 2

Packages

Languages

nmingazov/uext-search

Folders and files

Latest commit

History

Repository files navigation

Где я?

Как запускать?

Что за dict.opcorpora.ser?

Тесты! Где же тесты?

About

Resources

Stars

Watchers

Forks

Releases 2

Packages 0

Languages

Packages