Сторінка 1 з 1

Відкритий проект NLP для української мови

Додано: Пон березня 28, 2016 1:05 am
Andriy
Створено проект, який демонструє можливості аналізу українських текстів через за допомогою LanguageTool.
Фактично, за допомогою одного файлу з декількох десятків рядків коду можна швидко аналізувати українські тексти (NLP) з локальних файлів або з вебсторінок.

Можливості:
* розбиття тексту на речення
* розбиття речень на лексеми
* тегування лексем (за допомогою словника https://github.com/arysin/dict_uk)
* зняття омонімії (поки що відносно базове)
* перевірка орфографії та граматики

Вимагає groovy 2.4 та java 8.

Сторінка проекту: https://github.com/arysin/nlp_uk