Відкритий проект NLP для української мови
Додано: Пон березня 28, 2016 1:05 am
Створено проект, який демонструє можливості аналізу українських текстів через за допомогою LanguageTool.
Фактично, за допомогою одного файлу з декількох десятків рядків коду можна швидко аналізувати українські тексти (NLP) з локальних файлів або з вебсторінок.
Можливості:
* розбиття тексту на речення
* розбиття речень на лексеми
* тегування лексем (за допомогою словника https://github.com/arysin/dict_uk)
* зняття омонімії (поки що відносно базове)
* перевірка орфографії та граматики
Вимагає groovy 2.4 та java 8.
Сторінка проекту: https://github.com/arysin/nlp_uk
Фактично, за допомогою одного файлу з декількох десятків рядків коду можна швидко аналізувати українські тексти (NLP) з локальних файлів або з вебсторінок.
Можливості:
* розбиття тексту на речення
* розбиття речень на лексеми
* тегування лексем (за допомогою словника https://github.com/arysin/dict_uk)
* зняття омонімії (поки що відносно базове)
* перевірка орфографії та граматики
Вимагає groovy 2.4 та java 8.
Сторінка проекту: https://github.com/arysin/nlp_uk