Створено проект, який демонструє можливості аналізу українських текстів через за допомогою LanguageTool.
Фактично, за допомогою одного файлу з декількох десятків рядків коду можна швидко аналізувати українські тексти (NLP) з локальних файлів або з вебсторінок.
Можливості:
* розбиття тексту на речення
* розбиття речень на лексеми
* тегування лексем (за допомогою словника https://github.com/arysin/dict_uk)
* зняття омонімії (поки що відносно базове)
* перевірка орфографії та граматики
Вимагає groovy 2.4 та java 8.
Сторінка проекту: https://github.com/arysin/nlp_uk
Відкритий проект NLP для української мови
Новини та оголошення про підтримку української в LanguageTool
Модератор: Анатолій
Перейти
- r2u.org.ua
- ↳ Новини
- ↳ Сучасний словник
- ↳ Обговорення статей
- ↳ Загальні питання
- ↳ Тлумачний словник
- ↳ Обговорення статей тлумачного
- ↳ Загальні питання
- ↳ Мовні консультації
- ↳ Питання правопису
- ↳ Правопис і термінологія
- ↳ Помилки і пропозиції
- ↳ Локалізація та програмні засоби
- ↳ LanguageTool
- ↳ Новини
- ↳ Помилки і пропозиції
- ↳ Різне
- e2u.org.ua
- ↳ Новини
- ↳ Обговорення статей
- ↳ Помилки і пропозиції
- ↳ Обговорення словників
- Переклади
- ↳ Оголошення/новини
- ↳ Науковий переклад
- ↳ Природничі науки, математика, медицина, загальна література
- ↳ Пропоновані до видання книжки
- ↳ Книжки, статті
- ↳ Переклад "Introduction to Algorithms"
- ↳ Рецензії, відгуки, огляди
- ↳ Конкурси, проєкти, ідеї...
- ↳ Технічні науки
- ↳ Вступ до алгоритмів
- ↳ Переклад "Deep Learning"
- ↳ Суспільні науки
- ↳ Гуманітарні науки
- ↳ Художній переклад
- ↳ Англійська мова
- ↳ Слов’янські мови
- ↳ Романо-германські мови
- ↳ Інші мови
- ↳ Перекладачі
- ↳ Порадник
- ↳ Література, присвячена перекладові
- ↳ Дитяча література
- ↳ Типографія
- Словники
- Мовна політика
- Інше
- ↳ Автоматика