LanguageTool

Помилки, знайдені при перевірці української граматики, а також пропозиції з покращення

Модератор: Анатолій

Maksym
Повідомлень: 4
З нами з: Пон січня 16, 2012 2:33 pm

LanguageTool

Повідомлення Maksym »

Чи хтось знає про підтримку української мови у проекті LanguageTool? Чи цей проект набув розвитку?

Andriy
Адміністратор сайту
Повідомлень: 3271
З нами з: Сер травня 27, 2009 8:23 pm

Re: LanguageTool

Повідомлення Andriy »

Я колись додав початкову підтримку української в LanguageTool, і додав декілька простеньких правил пунктуації, але далі забракло часу.
Насправді реальна користь від підтримки з’явиться лише якщо створити словник класифікацією і відмінюванням слів, тоді можна буде знаходити граматичні (і можливо навіть дещо стильові) помилки. Я колись почав це робити на базі словника spell-uk, і це досить реально, але страшенно мало часу. Якщо б хтось взявся з це, я міг би допомогти.
Насправді, додавання ґрунтовної підтримки української в languagetool була б хороша робота для бакалаврської а то і магістерської, але в мене бракує контактів, щоб знайти людину, яку б це зацікавило.

Maksym
Повідомлень: 4
З нами з: Пон січня 16, 2012 2:33 pm

Re: LanguageTool

Повідомлення Maksym »

Я маю талановиту аcпірантку, яка хотіла би займатися вдосконаленням LanguageTools.
Чи остання версія української частини міститься на https://languagetool.svn.sourceforge.ne ... nguageTool ?
Чи після цього Ви робили інші модифікації?

Andriy
Адміністратор сайту
Повідомлень: 3271
З нами з: Сер травня 27, 2009 8:23 pm

Re: LanguageTool

Повідомлення Andriy »

Так це остання версія. Але було б добре, якщо б вона зі мною зв’язалася і ми обговорили плани, бо там не зовсім тривіально: тре зробити серйозну роботу зі створення словника, щоб була база, на якій вже будувати правила. Якщо хтось на LT буде працювати, то я напевне міг би знайти час довести якісь речі там до ладу.

Re.
Повідомлень: 198
З нами з: П'ят жовтня 01, 2010 5:28 pm

Re: LanguageTool

Повідомлення Re. »

Між іншим, нещодавно з'явилась нова система для LibreOffice написана на пайтоні. Може, перспективніше вже з неї починати?

Andriy
Адміністратор сайту
Повідомлень: 3271
З нами з: Сер травня 27, 2009 8:23 pm

Re: LanguageTool

Повідомлення Andriy »

Re. писав:Між іншим, нещодавно з'явилась нова система для LibreOffice написана на пайтоні. Може, перспективніше вже з неї починати?
Чесно кажучи, я поки не бачу що ця нова система вміє (LT вміє багато, якщо є словникова підтримка). Думаю, варто почати з покращення підтримки української в LT, і потім, якщо дійсно цей новий проект буде кращим, можна буде перенести напрацьо́вання під нього.

Maksym
Повідомлень: 4
З нами з: Пон січня 16, 2012 2:33 pm

Re: LanguageTool

Повідомлення Maksym »

Так виглядає, що LightProof, запропонований для LibreOffice, не має морфологічного та граматичного розбору речення. Зате LightProof має прості правила, схожі на regexp. Якщо до LightProof додати розбір та стиснення словника, то зробити на ньому розбір буде досить просто

Re.
Повідомлень: 198
З нами з: П'ят жовтня 01, 2010 5:28 pm

Re: LanguageTool

Повідомлення Re. »

Якщо LanguageTool буде брати участь у цьогорічному Google Summer of Code, можна запропонувати долучення української як завдання. Винагорода — 5000 доларів студенту + 500 ментору доволі приваблива.

Андрію, ви цілком підходите на роль ментора. Спитайте в розробників LT, що вони планують цього року. Якщо проект додадуть, то можна пошукати студентів. Як гадаєте?

Maksym
Повідомлень: 4
З нами з: Пон січня 16, 2012 2:33 pm

Re: LanguageTool

Повідомлення Maksym »

Я виправив хибні повідомлення про те, що речення починається з малої літери (виникає, коли перше слово речення знайдене у словнику).
Яким чином можна додавати зміни до проекту? Хто може їх перевіряти?
Чи є десь спеціалізований форум щодо змін у LanguageTool, чи можна писати тут?

diff --git "a/UkrainianMyspellTagger-HEAD-left.java" "b/JLanguageTool\\src\\java\\org\\languagetool\\tagging\\uk\\UkrainianMyspellTagger.java"
index 90f00a1..204f9d2 100644
--- "a/UkrainianMyspellTagger-HEAD-left.java"
+++ "b/JLanguageTool\\src\\java\\org\\languagetool\\tagging\\uk\\UkrainianMyspellTagger.java"
@@ -125,7 +125,7 @@ public class UkrainianMyspellTagger implements Tagger {
lowerPosTags = wordsToPos.get(lowerWord);
if (lowerPosTags != null) {
for (String lowerPosTag : lowerPosTags)
- analyzedTokens.add(new AnalyzedToken(lowerWord, lowerPosTag,
+ analyzedTokens.add(new AnalyzedToken(word, lowerPosTag,
lowerWord));
}
}

Andriy
Адміністратор сайту
Повідомлень: 3271
З нами з: Сер травня 27, 2009 8:23 pm

Re: LanguageTool

Повідомлення Andriy »

Максиме, там є лист розсилки, напевне, найкраще латки слати туди, альтернативно я можу закинути латку напряму (щоправда мені доведеться налаштувати unit tests — я їх давно не проганяв). Форум є, але він, напевне, не для латок.

Відповісти

Повернутись до “Помилки і пропозиції”