ЛТ 2013

Новини та оголошення про підтримку української в LanguageTool

Модератор: Анатолій

Відповісти
Marchenko
Повідомлень: 156
З нами з: П'ят червня 12, 2009 6:49 am

ЛТ 2013

Повідомлення Marchenko »

Andriy
Адміністратор сайту
Повідомлень: 3777
З нами з: Сер травня 27, 2009 8:23 pm

Re: ЛТ 2013

Повідомлення Andriy »

Спробую трішки докладніше про це:

Нарешті вдалося допиляти підтримку української в двигуні перевірки граматики LanguageTool (http://languagetool.org/)
Поки що це лише основа: є словник частин мови на ~1млн словоформ, хоч і ще не зовсім дороблений, є базовий код на Java для підтримки української мови, і є пару десятків простих правил граматики: трішки пунктуації, трішки милозвучності (із-з, у-в), трішки кальок: «приймати участь» тощо, трішки узгодження: не дозволено мати прийменник перед дієсловом тощо. Також на деякі кальки (напр. активні дієприкметники) даються альтернативні варіанти.

Також я пройшовся по парі сайтів з мовними рекомендаціями (http://mova.kreschatic.kiev.ua, книжці Курило тощо) і спробував додати найпростіші для реалізації правила.

Зі мною раніше контактувало декілька людей, зацікавлених в роботі над цим проектом, але без словника частин мови мало що можна було зробити, тепер база є і можна залучати більше людей. Цей двигун може працювати в LibreOffice/OpenOffice (є додаток), також є додаток для Firefox, і він може працювати окремою програмою або на веб-сторінці.

Щоб зацікавити ширше коло людей я виставив поточну версію на нашому сайті http://r2u.org.ua/check, тож кожен може перевірити свій текст і помацати двигун.

Я проганяв двигун на текстах ДТ і він дещо показує (особливо на ранніх статтях 3 2000-х років), також виловлює деякі речі в статтях з тієї ж вікіпедії

Прохання до всіх згодувати йому 5-10 сторінок тексту і написати мені про свої враження. Зокрема:
* неправильні спрацьовування (фальшиві помилки)
* які правила конче треба додати (деякі правила реалізувати простіше ніж інші, напр. сталі сполуки найпростіше, щось де треба вважати на рід/відмінок трішки складніше, семантичні відмінності уловлювати взагалі поки не візьмусь — може колись потім)
* мовні помилки в повідомленнях
* інші зауваги

До речі робота на таким проектом могла б стати непоганою курсовою або навіть дипломною, тож якщо маєте вихід на потенційно зацікавлених студентів — пишіть.

Трішки докладніше українською про LanguageTool (і саме підтримку української в ньому) можна знайти, як вказано в попередньому повідомленні
Andriy
Адміністратор сайту
Повідомлень: 3777
З нами з: Сер травня 27, 2009 8:23 pm

Re: ЛТ 2013

Повідомлення Andriy »

Сьогодні на завершення першої фази вдосконалення словника було додано пару десятків правил неправильного вживання прийменника «по», буду вдячний за тестування та відгуки.
Відповісти

Повернутись до “Новини”