Сторінка 1 з 1

База слів

Додано: Сер жовтня 29, 2014 2:25 pm
Yola
Цікавить база українських слів. Наприклад, мені треба знайти аналог слову bookkeeper, яке має 2-o, 2-k, 3-e. Тобто треба знайти таке слово, яке матиме таку ж кількість повторів, наприклад, 2-і, 2-б, 3-а. Якби мати базу то можна написати програму, яка це зробить. Чи не надасть хтось мені таку базу? Дякую.

Re: База слів

Додано: Сер жовтня 29, 2014 3:23 pm
Andriy
Проект http://sourceforge.net/projects/ispell-uk/ для перевірки орфографії (словник з якого також використовується в LanguageTool) має 140 тис лем (~2,5 млн словоформ).

з 2-і, 2-б, 3-а в тій базі є 266 слів, ось команди, щоб отримати такий список (під Лінуксом):

Код: Виділити все

make regtest
cut -f 1 -d ' ' test/all_aspell.lst | grep "і.*і" | grep "о.*о" | grep "а.*а"

Re: База слів

Додано: Нед січня 25, 2015 9:46 pm
sikemo
вас цікавить база слів якою мовою? EN, UK?

Re: База слів

Додано: П'ят червня 24, 2016 9:28 am
Yola
Зараз вчу дуга на програміста, як навчальний проект він почав розробляти сайт кросвордів. Чи є десь база слів? Тут потрібно вміти вибирати лише іменники. Якщо б це був тлумачний словник, щоб одразу показувати тлумачення. то було б пречудово!

Тобто на сайті буде можливість створювати кросворди і також допомога в розгадуванні. Ось наприклад, словник кросвордиста

Re: База слів

Додано: Сер червня 29, 2016 5:13 am
Andriy
Yola писав:Зараз вчу дуга на програміста, як навчальний проект він почав розробляти сайт кросвордів. Чи є десь база слів? Тут потрібно вміти вибирати лише іменники. Якщо б це був тлумачний словник, щоб одразу показувати тлумачення. то було б пречудово!

Тобто на сайті буде можливість створювати кросворди і також допомога в розгадуванні. Ось наприклад, словник кросвордиста
Ось тут є проект українського словника https://github.com/arysin/dict_uk
Налічує понад 206 тис. лем, якщо треба лише іменники в початковій формі можна вибрати за прапорцями /n*
Для означень найпростіше взяти десь СУМ-11.