Чи з'явиться текстова версія словників для завантаження?

Тут обговорюються словники e2u та концепція їх розвитку

Модератор: Анатолій

Віталій Цибуляк
Повідомлень: 1
З нами з: Нед лютого 06, 2011 8:15 pm

Чи з'явиться текстова версія словників для завантаження?

Повідомлення Віталій Цибуляк »

... власне, як було з dict.linux.org.ua, де завжди можна було завантажити найостаннішу версію. Зробіть це бодай для словника ІТ, щоб можна було ним користуватися поза зв'язком, використовувати для автоматизованої обробки тексту. Яка ліценція застосовується для даних словників? Підказка щодо пошуку: деякі терміни в англійській пишуться як через дефіс, так і без, або навіть разом; додайте пераметр пошуку який дозволяв би знаходити такі вирази (/off[- ]?line/i - приблизний збіг = loose match). В ріп'яшках (куках) або в параметрах потрібно дати можливість користувачеві обрати уставний словник.

Загалом двигунець непоганий.
Andriy
Адміністратор сайту
Повідомлень: 3777
З нами з: Сер травня 27, 2009 8:23 pm

Re: Чи з'явиться текстова версія словників для завантаження?

Повідомлення Andriy »

Для словника ІТ спробую зробити версію для звантаження
Для загального теж, але дещо згодом, коли він досягне значного об’єму
Щодо інших словників (зокрема Кратка, Мейнаровича) запитав авторів

Ліцензію, я думаю варто взяти CC BY-SA (Creative Commons Share Alike), як у вікіпедії, але ще тре подивитися інші варіанти і поміркувати; якщо будуть пропозиції у спільноти — прохання пропонувати

Лишилося тільки вибрати формат, варіантів напевне 3:
* текстовий
* pdf
* GoldenDict/Lingvo
tech
Повідомлень: 52
З нами з: Нед лютого 06, 2011 11:01 pm

Re: Чи з'явиться текстова версія словників для завантаження?

Повідомлення tech »

Голосую за (універсальний) текстовий, який:

1. завжди можна перевести в інші формати
2. добре стискається
3. не вимагає спеціальних знарядь для перегляду
3. підходить для використання в моїх власних іграшкових програмках-словниках :D (жартую звичайно)

Треба виставити тему на обговорення, можливо створити опитування на linux.org.ua.
Andriy
Адміністратор сайту
Повідомлень: 3777
З нами з: Сер травня 27, 2009 8:23 pm

Re: Чи з'явиться текстова версія словників для завантаження?

Повідомлення Andriy »

Віталій Цибуляк писав:Підказка щодо пошуку: деякі терміни в англійській пишуться як через дефіс, так і без, або навіть разом; додайте пераметр пошуку який дозволяв би знаходити такі вирази (/off[- ]?line/i - приблизний збіг = loose match).
1) приблизний збіг, думаю можна реалізувати, це, напевне, буде soundex або щось на штиб цього; якщо є інши пропозиції, пишіть
2) щодо слів з дефісом та без, тенденція в загальному словнику подавати обидва написання, можливо було б добре обробляти таке автоматом, але не знаю як це зробити автоматом: пробувати вставляти/прибирати дефіси по всьому слову занадто дорого, знову ж таки, якщо є ідеї, буду вдячний
Віталій Цибуляк писав: В ріп'яшках (куках) або в параметрах потрібно дати можливість користувачеві обрати уставний словник.
напевне в цьому є сенс, але зараз сайт взагалі не користується куками, окрім того, поки e2u має лише три словники тож обирати окремий може не є такою нагальною проблемою, тре подумати та проаналізувати запити…
Віталій Цибуляк писав: Загалом двигунець непоганий.
дякую
dubyk
Повідомлень: 1
З нами з: Сер лютого 16, 2011 10:57 am

Re: Чи з'явиться текстова версія словників для завантаження?

Повідомлення dubyk »

Голосую також за додатково й у форматі StarDict
1) На dict.linux.org.ua раніше можна було стягнути словник у цьому форматі
2) Формат StarDict-у читають багато програм (StarDict, Babiloo, GoldenDict, qStarDict та консольна sdcv)
3) У цьому форматі поширюються деякі вільні словники у дистрибутивах Linux, зокрема
а) ABZ.cz: slovník cizích slov (сайт http://slovnik-cizich-slov.abz.cz/, пакунки http://packages.debian.org/wheezy/stardict-czech)
б) GNU/FDL Anglicko-Český slovník (сайт http://cihar.com/software/slovnik/, пакунки http://packages.debian.org/squeeze/star ... lish-czech)
в) The Free Vietnamese Dictionary Project (сайт http://www.informatik.uni-leipzig.de/~duc/Dict/)
г) XMLittré (сайт http://francois.gannaz.free.fr/Littre/, пакунок http://packages.debian.org/wheezy/stardict-xmlittre)
Andriy
Адміністратор сайту
Повідомлень: 3777
З нами з: Сер травня 27, 2009 8:23 pm

Re: Чи з'явиться текстова версія словників для завантаження?

Повідомлення Andriy »

Розмовляв з авторами словників Мейнаровича, Кратка та Кочерги, Мейнаровича і поки викласти повністю словники не вийде.
Можна викласти словник ІТ, але він тепер без словника Мейнаровича, Кратка, так що досить маленький, і змін не так вже багато порівняно з версією з dict.linux.org.ua

Так що версії для звантаження будуть, можливо, з часом.
sikemo
Повідомлень: 3091
З нами з: Пон травня 13, 2013 7:58 pm

Re: Чи з'явиться текстова версія словників для завантаження?

Повідомлення sikemo »

а як щодо словника судинних рослин?
Andriy
Адміністратор сайту
Повідомлень: 3777
З нами з: Сер травня 27, 2009 8:23 pm

Re: Чи з'явиться текстова версія словників для завантаження?

Повідомлення Andriy »

sikemo писав:а як щодо словника судинних рослин?
є сподівання, що згодом цей словник з'явиться для звантаження
SavageUkr
Повідомлень: 2
З нами з: Вів грудня 11, 2018 9:34 pm

Re: Чи з'явиться текстова версія словників для завантаження?

Повідомлення SavageUkr »

Я користуюсь Голдендиктом на Андроїді та компі. Дуже зручно, особливо коли нема інтернета.

Чи є десь версія вашого словника (всіх, або хоча б Загального народного) під Голдендікт (dsl формат)? Якщо ні, то хоча б текстової версії (як-то html, word) - я тоді самотужки спробую перегнати.
Andriy
Адміністратор сайту
Повідомлень: 3777
З нами з: Сер травня 27, 2009 8:23 pm

Re: Чи з'явиться текстова версія словників для завантаження?

Повідомлення Andriy »

На жаль, на більшість словників https://e2u.org.ua ми отримали лише дозвіл на викладання в базу пошуку сайту.
Народний теоретично можна було б викласти в тексті, але він має лише трішки понад 4 тис. статей і не найчастотніших (переважно проблемних, за якими шукають, де інші словники не покривають, або дають несучасні значення тощо). Враховуючи те, що він один з 16 словників, скоріш за все сам по собі він буде не надто корисним. Окрім того він постійно поповнюється тож він може застарівати за декілька тижнів.
Відповісти

Повернутись до “Обговорення словників”