|
|
Различные подходы
создания словарей для Lingvo.
Последнее обновление :
01/11/2005
В этом документе предпринята попытка систематизировать все возможные
варианты работ по созданию электронных словарей.
Это не статичная статья, а постоянно пополняющаяся база, по результатам
общения на форумах (LinvoDA и RU.Board) и
обработки поступающей почты (LingvistRU[собака]yandex[ru]).
Некоторые разделы представлены поверхностно, а некоторые (например 5.)
проработаны подробно т.к. уже реализованы в DSL Editor. Планирую
добавить примеры к каждому приведённому пункту.
Цель: выявить список необходимых типовых операций для добавления в мою
программу DSL Editor.
Перечень типичных операций
1. Сканирование бумажных словарей.
1.1.
Сканирование;
1.2. Распознавание;
1.3. Сохранение;
1.3.1.
Текст;
1.3.2. Файл *.doc;
1.3.3. Файл *.rtf;
1.4.
Корректировка и исправление ошибок распознавания;
1.5. Предварительная обработка и подготовка к конвертации;
1.6. Конвертация в DSL;
2.
Ручной ввод. Пополнение и
редактирование словаря.
2.1.
Добавление карточки (если таковой нет) или редактирование
существующей;
3.Конвертация
из файла
3.1. то же
что п.1.5.;
3.2. Конвертация в файл из другово приложения; то же что п.1.6.;
4.
Редактирование и форматирование
словарей
4.1.
Изменение формата всего словаря;
4.1.1.
Установка единого отступа во всех карточках;
4.1.2. Изменение цветового или шрифтового оформления выбранного
элемента карточки применительно ко всему словарю;
4.1.3. Добавление фонетической транскрипции ко всему словарю;
4.1.4. Добавление строчки с ударением ко всему словарю;
здесь можно придумать огромное количество вариантов;
5.
Поиск и исправление ошибок (словарь
в формате DSL),
[в квадратных скобках код ошибки в DSL Editor]
5.1. [10]
Заголовок (Первые три или четыре для ANSI файлов строки в
файле .DSL');
5.1.1.
[11] Ошибки написания разделов (ошибки написания
зарезервированных слов);
5.1.2. [12] Ошибки написания параметров(ошибки написания
зарезервированных значений параметров);
5.1.3. [13] Несоответствие заголовка и описания (несоответствие
указанного в заголовке направления перевода содержанию словаря);
5.1.4. [14] Ошибка в параметре CODE PAGE для ANSI (четвёртая строка -
CODE PAGE должна быть определена для ANSI, в Unicode - этой строки
может не быть);
5.1.5. [15] Не поддерживаемые языки ;
5.2. [20]
Слово (Заголовок карточки)
5.2.1.
[21] Слово на другом языке (заголовок карточки, не на том языке
который указан в заголовке словаря как "исходный язык");
5.2.2. [22] Смешение символов в заголовке карточки (символы из разных
кодовых страниц) (...);
5.2.3. [23] Запрещённые символы (запрещённые символы в заголовке
карточки);
5.2.3.1
Символ @
5.2.3.2 Символ ~
5.2.3.3 Символ #
5.2.3.3 Символ ^
5.2.4.
[24] Смешение символов и цифр (Слово (заголовок карточки) -
содержит кроме символов цифры) (...);
5.2.5. [25] Смешение символов и знаков (Слово (заголовок карточки) -
содержит кроме символов знаки (например препинания)) (...);
5.2.6. [26] Знаки и цифры без символов (Слово (заголовок карточки) -
содержит только знаки и цифры);
5.2.7. [27] Unicode символы в заголовке (Слово (заголовок карточки) -
содержит символы Unicode);
5.2.8. [28] Повторяющиеся карточки (Словарь содержит повторяющиеся
карточки (дубли). Компилятор добавит в словарь только первую
встреченную карточки. Дубль будет игнорирован);
5.2.9. [29] Прочие ошибки (Все прочие ошибки в заголовке карточки);
5.3. [30]
Тело карточки (Здесь собраны ошибки относящиеся к содержанию
карточки);
5.3.1.
[31] Не парные теги (Грубая ошибка. Строка, карточка а возможно
весь словарь не будет скомпилирован);
5.3.2. [32] Пустая карточка (Карточка будет пропущена компилятором.
Возможно после заголовка карточки есть пустая строка);
5.3.3. [33] Ошибка в расстановке тегов (Неправильная вложенность или
неверное место установки тегов);
5.4. [40]
Ссылки
5.4.1.
[41] Подвешенная ссылка на другую карточку (Карточка на которую
есть ссылка отсутствует) (...);
5.4.2. [42] Ссылка на внешний файл мультимедиа (Ссылка на внешний файл
([s]картинка, звук, видео[/s]) на который есть ссылка в теле карточки);
5.4.3. [43] Ссылка на карточку в другом словаре (В словаре есть ссылка
( [ref dict= ) на карточки во внешних словарях);
5.5. [50]
Пометы (Ошибка в пометах (стандартных сокращениях));
5.5.1.
[51] Отсутствует описание помет (В основном словаре помет
(abbrev.dsl) и пользовательском ('+Name+'_abrv.dsl), отсутствует
помета) (...);
5.5.2. [52] Дублирование помет (Помета в пользовательском словаре
('+Name+'_abrv.dsl) полностью повторяет помету в основном словаре
(abbrev.dsl));
5.6. [60]
Файловые ошибки (Ошибки и предупреждения в файлах словаря);
5.6.1.
[61] Нет файла описания (Отсутствует файл описания
словаря('+Name+'.ann). Файл не обязателен);
5.6.2. [62] Нет файла пользовательского словаря помет (Отсутствует файл
пользовательского словаря помет ('+Name+'_abrv.dsl). Файл не обязателен) (...);
5.6.3. [63] Нет картинки (Отсутствует файл картинки ('+Name+'.bmp).
Файл не обязателен);
5.6.4. [64] Нет файла ошибок компилятора (Отсутствует файл ошибок
компилятора ('+Name+'.dde). Файл не обязателен);
5.6.5. [65] Прочие ошибки (Прочие ошибки в файлах);
6.0
Объединение словарей (объединяемые
словари должны иметь одинаковое направление перевода)
6.1. Режим
сравнение словарей (анализ различий);
6.2. Режим объединения словарей. Поиск дубликатов при слиянии;
6.2.1.
Полные аналоги пропускаются автоматически;
6.2.2. Дублирующиеся карточки оцениваются визуально (...);
6.2.2.1.
Выбор одной из двух карточек;
6.2.2.2. Если карточки имеют различные значения - свести в
единую карточку;
Жду ваших комментариев и предложений.
В раздел
статьи... ... |
|
|
|
|
|
|