>>  Главная

>>  О программе
>>  Планы развития
>>  Помощь
>>  Статьи
>>  Форум
>>  Скачать программу
>>  Скачать словари
>>  Ссылки

Различные подходы создания словарей для Lingvo.
Последнее обновление :  01/11/2005 

     В этом документе предпринята попытка систематизировать все возможные варианты работ по созданию электронных словарей.
     Это не статичная статья, а постоянно пополняющаяся база, по результатам общения на форумах (LinvoDA и RU.Board) и обработки поступающей почты (LingvistRU[собака]yandex[ru]).
     Некоторые разделы представлены поверхностно, а некоторые (например 5.) проработаны подробно т.к. уже реализованы в DSL Editor. Планирую добавить примеры к каждому приведённому пункту.
     Цель: выявить список необходимых типовых операций для добавления в мою программу DSL Editor.

Перечень типичных операций

1. Сканирование бумажных словарей.
    1.1. Сканирование;
    1.2. Распознавание;
    1.3. Сохранение;
      1.3.1. Текст;
      1.3.2. Файл *.doc;
      1.3.3. Файл *.rtf;
    1.4. Корректировка и исправление ошибок распознавания;
    1.5. Предварительная обработка и подготовка к конвертации;
    1.6. Конвертация в DSL;
2. Ручной ввод. Пополнение и редактирование словаря.
    2.1. Добавление карточки (если таковой нет) или редактирование существующей;
3.Конвертация из файла
    3.1. то же что п.1.5.;
    3.2. Конвертация в файл из другово приложения; то же что п.1.6.;
4. Редактирование и форматирование словарей
    4.1. Изменение формата всего словаря;
      4.1.1. Установка единого отступа во всех карточках;
      4.1.2. Изменение цветового или шрифтового оформления выбранного элемента карточки применительно ко всему словарю;
      4.1.3. Добавление фонетической транскрипции ко всему словарю;
      4.1.4. Добавление строчки с ударением ко всему словарю;
      здесь можно придумать огромное количество вариантов;
5. Поиск и исправление ошибок (словарь в формате DSL), [в квадратных скобках код ошибки в DSL Editor]
    5.1. [10] Заголовок (Первые три или четыре для ANSI файлов строки в файле .DSL');
      5.1.1. [11] Ошибки написания разделов (ошибки написания зарезервированных слов);
      5.1.2. [12] Ошибки написания параметров(ошибки написания зарезервированных значений параметров);
      5.1.3. [13] Несоответствие заголовка и описания (несоответствие указанного в заголовке направления перевода содержанию словаря);
      5.1.4. [14] Ошибка в параметре CODE PAGE для ANSI (четвёртая строка - CODE PAGE должна быть определена для ANSI, в Unicode - этой строки может не быть);
      5.1.5. [15] Не поддерживаемые языки ;
    5.2. [20] Слово (Заголовок карточки)
      5.2.1. [21] Слово на другом языке (заголовок карточки, не на том языке который указан в заголовке словаря как "исходный язык");
      5.2.2. [22] Смешение символов в заголовке карточки (символы из разных кодовых страниц) (...);
      5.2.3. [23] Запрещённые символы (запрещённые символы в заголовке карточки);
        5.2.3.1 Символ @
        5.2.3.2 Символ ~
        5.2.3.3 Символ #
        5.2.3.3 Символ ^
      5.2.4. [24] Смешение символов и цифр (Слово (заголовок карточки) - содержит кроме символов цифры) (...);
      5.2.5. [25] Смешение символов и знаков (Слово (заголовок карточки) - содержит кроме символов знаки (например препинания)) (...);
      5.2.6. [26] Знаки и цифры без символов (Слово (заголовок карточки) - содержит только знаки и цифры);
      5.2.7. [27] Unicode символы в заголовке (Слово (заголовок карточки) - содержит символы Unicode);
      5.2.8. [28] Повторяющиеся карточки (Словарь содержит повторяющиеся карточки (дубли). Компилятор добавит в словарь только первую встреченную карточки. Дубль будет игнорирован);
      5.2.9. [29] Прочие ошибки (Все прочие ошибки в заголовке карточки);
    5.3. [30] Тело карточки (Здесь собраны ошибки относящиеся к содержанию карточки);
      5.3.1. [31] Не парные теги (Грубая ошибка. Строка, карточка а возможно весь словарь не будет скомпилирован);
      5.3.2. [32] Пустая карточка (Карточка будет пропущена компилятором. Возможно после заголовка карточки есть пустая строка);
      5.3.3. [33] Ошибка в расстановке тегов (Неправильная вложенность или неверное место установки тегов);
    5.4. [40] Ссылки
      5.4.1. [41] Подвешенная ссылка на другую карточку (Карточка на которую есть ссылка отсутствует) (...);
      5.4.2. [42] Ссылка на внешний файл мультимедиа (Ссылка на внешний файл ([s]картинка, звук, видео[/s]) на который есть ссылка в теле карточки);
      5.4.3. [43] Ссылка на карточку в другом словаре (В словаре есть ссылка ( [ref dict= ) на карточки во внешних словарях);
    5.5. [50] Пометы (Ошибка в пометах (стандартных сокращениях));
      5.5.1. [51] Отсутствует описание помет (В основном словаре помет (abbrev.dsl) и пользовательском ('+Name+'_abrv.dsl), отсутствует помета) (...);
      5.5.2. [52] Дублирование помет (Помета в пользовательском словаре ('+Name+'_abrv.dsl) полностью повторяет помету в основном словаре (abbrev.dsl));
    5.6. [60] Файловые ошибки (Ошибки и предупреждения в файлах словаря);
      5.6.1. [61] Нет файла описания (Отсутствует файл описания словаря('+Name+'.ann). Файл не обязателен);
      5.6.2. [62] Нет файла пользовательского словаря помет (Отсутствует файл пользовательского словаря помет ('+Name+'_abrv.dsl). Файл не обязателен) (...);
      5.6.3. [63] Нет картинки (Отсутствует файл картинки ('+Name+'.bmp). Файл не обязателен);
      5.6.4. [64] Нет файла ошибок компилятора (Отсутствует файл ошибок компилятора ('+Name+'.dde). Файл не обязателен);
      5.6.5. [65] Прочие ошибки (Прочие ошибки в файлах);
6.0 Объединение словарей  (объединяемые словари должны иметь одинаковое направление перевода)
    6.1. Режим сравнение словарей (анализ различий);
    6.2. Режим объединения словарей. Поиск дубликатов при слиянии;
      6.2.1. Полные аналоги пропускаются автоматически;
      6.2.2. Дублирующиеся карточки оцениваются визуально (...);
        6.2.2.1. Выбор одной из двух карточек;
        6.2.2.2. Если карточки имеют различные значения - свести в единую карточку;


Жду ваших комментариев и предложений.

В раздел статьи... ...
 

Copyright © 2005, DSLEditor. Связаться с автором LingvistRU[собака]yandex[точка]ru


   
Хостинг от uCoz