В данный момент pure_compiler делает дамп как нового, так и старых форматов
pure. Из имеющихся здесь скриптов имеет смысл непосрественно запускать
dump2input.sh, который перекодирует результат дампа pure в формат, в котором
его можно подавать на вход pure_compiler'а, остальные вызываются изнутри
его. О своих аргументах он сообщит, если вызвать его без аргументов.

Формат входного файла для pure_compiler'а следующий: файл состоит из строк,
которые состоят из полей, разделённых символами табуляции. Все поля
обязательны, порядок полей в строке следующий:

1) ключ;
2) двухбуквенный код языка по ISO- (mis для LANG_UNK);
3) флаг --- целое число от 0 до 3, младший бит которого выставлен, если эта
строка описывает частоту TitleCase-капитализации ключа, а старший --- если
ключ является точной формой;
4) частота.

Строки в файле должны быть отсортированы по ключам, так как это позволяет
сэкономить память в компиляторе.

Вызывать компилятор на входном файле следует командой ./pure_compiler -lf
HEADER -i BODY OUTPUT.

Для перекодировки из старого входного формата pure --- "обычного" пуре с
языками (см.
arcadia/yweb/webutil/build_pure2/lemmatize_pure/read_me.txt) в описанный
выше есть скрипт old_input2input.sh. Параметров не берёт, читает из stdin,
пишет в stdout.

Для перелемматизации пуре:
1) в путях должен быть доступен pure_compiler
2) в папке со скриптами должен лежать новый lemmer-test

Для перелемматизации одного пуре надо запустить
./relemmatize_pure inputr_pure output_pure #могут совпадать

Для перелемматизации всех пуре - запустить relemmatize_all без параметров
