Утилита для обучения и переобучения offroad-моделей сериализатора
хитов текстовой машины kernel/text_machine/util/text_machine_*_model.

На вход принимает протопул с хитами текстовой машины
в виде файла в final format или YT-таблицы.
YT-таблица скачивается целиком и обрабатывается локально, так что
если входной пул больше нескольких гигабайт, его лучше посэмплировать:
yt merge --mode auto --src <src> --dst <dst> --spec '{job_io={table_reader={sampling_seed=42;sampling_rate=0.001}};force_transform=%true}'

Обучение модели:
./gen_tmhits_model generate-model {--src-table <table>|--src-file <file>} \
    --dst-hit-model <text_machine_hit_model> \
    --dst-ann-model <text_machine_ann_model>
На выходе образуются две модели на замену text_machine_*_model.

Чтобы выяснить, лучше ли сжатие с новыми моделями и стоит ли возиться
с созданием новой версии (с учётом того, что десериализатор обязан
продолжать поддерживать предыдущие версии), есть режим вычисления
сжатого размера хитов из файла/таблицы протопула; можно сравнить результаты
сжатия текущими и свежеобученными моделями.
./gen_tmhits_model calc-compressed-size {--src-table <table>|--src-file <file>} \
    --src-hit-model <text_machine_hit_model> \
    --src-ann-model <text_machine_ann_model>
