Пользовательский интерфейс к выделению форумной разметки
kernel/indexer/tfproc/forumlib

Требует файла dict.dict для распознавания кодировки и языка,
опционально файла htparser.ini для дополнительной настройки парсера.

Умеет парсить файлы из указанной папки (опция -f), опционально gzip-ованные
(определяется по суффиксу .gz), а также скачивать по HTTP урлы, задаваемые
на stdin (опция -d). Опционально создаёт текстовый архив, который можно
просматривать tarcview -mz (так нагляднее по сравнению с
[номер предложения.номер слова] видно, чему соответствуют выделяемые зоны).

Для тестов использовались страницы, собранные в
arcadia_tests_data/forums_tests_data/. Запуск для воспроизведения
results.txt: forums -c ../recognize -f files -m list.txt.
