Как-то года полтора назад я писал про Lexile — инструмент оценки простоты/сложности текста и возможность его использования для документов по ИБ. И вот наткнулся в Интернете на немного другой (автор вообще считает его немного забавным), но все же похожий сервис — Wordle. Суть сервиса проста — он подсчитывет подсунутые ему тексты и выдает на выходе графическую карту частоты слов, удалив предварительно слова, не несущие смысловой нагрузки. Получается достаточно интересно. Вот как, например, выглядит мой блог за последнюю неделю:
За счет визуализации сразу становится видно, о чем я писал — ПДн, ФСБ, локализация. А вот как выглядит ФЗ-152:
Термин «персональные данные» превалирует над всеми остальными словами. На втором месте — «субъект», «обработка», «право», «РФ». Ну и т.д.
Не могу сказать, что практическая ценность у этого инструмента высока, но все равно — достаточно интересно. А в ряде случаев может помочь выявить явные перекосы в использовании того или иного слова.
ЗЫ. С русским языком сервис работает неплохо. Только вот морфологию не учитывает.