Опыт расчета меры лексической близости нормативных текстов

Одна из первых гипотез, которые я хочу проверить в рамках своей «генетической теории права» (оставим пока это название) – это гипотеза о том, что нормативные юридические тексты, [1] затрагивающие похожие области регулирования, будут к друг другу ближе, чем относящиеся к разным областям, причем эту меру близости можно посчитать, ничего не зная об их конкретном содержании. Это, конечно же, тривиальное предположение. Небольшую сложность представляет собой выбор способа, которым это можно сделать. Для этого я отобрал 36 нормативных текстов на чешском языке общим объемом 10 млн. знаков или 1,45 млн. слов и на нескольких сотнях случайных выборок из каждого текста сравнил совпадение использованных в них «словарей».

В него вошли:

  • важнейшие кодексы — гражданский кодекс, закон о торговых корпорациях, трудовой кодекс, уголовный кодекс,

  • процессуальные кодексы — гражданско-процессуальный кодекс, закон об особых судебных процедурах, кодекс исполнительного производства, уголовно-процессуальный кодекс, административный кодекс, кодекс административного судопроизводства, налоговый кодекс,

  • два закона из области частного права — закон о реорганизации торговых корпораций, закон о международном частном праве,

  • два крупнейших налоговых закона — о налогах на доходы и на прибыль и об НДС,

  • несколько законов из области административного права — строительный кодекс, антимонопольный закон, промысловый закон, закон о публичных закупках, закон о пребывании иностранцев,

  • два закона из уголовной области — закон об уголовной ответственности юридических лиц, закон о проступках,

  • несколько законов смешанного регулирования — закон о банкротстве, кадастровый закон, закон о нотариате, закон о публичных реестрах,

  • важнейшие конституционные тексты — конституция Чешской республики, декларация основных прав и свобод,

  • несколько европейских директив и регламентов — Брюссель I bis, Рим I, GDPR, директива об НДС, регламент о банкротстве,

  • учредительные документы ЕС — договор о функционировании ЕС и хартия об основных правах,
    международный договор — ЕКПЧ.

Большинство полученных результатов совпадают с тем, что практикующие юристы знают и без всяких расчетов:

  • процессуальные кодексы между собой имеют больше общего, чем с соответствующими им кодексами, содержащими нормы материального права,

  • тексты европейского права пишутся на «брюссельском» языке, который существенно отличается от нормального чешского юридического языка; это проявляется в том, что все он имеют между собой больше общего, чем с текстами национального права в соответствующих областях,

  • законы из области административного права близки к процессуальным кодексам,

  • конституционное право - это вещь в себе, относительно мало что дает и мало что заимствует из других областей.

А вот «птичий язык» налогового права, по крайней мере на уровне лексики, не так уж отличается от языков других отраслей. Возможно, что его сложность кроется в странных синтаксических конструкциях, множестве внутренних ссылок и повышенной изменчивости, но эти предположения еще надо проверить.

Язык конституционного права относительно экономен: в среднем более короткие тексты насыщены понятиями, многие из которых потом нигде больше не используются. Наоборот, гражданский кодекс, закон о торговых корпорациях, закон о реорганизации торговых корпораций имеют наименьшую «плотность»: на большой объем текста в них встречается относительно меньше понятий, чем в других текстах. Но наиболее избыточен, если применять этот критерий, не гражданский кодекс, а закон о пребывании иностранцев. Также относительно менее насыщены понятиями уголовный процессуальный кодекс, закон о банкротстве, закон о налогах на доходы и прибыль, строительный кодекс.

Большие кодексы уже в силу своего объема и широкого охвата вносят, конечно же, наиболее значительный вклад в общую юридическую лексику. На первом месте тут гражданский кодекс, на третьем и пятом – уголовно-процессуальный и гражданско-процессуальный, четвертое место у закона о налогах на доходы и прибыль. А вот второе место занял договор о функционировании ЕС и это, возможно, связано с тем, что он приносит в чешское право «брюссельский язык». 

Последний вывод не удивит юристов, занимающихся налоговым правом: нет ничего более далекого от прав и свобод человека, чем налоговое право.

А вот так выглядит на картинке [2] то, что я описал словами.

Видно, что европейское право (SFEU, Brusel, NIns, GDPR, Řím) живет в своем мире: связи от него к национальному чешскому праву идут только через директиву об НДС (SDPH) к закону об НДС (ZDPH) и от закона о международном частном праве (ZMPS) к регламенту Брюссель I bis (Brusel).

Права человека (LZPEU, LZPS, ÚLP) — это тоже свой отдельный мир, который связан с остальными нормативными текстами только через уголовно-процессуальный кодекс (TŘ). Выявилась связь между ЕКПЧ (ÚLP) и договором о функционировании ЕС (SFEU), а также между хратией ЕС об основных свободах (LZPEU) и регламентом GDPR.

Юристов-процессуалистов должно, наверное, порадовать, что больше всего связей, помещающих их в центр системы нормативных текстов, имеют процессуальные кодексы: гражданско-процессуальный (OSŘ), административный (SŘ), административного судопроизводства (SŘS), уголовно-процессуальный (TŘ), исполнительного производства (EŘ). Хотя три процессуальных кодекса — гражданский, административный и административного правосудия — составляют полный граф, их близость друг к другу может объясняться сходством стилистики текста, а не только содержания и предмета регулирования.

Гражданско-процессуальный кодекс (OSŘ) не выглядит как главный процессуальный нормативный документ частного права. Такая характеристика скорее подходит закону о банкротстве (IZ) и в меньшей степени закону об особых судебных процедурах (ZZŘS). Сам гражданско-процессуальный кодекс связан с частным правом уже через них.

Уголовно-процессуальный кодекс (TŘ) отличается тем, что имеет более сильные связи с другими нормативными текстами из области уголовного и проступкового права (TZ, ZTOPO, ZOP), чем с процессуальными кодексами. То же можно сказать о законе о проступках (ZOP).

Неожиданные связи кодекса исполнительного производства (EŘ) с другими нормативными текстами требуют своего объяснения. Возможно, что это следствие комплексного характера регулирования на границе гражданского и административного права.

Конституционное право (ÚČR, LZPS), которое теория помещает на вершину иерархии правовых норм, обитает на периферии, только через закон о конституционном суде (ZÚS) связано с «процессуальным ядром». Между конституцией (ÚČR) и административным правом связь проходит через закон о муниципалитетах (ZOB). Последний же больше тяготеет к административному праву, чем к конституционному. То же можно сказать и об остальных важнейших отраслях: гражданском (NOZ, ZOK, ZMPS), уголовном (TZ, ZTOPO, ZOP), налоговом (ZDPH, ZDP) и административном праве (SZ, ZOHS, ZZVZ): они не находятся в центре, а связаны с ним через процессуальные кодексы.

В общем, картинка во многом ожидаемая, но есть и некоторые аномалии, объяснение которым будет интересно поискать. Например, неожиданными оказались связи закона об авторском праве (AZ), трудового кодекса (TZ), закона о пребывании иностранцев (ZPC).


[1] Термин «нормативные тексты» используется намеренно вместо привычного «нормативно-правовой акт». В разных правовых системах источниками права могут служить разные типы юридических текстов. По очевидным причинам мне проще начать свои исследования с романо-германской правовой семьи, в которой почти все нормативное регулирование принимает форму нормативно-правовых актов, но при этом сразу надо иметь в виду, что могут существовать (и действительно существуют) правовые системы, устроенные иначе. Кроме того, нельзя исключить и того, что правовые нормы и в нашей правовой системе могут обнаружиться в совершенно неожиданных местах.


[2] Расстояния между узлами графов ничего значат: я разместил узлы по сторонами только для того, чтобы связи между ними были видны лучше, а также, чтобы провести границы между отраслями.