четверг, 17 января 2019 г.

Анализ распределения слов в Q13 и Q20.

     Общая компоновка (структура)  Манускрипта Войнича несколько отличается от других травников 14-15 века. В нем есть Quire20 (тетрадь с маркировкой 20), которая не встречается в других рукописях.
      Мое первоначальное мнение было, что каждый абзац – это рецепт отмеченный звездой. Рецепты разбиты на группы от 1 до 4 абзацев, которые находятся между соседними звездами, имеющими красную маркировку. Каждая группа описывает использование одного конкретного растения при различных недугах. Это объясняет различное количество рецептов в группе.
      Новая идея о смысле этого раздела – это ведение дневника приема посетителей (или одного конкретного лица), с назначением лечения по различному количеству жалоб (1-4).

      Определенно есть консенсус по смыслу страницы 1r, что это - предисловие.

      На странице 116r есть последний абзац, не помеченный звездочкой. Что это? Эпилог? И, если эпилог, то это послесловие к чему? Ко всей рукописи или только для Quire20?
Для анализа я применил свой метод, который я назвал “Объем пересекающейся информации”. Его суть я описывал на НИНЗЯ. (здесь)

     Вкратце его суть в следующем. Взять какой-либо участок текста в качестве базы, и сравнить его лексикон с другой страницей текста. Подсчет пересекающихся слов ведется с учетом возможных повторений на сравниваемой странице и выражается в процентах к объему слов на этой странице. 85r1
 Пример. V()ep  85r1=16,52%  Здесь: ∩ - математический символ пересечения множеств, “ep” – epilogue/ эпилог, база сравнения, визуально пишется нижним индексом  как основание логарифма, 85r1- сравниваемая страница.
      В качестве  общего количества слов на страницах я использовал транскрипцию Такаши. (здесь)
      Итак, я взял в качестве базы – последний абзац 116r (эпилог), используя инструмент  Джоба (Job).
Синим цветом выделены слова оканчивающиеся на EVA Y, розовый- ***n, коричневый - ***r, салатовый - ***l, оранжевый - ***m.
     Подсчет производился несколько раз вручную, непосредственно с монитора компьютера, так что  возможны небольшие погрешности, влияющие на десятые доли процентов. 
    Здесь вы видите, что плотность распределения лексикона эпилога для Q13 , приблизительно  равномерна для всех страниц, тогда как для Q20 подобных значений текст достигает только для бифолио 103-116 (смотрите диаграмму 1, для 116r рассматриваем остаток текста без эпилога). 
    Для сравнения приведены результаты V() , если взять за базу Предисловие 1r . В этом случае лексикон 1r равномерно распределен по всей рукописи.

 Диаграмма № 1
    Удивительно низкие результаты V()ep  у 105v, 114r, 114v. А эти страницы составляют единый бифолио 105-114. (см диаграмму 2).
                                                                    Диаграмма № 2.
     Необходимо обратить внимание, что для трех страниц V()1r >V()ep . Причем именно этот бифолио, я рассматривал  на  Нинзя в перекрестном сравнении страниц этого  бифолио, когда последовательно брал каждую из этих страниц в качестве базы сравнения. V() для этого бифолио колеблется в пределах 47-52%. Это очень высокий результат.
      Результаты V() остальных бифолио на диаграммах 3-6.
                                                                   Диаграмма №3
                                                                     Диаграмма № 4.
 Диаграмма № 5.

  Диаграмма № 6.

     На диаграмме 7 приведены усредненные результаты по бифолио.
(*) Усреднение бифолио 103-116 проводилось без учета страницы 116v.


                                                              
                                                                 Диаграмма № 7.

     Затем я взял в качестве базы начало текста страницы 116r (без эпилога). Несмотря на принципиальное  изменение оформления страницы (переход от абзацев, отмеченных звездами к эпилогу) структура распределения пересекающихся слов не претерпела изменение. Только увеличилась плотность пересекающихся слов за счет увеличения объема базы сравнения.
      Опять наименьшие показания на бифолио 105-114. Наибольшие показания      103-115. Затем центральный бифолио 108-111.
      Единственным следствием изменения базы является повышенная концентрация слов, оканчивающихся на EVA-n на 111v (розовый цвет).
      Из того факта, что V() для каждого из 6 бифолио Q20 колеблется вокруг разных средних значений, в отдельных случаях отличающихся в разы, можно с уверенностью говорить, что текст на каждом бифолио писался до сшивания их  в детрадь Q20. Есть два способа объяснить разброс показаний V() для разных бифолио. Либо текст на каждом бифолио объединен общей тематикой (в случае  текста, имеющего смысл), либо он формируется на разной “основе” для изменения символов по некоторому алгоритму, как предлагает Тим Торстен (в случае фабрикации текста).
Я больше склоняюсь, ко второму. По крайней мере,  в  языке “В”.
   Теперь обратимся к Q13, когда в качестве базы берется текст без эпилога со страницы 116r.





   Это распределение пересекающихся слов, формируется из лексикона состоящего всего из 177 неуникальных  слов. (Я вычел из  объема базы сравнения (335 слов) уникальные слова (29), еще одно, встречающееся 2 раза и только в этой “базе”, и повторы в базе.) Получается поразительная плотность!

(дополнение)
Число 177, думаю, можно увеличить процентов на 10 за счет возможных омонимов, но одновременно (при шифр-замене символов)  необходимо уменьшить  это число в несколько раз, так как в него входят смысловые значения слов, изменяемых по лицам, числам, родам, склонениям, спряжениям.  Я не могу себе представить значимый текст с таким распределением слов из лексикона, состоящего менее 100 слов (вместо 177), особенно если считать, что текст привязан к рисункам (описывает рисунки), так как структура распределения не меняется при переходе от рисунков (тематики купания к “внутренним органам”) Q13A к Q13B. То есть,  рассуждая “от противного”   морфологический лексикон  (в именительном падеже, неопределенной форме для глаголов и т. д.) из 80-100 (или даже меньше) слов должен на протяжении 20 страниц Q13 регулярно обеспечивать в среднем V()=50%, и при этом текст должен быть значимым.
    Отдельно обратимся к странице 84v



    V()116r one ep 84v = 60,23% . То есть лексикон из 51 слова (из применяемых 177 неуникальных слов в базе) формирует более 60% объема текста на 84v. И это при почти равных объемах сравниваемых текстов (335/337 слов).
     Из этих результатов неоспоримо следует, что при применении шифра замены символов, и если предполагать, что текст имеет смысл, он может быть только узкоспециализированным (не повествовательным), что входит в противоречие с идеей Коэн (Koen G) о возможном изложении в  Q13 мифа Овидия о Филомеле.  Хотя, я рассматривал часть  рисунков  Q13 в привязке к этому мифу очень перспективными.
     Этот вывод исключительно для оговорки выделенной жирным шрифтом, так как число 51 (и соответственно 177)  может значительно увеличиться в случае  абугида  (опускания гласных букв без диактрика) или применения многочисленных средневековых латинских сокращений (идея Петерсона  JKP).
      Принимая во внимание, что при переходе вида текста на 116r от абзацев со звездочками к “эпилогу” V()116r one ep 116ep = 56,80%  и  V()ер 116 one ep = 44,14% имеют высокие значения, а не претерпевают радикальные изменения, как для страниц бифолио 105-114, я считаю, что последний большой абзац страницы 116r только создает видимость “эпилога” (при условии  применения шифра замены символов). 
   Изменение V() от 56,80% до 44,14% обусловлено разным объемом базы сравнения (разница в 1,5 раза).

  

Комментариев нет:

Отправить комментарий