January 28th, 2016

KRK

славяно-сирийская инвентаризация 13: количественная оценка предыдущей серии

Оригинал взят у hgr в славяно-сирийская инвентаризация 13: количественная оценка предыдущей серии
основная идея предлагаемого подхода в том, что реальные правдоподобия гипотезы о неслучайном происхождении чего-либо (если она истинна) и гипотезы о случайном происхождении того же самого отличаются на много порядков, т.е. в миллионы и миллиарды раз, если не еще больше. поэтому можно сравнить эти вероятности, исходя из таких условий, при которых вероятность случайного на несколько порядков завышена, а вероятность неслучайного на несколько порядков занижена, но при этом все равно должен получиться убедительный разрыв между правдоподобиями альтернативных гипотез.

тогда вместо трудноосуществимой процедуры оценки самих управляющих параметров (r, q в формулах ниже) будет достаточно оценить их предельные значения, а точнее, заведомые максимумы, т.е. такие значения, которые заведомо больше возможных для них максимальных величин.

для гипотезы о неслучайности нужно предположить ожидаемую вероятность соответствующих ей наблюдений заведомо бОльшую, чем может быть в действительности, а для гипотезы о случайности -- также заведомо бОльшую. тогда любой результат наблюдений будет заведомо легче, чем в реальности, согласовываться со "случайной" гипотезой и заведомо труднее -- с "неслучайной".

0. рассматриваем только те варианты, которые нельзя объяснить из наличных греческих рукописей, из простых ошибок при чтении или переводе с греческого, из вариантов перевода на славянский, из ошибок при передаче славянских слов (lapsi calami).

1. оцениваем только лексические варианты. это сужает базу, но не должно снижать репрезентативность. (варианты, связанные с перестановками, пропусками и добавлениями, очень плохо поддаются интерпретации, поэтому их лучше отбросить, хотя бы и ценой сужения базы). также отбрасываем морфологические варианты, кроме тех, которые достаточно резко меняют смысл, т.е., практически, все и отбрасываем (тоже ненадежны для сравнения, т.к. подвержены случайным изменениям).

таких вариантов всегда довольно мало. показательно, что в Чудовском НЗ (по кр. мере, в пределах рассмотренного Вознесенским: Рим, 1-2 Кор, Гал и не совсем до конца Еф) их нет вообще. -- вот что бывает при хорошем и хорошо переписанном переводе с хорошего греческого.

2. оцениваем общее число лексических вариантов, подлежащих учету (n). Для массива, рассмотренного Воскресенским, n = 13 (количество лексических вариантов, не имеющих очевидного объяснения из греческого или славянского и не относящихся к категориям пропусков, добавлений и перестановок) и присутствующих хотя бы в одной рукописи. примечательно, что в Чудовском НЗ таких случаев нет вообще (это новый перевод с византийского греческого). все наши случаи -- в одной (реже) или нескольких (чаще) ркп. 1 или 2 ред., иногда еще и 4-й.

3. из них "по-сирийски" интерпретируется m. m = 9 (и еще 1 под вопросом, но будем считать, что 9, см. предыдущую серию).

4. изложим сирийскую гипотезу в следующем виде: первоначальный перевод Апостола следовал такому греческому тексту, который соответствовал сирийскому (близкому к Пешитте, но с небольшими отклонениями, также известными в сир. традиции); постепенно эти чтения из славянского вычищались, больше всего их сохранилось в первой и второй редакциях, но иногда лишь в одном из списков первой или второй редакции.

тогда "сирийские" чтения должны быть не единственным, но основным источником "патологических" чтений, т.е. разумно будет принять ожидаемую, в рамках данной гипотезы, долю "сирийских" чтений среди всех "аномальных" чтений

r = 0.9 (мб., это завышенное число, но так будет осторожней: чем больше r, тем более высокие требования мы предъявляем к апостериорному правдоподобию сирийской гипотезы).

5. альтернативная "сирийской" гипотеза состоит в том, что совпадения особых чтений с сирийскими случайно. из общих соображений можно сказать, что ожидаемая в рамках этой гипотезы вероятность именно сирийских чтений будет мала. оценим ее (видимо, существенно завышая) в q = 0.01 (1 случай из 100).

(реальная вероятность совпадения аномального чтения с определенной версией без наличия между этими версиями близкой связи совсем ничтожно мала: например, в слав. Четвероевангелии нашли только одно негреческое (т.е. невизантийское) чтение Вульгаты, но даже оно совпало с сирийским.

6. сравнение (отношение) правдоподобия двух гипотез рассчитывается по формуле, основанной на теореме Байеса (это стандартная задача индуктивной логики, которая здесь применяется напрямую, без каких-бы то ни было дополнительных ухищрений):

q^m * (1-q)^(n-m) / (r^m * (1-r)^(n-m))

7. тогда вероятности двух гипотез соотносятся как

Антисирийская к Сирийской = 0.01^9 * 0.99^4 / (0.9^9 * 0.1^4) = 4.1 * 10^-8

разрыв такой, что говорить не о чем. и ведь мы брали заведомо завышенное значение q. если его уменьшить в два раза, все равно оставляя сильно завышенным, то, при q = 0.005,

0.05^9 * 0.095^4 / (0.9^9 * 0.1^4) = 4.1 * 10^-12

8. теперь предположим, что я сильно ошибся, и реального число "аномальных" чтений существенно выше -- n = 20. Тогда получаем

2.3 * 10^-7

но мы в области таких чисел, где сдвиг на один порядок ничего не меняет. таким образом, важнее то, что число 9 для таких разночтений -- оно реально большое, и очень многое перевешивает.

но предположим, что два первые разночтения тоже какие-то некошерные (к ним могут быть некие вопросы), и примем m = 7.

тогда, при n = 13, q = 0.01, r = 0.9, имеем

2.0 * 10^-8

Все эти оценки показывают, что случайное возникновение "сирийских" разночтений в Апостоле невероятно.

9. чтобы совсем уже снять сомнения, проведем расчеты при следующем неправдоподобно большом занчении

q = 0.1

(т.е. каждое десятое лексическое разночтение, соответствующее нашим параметрам, совпадает почему-то именно с сирийским).

тогда при наших n = 13, m = 9, r = 0.9 получим

1.7 * 10^-5

-- сирийская гипотеза становится в 1000 раз менее правдоподобной, но разрыв остается таким большим, что это ни на что не влияет (вот что значит иметь в запасе много нулей в десятичных знаках!).

и -- при тех же параметрах, но m = 7

мы наконец то получаем отношение 1/9 ровно (т.е. 0.1111....), т.е. тогда сирийская гипотеза начинает выигрывать только на один порядок, что маловато (такое соотношение апостериорных вероятностей легко может быть компенсировано отношением априорных вероятностей). -- но для получения первого сопоставимого соотношения для правдоподобий обеих гипотез нам пришлось сделать совершенно невозможное предположение о том, что каждое десятое лексическое отличие должно случайно совпадать со специфическими сирийскими чтениями.

P.S. для текстологов психологически непривычно, как это единичные чтения могут менять статистику, т.к. привычная для них статистика -- нормальное (Гауссово) распределение, а здесь, в расчетах, основанных на теореме Байеса, совсем другое: степенное распределение, в котором каждое наблюдение (измерение) добавляет единицу в показатель степени. поэтому малое изменение в результатах дает очень резкое различие в вероятностях (правдоподобиях).

апостериорное правдоподобие гипотезы (т.е. влияние результата измерения или наблюдения на правдоподобие гипотезы) определяется степенным, а не нормальным распределением, поэтому единичные чтения тут становятся вдруг важны, т.к. каждое из них становится единицей в показателе степени.

KRK

Минимализм в зимней фотографии

Оригинал взят у sell_off в Минимализм в зимней фотографии
Оригинал взят у bono60 в Минимализм в зимней фотографии


Зимой, когда все вокруг покрывается снегом, появляется та самая тихая и умиротворяющая атмосфера, которую мы так любим. Хочется погулять по заснеженному лесу, а потом вернуться домой и наблюдать снегопад за окошком, попивая горячий чай.




1447569780_1447431913_zred83vfweu_novyy-razmer
2.

1452359903_q8
3.
Collapse )