Рейтинг "10 версий". Принцип построения

Рейтинг предназначен для эффективного мониторинга надежности диагностики Юнговского психологического типа. Эффективность достигается за счет сверки только по тем персоналиям, для которых накопились версии минимум из 9 источников (исключая мою версию). Как только у персоналии накапливается 9 источников версии, так к ним добавляется 10-я, сверочная.

Откуда берутся сверяемые версии: Начиная с июля 2001 г. я веду базу данных, в которой собрана основная масса опубликованных примеров знаменитостей, якобы относящихся к тому или иному психологическому типу, типу личности, типу информационного метаболизма и т.п.. В базу вносятся как бумажные, так и электронные публикации. Из электронных публикаций подлежат учету только оформленные должным образом. Мнение, выраженное кем-либо в обсуждении на интернет-форуме, публикацией не считается и в базу не вносится. Всего в базе данных на момент написания этих строк более 105 тысяч записей вида: {публикация/автор, персоналия, тип, уверенность}. Состав базы в основном совпадает с опубликованным на sss.socioland.ru. Из неопубликованного входят, в частности, публикации Лытовых, Мегедь и Овчарова; старые снимки электронных публикаций других авторов, позволяющие отслеживать эволюцию их взглядов; а также мои неопублиикованные версии и результаты дигностики людей непубличных.

Чтобы выделить сверочный список, из этой базы были отфильтрованы устаревшие публикации, непубличные люди, литературные образы, публикации-компилляции ("список 82% сходимости Хрулева", списки Игоря Вайсбанда и т.п.), все мои версии (чтобы их пополнение не влияло на параметры выборки). Остались только последние (то есть, самые свежие) публикации стороннних авторов о публичных людях и социониках. Для каждой персоналии подсчитано количество авторов, которые опубликовали версию типа данной персоналии. Персоналии упорядочены по убыванию количества авторов, упомянувших их тип. Упорядоченный список обрезан так, чтобы в нем остались только персоналии, упомянутые не менее, чем 9-ю авторами. Таковых на данный момент накопилось более 2-х тысяч чел. Это всего 12% от списка всех публичный людей, попавших в базу. Но к ним относится 45 тысяч записей - версий типа, что составляет половину всего объема версий. В полученной выборке на каждую персониою в среднем приходится по 22 версии (данные на 14.01.2017).

Следующий этап подготовки - тщательная перепроверка типов всех персоналий из полуторатысячного списка. Эта задача трудоемкая, но не настолько, как может показаться на первый взгляд. В силу следующих обстоятельств:

1) Большинство из участников списка на виду и на слуху, их помнишь, их тип то и дело подвергаешь перепроверке в суе. В итоге дополнительное исследование не требуется. Достаточно моментальной верификации.

2) Там, где исследование требуется, помогают версии 9-и и более авторов. Чаще всего правильная версия уже упомянута кем-то из них. Примеряя к материалам чужие версии, меньше риск упустить правильную. Хотя встречаются и случаи, когда среди множества версий нет ни одной правильной.

3) О большинстве персоналий в интернете есть достаточно данных (текстов прямой речи, фото, аудио, видео). Редкий случай, когда исследование не удается довести до уверенного результата из-за нехватки данных.

На сей момент трудоемкая задача перепроверки основного объема персоналий уже решена, и остается только проверять пополнение, темп которого - порядка одной персоналии в сутки. Даже если встечаются персоналии, на определение типа которых уходит 3 часа, затраты времени на поддержание списка получаются вполне умеренными. В большинстве случаев оказывается достаточным затратить несколько минут.

Источник пополнения списка персоналий на сегодняшний день один: sss.socioland.ru. Это достаточно активный источник ответственных версий. Те источники, из которых я еще несколько лет тому назад пополнял свою базу, сейчас уже уже практически не пополняются.

Новые публикации версий списываются с sss.socioland.ru раз в сутки роботом, после чего я проверяю список пополнения, пропожу необходимые процедуры и публикую обновленный список и сводную статистику. Отдельные виды рейтингов публикуются реже.

Сводная информация (от 10.02.2017)
Тип n w k n w k
INFA (ЭИИ) 19 0,94% 0,15 620 1,37% 0,22
ESFO (ЭСЭ) 41 2,02% 0,32 864 1,91% 0,31
ISFA (ЭСИ) 45 2,21% 0,35 1170 2,59% 0,41
INFO (ИЭИ) 63 3,10% 0,50 1226 2,72% 0,43
INTA (ЛИИ) 57 2,81% 0,45 1257 2,79% 0,45
ISFO (СЭИ) 69 3,40% 0,54 1607 3,56% 0,57
ISTA (ЛСИ) 74 3,64% 0,58 1704 3,78% 0,60
ESTO (ЛСЭ) 91 4,48% 0,72 2106 4,67% 0,75
ESFA (СЭЭ) 99 4,87% 0,78 2340 5,19% 0,83
ENFO (ЭИЭ) 88 4,33% 0,69 2583 5,72% 0,92
INTO (ИЛИ) 133 6,55% 1,05 3008 6,67% 1,07
ENFA (ИЭЭ) 145 7,14% 1,14 3104 6,88% 1,10
ISTO (СЛИ) 162 7,97% 1,28 3996 8,86% 1,42
ESTA (СЛЭ) 210 10,33% 1,65 4406 9,77% 1,56
ENTO (ЛИЭ) 288 14,17% 2,27 6230 13,81% 2,21
ENTA (ИЛЭ) 448 22,05% 3,53 8899 19,72% 3,16
Всего: 2032 персоналий 45 120 упоминаний

Приведенная левее таблица отражает типный состав сверочного списка. Обозначение колонок: n - количество (слева - персоналий, справа - их упоминаний в сверяемых примерах),
w = n/Sum(n) - доля (количество отдельного типа, деленное на общее количество, сумма = 1),
k =w*16 - коэффициент относительно доли при равмерном распределении (среднее = 1).

Нетрудно видеть, что типный состав не вполне равномерный. Доля представителей самого публичного типа (ENTA) составляет 20%, а доля представителей самого непубличного типа (INFA) - 1%.

Поименный список, сгруппированный по сверочным типам, публикуется отдельной страницей. Раньше, публикуя сводные результаты сверок (с 22.09.2002), я не имел возможности публиковать поименные детали, и это вызывало нарекания посетителей сайта. Сейчас я в нахожусь в сходном положении – не имею разрешения на публикуцию списков ряда авторов, с которыми сверяюсь по базе. При этом все опубликованные версии вы найдете на sss.socioland.ru. Поэтому здесь привожу только те версии, по которым сверяюсь. Автор списка, фигурирующего в рейтинге, но отсутствующего на данный момент в открытом доступе в интернете, имеет возможность самостоятельно изучить, почему получилась такая доля совпадений, а не иная.

Следующий этап - отбор авторских списков для сверки. Критерий отбора: в авторском списке должно быть не меньше 10 персоналий, входящих в сверочный список "10 версий". При 10-и персоналиях доля совпадений вычисляется с шагом 10%. Нижняя граница интервала вероятности в случае полного совпадения (10/10) опускается до 69%. Для более точной оценки - просто пополняйте свой список на sss.socioland.ru.

Списков, удовлетворяющих этому критерию, на данный момент набирается три сотни. Из них формируется еще одна сводная таблица по типам (представлена ниже) и несколько (на данный момент - 6) видов рейтинга, представленных на отдельных страницах. Описание каждого рейтинга - на той же странице.

С целью обеспечения конфиденциальности многие авторы в сверочных таблицах указаны по их никам в социальных сетях и форумах. Если Вы автор, попавший в рейтинг, и не возражаете, чтобы вместо ника стояли Ваше настоящее имя и фамилия, дайте знать - заменю.