Здравствуйте!
Надеюсь, не ошибся разделом.
Как известно, на настоящем сайте есть тест на определение типа личности, и даже не один. Также известно, что тесты определяют тип из рук вон плохо, и что ни один уважающий себя человек не будет доверять его результатам. Я подумал на досуге и родил предложение, как сделать тест более правдоподобным.
Для конкретности возьмём тест "да-нет".
Сейчас, насколько я понимаю, дело обстоит так: есть 75 вопросов, по несколько вопросов на каждый из четырёх параметров - I/E, N/S, T/F, J/P. Соответственно, при ответе на вопрос человеку приплюсовывается та характеристика, которую приписал вопросу автор теста. Здесь мы видим следующий недостаток: необходимо подбирать вопросы так, чтобы дихотомия ответов однозначно определяла человека по выбранной оси. Однако, поскольку человек - существо сложное, при ответе он руководствуется не только тем признаком Рейнина, который имел в виду автор, а выбирает ответ согласно своему разумению. С точки зрения соционики это можно представить так, что ответ будет зависеть от всех пятнадцати признаков Рейнина, причём как именно - догадаться априори фактически невозможно. Однако можно собрать статистику, как разные люди отвечают на вопросы, и восстановить по результатам опроса эту зависимость. В этом и заключается моя основная идея.
Итак, для каждого вопроса будем собирать статистику: сколько раз люди с различными признаками Рейнина ответили на этот вопрос "да" или "нет". Имеем 15 признаков Рейнина, два варианта ответа, соответственно, нам надо хранить 30 вероятностей. Например, ежели среди ответивших "да" на вопрос "пьёте ли вы шампанское по утрам?" оказалось 7 аристократов и 3 дегене... тфу ты, демократа, то мы записываем вероятность 0,7 в ячейку, соответствующую ответу "да" на этот вопрос и признаку "аристократия". Для ответа "нет" тоже собирается статистика: пусть, например, на тот же вопрос ответило "нет" 49 аристократов и 51 демократ, тогда в ячейке с ответом "нет" будет число 0,49. Понятное дело, что число ответивших "да" и "нет" тоже надо хранить.
Тогда определение типа тестируемого будет происходить так: будут складываться вероятности всех признаков Рейнина, соответствующие тем ответам, которые он дал, и на этом основании будут считаться вероятности принадлежности испытуемого к различным типам, наподобие известного калькулятора признаков Рейнина. Точный алгоритм, возможно, будет несколько отличаться от вышеописанного, но смысл будет тот же. Лучше всего, конечно, исходить из метода максимального правдоподобия, я ещё не занимался расписыванием.
Теперь мы подходим к главному вопросу: как же мы будем собирать эту статистику? Здесь могут быть как минимум два варианта:
1. Обучение с учителем. Берём некоторое количество людей с заранее известным типом. Тем или иным способом заставляем их пройти тест. Статистика набирается тривиально - знаем тип, знаем ответы, остаётся только заполнить соответствующие колонки цифр. Понятное дело, автоматически.
2. Обучение без учителя (собственно, самообучение). Выставляем тест в интернет. Первоначальные значения вероятностей берём из п. 1 или из оригинального теста (т. е. считаем, что тест прошли несколько "идеальных людей", ответивших на вопросы так, как предполагал автор). Люди со всех уголков нашей необъятной Родины проходят тест, и им выдаются некоторые варианты ответов. Так вот, будем считать, что тип человека, определённый по тесту - это и есть его истинный тип. Тогда после завершения теста мы просто вносим запись в статистику так, как будто бы мы были бы уверены в типе человека.
Со всей очевидностью результаты, полученные в п. 2, будут хуже, чем в п. 1. Но у п. 2 есть большое преимущество - можно опросить больше людей. Я думаю, что таким макаром можно получить тест, раскидывающий людей по типам с достаточно хорошей точностью - даже если мы выполним только п. 2, то результаты будут лучше, чем в оригинале. Строго это доказать я, понятное дело, не могу.
Ещё одно преимущество предлагаемого подхода - можно количественно измерить, каким признакам Рейнина соответствует тот или иной вопрос. Кстати, ежели на сайте ведётся статистика (записываются варианты ответов каждого опрошенного), то по ней можно очень хорошо произвести обучение согласно п. 2.
В основном, пожалуй, всё. Возможно, боян, но я такого ни разу не видел.
З. Ы. Лично я пойду типироваться завтра (уже сегодня), по тестам выхожу Бальзаком, а сам в раздумьях между Бальзаком и Доном.