Методология социального эксперимента
Контекст
CashPop — это игра в Telegram. Это также непрерывный, планетарного масштаба, проводимый в реальном времени эксперимент по человеческой координации, фокальным убеждениям, стратегической глубине и распространению общего знания. Коммерческая структура протокола (финансируемая за счет рекламы, с перераспределением токенов) делает эксперимент финансово устойчивым. Эксперимент, в свою очередь, делает протокол долговременным научным достоянием.
На этой странице документируется, что мы измеряем, как мы анонимизируем, что публикуем, а также задействованные академические партнерства.
Наблюдаемые переменные
Для каждого Round (раунда) мы регистрируем:
| Переменная | Тип | Разрешение |
|---|---|---|
| ID Round | целое число | уникальный |
| ID вопроса | целое число | соответствует записи в публичном репозитории |
| Временная метка начала Round | UTC мс | точная |
| Количество участников | целое число | точное |
| Количество Commit по фазам, сгруппированное по мс | массив | сгруппировано с интервалом в 1 секунду |
| Количество Reveal по фазам, сгруппированное по мс | массив | сгруппировано с интервалом в 1 секунду |
| Результат большинства | точный | |
| Соотношение голосов | число с плавающей точкой | точное |
| Демографическая разбивка | агрегированные данные | сгруппировано при ≥100 участников на группу |
Мы НЕ регистрируем:
- Личность отдельного пользователя на любом уровне
- Голос отдельного пользователя (только агрегированные соотношения)
- IP-адреса (только код страны при агрегации >100 участников)
- Поведение какого-либо конкретного пользователя в разных Round (каждый пользователь отображается как анонимный, не коррелируемый между собой токен в каждом Round)
Протокол анонимизации
Все публикуемые данные проходят через порог k-анонимности k=100: ни одна ячейка агрегации не содержит менее 100 участников. Ячейки ниже k объединяются с соседними ячейками или подавляются.
Для демографических разбивок (страна, возрастная группа, язык) мы применяем дифференциальную конфиденциальность с ε = 1.0: к каждому счету ячейки добавляется калиброванный шум Лапласа.
Криптографическое доказательство: конвейер анонимизации имеет открытый исходный код (github.com/cashpop-protocol/data-pipeline), и сторонний верификатор может проверить, что опубликованный набор данных соответствует правилам анонимизации.
Что мы публикуем
Ежеквартальные агрегированные наборы данных
Каждый квартал мы выпускаем:
- Агрегированные данные по Round: статистика по каждому Round (количество, соотношение, демография) — с k-анонимизацией.
- Снимок репозитория вопросов: использованные вопросы, распределения ответов, оценки фокальных точек.
- Временные ряды: еженедельные DAU, MAU, количество Round, распределение Prize Pool (призового пула).
- Матрица фокальных точек по странам: для каждой категории вопросов — косинусное сходство распределений ответов по странам.
Все наборы данных: лицензия CC-BY-4.0. Опубликованы по адресу datasets.cashpop.meme.
Ежегодные исследовательские отчеты
Каждый год протокол публикует исследовательский отчет уровня рецензируемых публикаций. Мы взяли на себя обязательство:
- Как минимум один ежеквартальный препринт статьи, нацеленный на SSRN / arXiv (econ.GT, cs.GT).
- Как минимум один ежегодный отчет в соавторстве с академическим партнером (цель: группа поведенческой экономики в исследовательском университете).
- Открытый совет по рецензированию данных, включающий внешних академических рецензентов.
Первый такой отчет — охватывающий набор данных за Q1 2027 года — запланирован к публикации на Q2 2027 года.
Исследуемые методологии
Активные направления исследований (подлежат рецензированию):
- Индекс кросс-культурной дивергенции Schelling Point (точек Шеллинга). Показатель того, насколько культурно-специфичны фокальные точки, в зависимости от типа вопроса и культурной дистанции.
- Оценка смеси уровней k в масштабе популяции. Использование данных о времени Commit и ответах на уровне Round для оценки распределения уровней k в популяции.
- Латентность распространения общего знания. Как быстро убеждения об убеждениях распространяются через социальные графы Telegram? Измеряется через согласованность между Round для синхронизированных батарей вопросов.
- Калибровка мудрости толпы относительно истинного значения. Для фактических вопросов — сравнение большинства CashPop с проверенным истинным значением.
- Гетерогенность стратегической глубины по демографическим стратам. Являются ли пожилые люди более level-1, а крипто-нативные пользователи — более level-3? Эмпирически проверяемо.
- Пересмотр убеждений при информационных шоках. Проведение батарей вопросов до и после крупных новостных событий; измерение сдвига.
Почему это важно
Три причины:
Научная. Эксперименты Beauty Contest (конкурс красоты) проводились с <200 испытуемыми в контролируемых лабораториях в течение 30 лет. CashPop проводит ~10 000 испытуемых за Round, в полевых условиях, в разных культурах, с криптографической проверяемостью. Эмпирический рычаг беспрецедентен.
Гражданская. Структуры общего знания (Aumann, Rubinstein, Vives) лежат в основе всего: от микроструктуры рынка до результатов выборов. Более качественное измерение того, как формируется и распадается общее знание, является общественным благом.
Репутационная. Долгосрочная легитимность протокола зависит от его идентичности как общего научного ресурса. CashPop не извлекает выгоду из пользователей; он совместно создает с ними научный ресурс.
Признаваемые ограничения
- Смещение отбора. Пользователи CashPop не являются репрезентативной выборкой человечества. Это пользователи Telegram с интересом к криптовалютам и временем для игр. Наши результаты обобщаются на эту популяцию, а не на человечество в целом.
- Загрязнение стимулами. Игроки получают вознаграждение (в POP (баллах)). Это меняет стратегическую игру по сравнению с лабораторными исследованиями без стимулов. Мы документируем и количественно оцениваем этот эффект.
- Смещение репозитория вопросов. Репозиторий генерируется LLM и дебаизируется по мере возможности, но остаточные смещения существуют. Мы публикуем репозиторий открыто, чтобы внешние исследователи могли провести повторный анализ с собственным дебаизингом.
Ссылки
- Aumann, R.J. (1976). Agreeing to Disagree. Annals of Statistics 4(6).
- Rubinstein, A. (1989). The Electronic Mail Game. AER 79.
- Vives, X. (2008). Information and Learning in Markets. Princeton.
- Surowiecki, J. (2004). The Wisdom of Crowds. Doubleday.
- Galton, F. (1907). Vox Populi. Nature 75.