社会実験の方法論
フレーミング
CashPop (キャッシュポップ) はTelegramゲームです。同時に、人間の協調、焦点信念、戦略的深み、共通知識の伝播に関する、継続的かつ地球規模のリアルタイム実験でもあります。プロトコルの商業的構造(広告収入による資金調達、トークン再分配)が、この実験を財政的に持続可能なものにしています。そして、この実験こそが、プロトコルを永続的な科学的コモンズへと変えるのです。
このページでは、私たちが何を測定し、どのように匿名化し、何を公開するか、そして関与する学術パートナーシップについて文書化します。
観測される変数
すべてのRound (ラウンド) について、以下を記録します。
| 変数 | 型 | 解像度 |
|---|---|---|
| Round ID | 整数 | 一意 |
| Question ID | 整数 | 公開リザーバーエントリにマッピング |
| Round開始タイムスタンプ | UTCミリ秒 | 正確 |
| 参加者数 | 整数 | 正確 |
| フェーズ別Commit (コミット) 数(msバケット) | 配列 | 1秒間隔でビン化 |
| フェーズ別Reveal (リビール) 数(msバケット) | 配列 | 1秒間隔でビン化 |
| 多数決結果 | 正確 | |
| 投票比率 | 浮動小数点数 | 正確 |
| 人口統計学的分解 | 集計 | ビンあたり100人以上でビン化 |
以下のものは記録しません。
- 個人ユーザーID(いかなるレベルでも)
- 個人ユーザーの投票(集計比率のみ)
- IPアドレス(国コードのみ、100人以上の集計で記録)
- 特定ユーザーのRound間の行動(各ユーザーは各Roundにおいて匿名の、相互相関しないトークンとして現れます)
匿名化プロトコル
公開されるすべてのデータは、k-匿名性の下限値k=100を通過します。つまり、いかなる集計セルも100人未満の参加者を含みません。100人未満のセルは、隣接セルと統合されるか、抑制されます。
人口統計学的分解(国、年齢層、言語)には、差分プライバシー(ε = 1.0)を適用します。つまり、各セル数に調整されたラプラスノイズメカニズムが追加されます。
暗号学的証明:匿名化パイプラインはオープンソース(github.com/cashpop-protocol/data-pipeline)であり、第三者の検証者が公開データセットが匿名化ルールと整合していることを検証できます。
公開内容
四半期ごとの集計データセット
四半期ごとに、以下を公開します。
- Roundレベルの集計:Roundごとの統計(数、比率、人口統計)— k-匿名化済み。
- 質問リザーバーのスナップショット:使用された質問、回答分布、焦点推定値。
- 時系列データ:週次DAU、MAU、Round数、Prize Pool (プライズプール) 分布。
- 国別焦点マトリックス:質問カテゴリごとの、国間の回答分布のコサイン類似度。
すべてのデータセット:CC-BY-4.0ライセンス。 datasets.cashpop.meme で公開。
年次研究レポート
毎年、プロトコルは査読に耐えうる品質の研究レポートを公開します。私たちは以下を約束します。
- 四半期ごとに少なくとも1本の論文プレプリントを SSRN / arXiv (econ.GT, cs.GT) に投稿。
- 年に少なくとも1本の、学術パートナーとの共著による年次レポート(対象:研究大学の行動経済学グループ)。
- 外部の学術レビュアーを含むオープンデータレビューボード。
最初のレポート(2027年第1四半期データセットを対象)は、2027年第2四半期に公開を予定しています。
探求中の方法論
現在進行中の研究ライン(査読の対象となります):
- 異文化間Schelling Point (シェリングポイント) 乖離指数。焦点がどの程度文化的に特異的であるかを、質問タイプと文化的距離の関数として測定する指標。
- 人口規模でのレベルk混合分布推定。RoundレベルのCommit時間と回答データを使用して、集団のレベルk分布を推定。
- 共通知識伝播レイテンシ。信念に関する信念がTelegramのソーシャルグラフを通じてどの程度速く伝播するか。同期された質問バッテリーに対するRound間の一貫性を通じて測定可能。
- 集合知の較正と真実値の比較。事実に関する質問について、CashPopの多数決結果を検証済みの真実値と比較。
- 人口統計層別の戦略的深みの不均一性。高齢者はよりレベル1に偏り、暗号ネイティブはよりレベル3に偏るか? 実証的に検証可能。
- 情報ショック下での信念修正。主要なニュースイベントの前後で質問バッテリーを実施し、変化を測定。
これが重要な理由
3つの理由があります:
科学的。Beauty Contest (ビューティーコンテスト) 実験は、30年間、管理された実験室で200人未満の被験者で行われてきました。CashPopは、Roundあたり約10,000人の被験者を、現場条件下で、文化を超えて、暗号学的監査可能性を備えて実施します。経験的レバレッジは前例がありません。
市民的。共通知識構造(Aumann、Rubinstein、Vives)は、市場のミクロ構造から選挙結果に至るまで、あらゆるものを支えています。共通知識がどのように形成され、解消されるかをより良く測定することは、公共財です。
評判的。プロトコルの長期的な正当性は、そのデータコモンズとしてのアイデンティティに依存します。CashPopはユーザーから搾取するのではなく、ユーザーと共に科学的リソースを共同生産しています。
私たちが認める限界
- 選択バイアス。CashPopユーザーは人類の代表的なサンプルではありません。彼らは暗号に興味があり、ゲームをする時間があるTelegramユーザーです。私たちの結果はこの集団に一般化され、人類全体に一般化されるものではありません。
- インセンティブ汚染。プレイヤーは報酬(POP (ポイント))を受け取ります。これにより、インセンティブのない実験室研究と比較して、戦略的ゲームが変化します。私たちはこの効果を文書化し、定量化します。
- 質問リザーバーバイアス。リザーバーはLLMによって生成され、最善の努力でバイアス除去されていますが、残存バイアスは存在します。私たちはリザーバーを公開しているため、外部の研究者が独自のバイアス除去手法で再分析できます。
参考文献
- Aumann, R.J. (1976). Agreeing to Disagree. Annals of Statistics 4(6).
- Rubinstein, A. (1989). The Electronic Mail Game. AER 79.
- Vives, X. (2008). Information and Learning in Markets. Princeton.
- Surowiecki, J. (2004). The Wisdom of Crowds. Doubleday.
- Galton, F. (1907). Vox Populi. Nature 75.