Skip to content

社会実験の方法論

フレーミング

CashPop (キャッシュポップ) はTelegramゲームです。同時に、人間の協調、焦点信念、戦略的深み、共通知識の伝播に関する、継続的かつ地球規模のリアルタイム実験でもあります。プロトコルの商業的構造(広告収入による資金調達、トークン再分配)が、この実験を財政的に持続可能なものにしています。そして、この実験こそが、プロトコルを永続的な科学的コモンズへと変えるのです。

このページでは、私たちが何を測定し、どのように匿名化し、何を公開するか、そして関与する学術パートナーシップについて文書化します。

観測される変数

すべてのRound (ラウンド) について、以下を記録します。

変数解像度
Round ID整数一意
Question ID整数公開リザーバーエントリにマッピング
Round開始タイムスタンプUTCミリ秒正確
参加者数整数正確
フェーズ別Commit (コミット) 数(msバケット)配列1秒間隔でビン化
フェーズ別Reveal (リビール) 数(msバケット)配列1秒間隔でビン化
多数決結果正確
投票比率浮動小数点数正確
人口統計学的分解集計ビンあたり100人以上でビン化

以下のものは記録しません。

  • 個人ユーザーID(いかなるレベルでも)
  • 個人ユーザーの投票(集計比率のみ)
  • IPアドレス(国コードのみ、100人以上の集計で記録)
  • 特定ユーザーのRound間の行動(各ユーザーは各Roundにおいて匿名の、相互相関しないトークンとして現れます)

匿名化プロトコル

公開されるすべてのデータは、k-匿名性の下限値k=100を通過します。つまり、いかなる集計セルも100人未満の参加者を含みません。100人未満のセルは、隣接セルと統合されるか、抑制されます。

人口統計学的分解(国、年齢層、言語)には、差分プライバシー(ε = 1.0)を適用します。つまり、各セル数に調整されたラプラスノイズメカニズムが追加されます。

暗号学的証明:匿名化パイプラインはオープンソース(github.com/cashpop-protocol/data-pipeline)であり、第三者の検証者が公開データセットが匿名化ルールと整合していることを検証できます。

公開内容

四半期ごとの集計データセット

四半期ごとに、以下を公開します。

  1. Roundレベルの集計:Roundごとの統計(数、比率、人口統計)— k-匿名化済み。
  2. 質問リザーバーのスナップショット:使用された質問、回答分布、焦点推定値。
  3. 時系列データ:週次DAU、MAU、Round数、Prize Pool (プライズプール) 分布。
  4. 国別焦点マトリックス:質問カテゴリごとの、国間の回答分布のコサイン類似度。

すべてのデータセット:CC-BY-4.0ライセンス。 datasets.cashpop.meme で公開。

年次研究レポート

毎年、プロトコルは査読に耐えうる品質の研究レポートを公開します。私たちは以下を約束します。

  • 四半期ごとに少なくとも1本の論文プレプリントを SSRN / arXiv (econ.GT, cs.GT) に投稿。
  • 年に少なくとも1本の、学術パートナーとの共著による年次レポート(対象:研究大学の行動経済学グループ)。
  • 外部の学術レビュアーを含むオープンデータレビューボード。

最初のレポート(2027年第1四半期データセットを対象)は、2027年第2四半期に公開を予定しています。

探求中の方法論

現在進行中の研究ライン(査読の対象となります):

  1. 異文化間Schelling Point (シェリングポイント) 乖離指数。焦点がどの程度文化的に特異的であるかを、質問タイプと文化的距離の関数として測定する指標。
  2. 人口規模でのレベルk混合分布推定。RoundレベルのCommit時間と回答データを使用して、集団のレベルk分布を推定。
  3. 共通知識伝播レイテンシ。信念に関する信念がTelegramのソーシャルグラフを通じてどの程度速く伝播するか。同期された質問バッテリーに対するRound間の一貫性を通じて測定可能。
  4. 集合知の較正と真実値の比較。事実に関する質問について、CashPopの多数決結果を検証済みの真実値と比較。
  5. 人口統計層別の戦略的深みの不均一性。高齢者はよりレベル1に偏り、暗号ネイティブはよりレベル3に偏るか? 実証的に検証可能。
  6. 情報ショック下での信念修正。主要なニュースイベントの前後で質問バッテリーを実施し、変化を測定。

これが重要な理由

3つの理由があります:

  1. 科学的。Beauty Contest (ビューティーコンテスト) 実験は、30年間、管理された実験室で200人未満の被験者で行われてきました。CashPopは、Roundあたり約10,000人の被験者を、現場条件下で、文化を超えて、暗号学的監査可能性を備えて実施します。経験的レバレッジは前例がありません。

  2. 市民的。共通知識構造(Aumann、Rubinstein、Vives)は、市場のミクロ構造から選挙結果に至るまで、あらゆるものを支えています。共通知識がどのように形成され、解消されるかをより良く測定することは、公共財です。

  3. 評判的。プロトコルの長期的な正当性は、そのデータコモンズとしてのアイデンティティに依存します。CashPopはユーザーから搾取するのではなく、ユーザーと共に科学的リソースを共同生産しています。

私たちが認める限界

  • 選択バイアス。CashPopユーザーは人類の代表的なサンプルではありません。彼らは暗号に興味があり、ゲームをする時間があるTelegramユーザーです。私たちの結果はこの集団に一般化され、人類全体に一般化されるものではありません。
  • インセンティブ汚染。プレイヤーは報酬(POP (ポイント))を受け取ります。これにより、インセンティブのない実験室研究と比較して、戦略的ゲームが変化します。私たちはこの効果を文書化し、定量化します。
  • 質問リザーバーバイアス。リザーバーはLLMによって生成され、最善の努力でバイアス除去されていますが、残存バイアスは存在します。私たちはリザーバーを公開しているため、外部の研究者が独自のバイアス除去手法で再分析できます。

参考文献

  • Aumann, R.J. (1976). Agreeing to Disagree. Annals of Statistics 4(6).
  • Rubinstein, A. (1989). The Electronic Mail Game. AER 79.
  • Vives, X. (2008). Information and Learning in Markets. Princeton.
  • Surowiecki, J. (2004). The Wisdom of Crowds. Doubleday.
  • Galton, F. (1907). Vox Populi. Nature 75.

Built on TON.