Skip to content

オープンデータセット

CashPop (キャッシュポップ) は、CC-BY-4.0ライセンスのもと、匿名化された集計データセットを datasets.cashpop.meme で公開しています。

リリース頻度

  • 毎日: API経由で直近30日間のメトリクスエンドポイントを提供。
  • 四半期ごと: Round (ラウンド) レベルの集計を含む、完全な四半期スナップショットを提供。
  • 毎年: 方法論ペーパー付きの注釈付き研究データセットを提供。

データ製品

1. cashpop-rounds-Qx-YYYY.parquet

Round (ラウンド) ごとの集計データ。スキーマ:

round_id          int64
question_id       int64
start_ts          int64 (UTC ms)
participant_count int32
commit_count_by_second  array<int32>  // 30要素
reveal_count_by_second  array<int32>  // 15要素
majority_outcome  int8           // 0または1
vote_ratio        float64        // 多数派の割合
country_buckets   map<string, struct{count: int32, ratio: float64}>

2. cashpop-reservoir-Qx-YYYY.parquet

質問リザーバーのスナップショット。スキーマ:

question_id       int64
question_text     string
category          string
language_origin   string
calibration_distribution  array<float64>  // 合成母集団推定値
actual_distribution       array<float64>  // 観測値
focal_point_index float64       // Schelling (シェリング) 乖離度

3. cashpop-timeseries-Qx-YYYY.parquet

日次集計データ。スキーマ:

date              date
dau               int32
mau               int32
total_rounds      int32
ad_revenue_usd    float64
prize_pool_distributed_usd  float64
unique_countries  int32
median_round_size int32

4. cashpop-focal-matrix-Qx-YYYY.parquet

国別の焦点点類似度マトリックス。スキーマ:

question_category string
country_a         string  // ISO-3166
country_b         string
similarity        float64  // 応答分布のコサイン類似度
sample_size_a     int32
sample_size_b     int32

方法論ペーパー

四半期ごとのリリースには、以下の内容をカバーする方法論ペーパーが付属します:

  • サンプリングの決定と既知のバイアス
  • 匿名化パラメータ(k-匿名性の閾値、差分プライバシーのε値)
  • 質問リザーバーのキャリブレーション分析
  • 再現手順

アクセス方法

bash
# API経由
curl https://datasets.cashpop.meme/api/v1/Q2-2027/rounds.parquet

# 直接ダウンロード
wget https://datasets.cashpop.meme/releases/Q2-2027/

# Python経由
import requests, pandas as pd
df = pd.read_parquet('https://datasets.cashpop.meme/releases/Q2-2027/cashpop-rounds.parquet')

再現コード

オープンソースパイプラインは github.com/cashpop-protocol/data-pipeline にあります。どなたでも:

  1. 異なるパラメータで匿名化を再実行できます。
  2. k-匿名性とDP保証を再検証できます。
  3. 公開された分析を再現できます。

ライセンス

Creative Commons Attribution 4.0 International (CC-BY-4.0)。帰属表示を条件に、商用を含むあらゆる目的でデータを使用、再配布、改変することができます。

学術パートナーシップ

現在進行中または交渉中のもの:

  • 研究大学の行動経済学グループ(目標発表: 2026年第3四半期)
  • 計算社会科学コンソーシアム(目標発表: 2026年第4四半期)

非集計データへのアクセスを希望する外部研究者(適切なIRB審査と機密保持プロトコルを条件とする)は、support@cashpop.meme までご連絡ください。

引用

公開研究でCashPop (キャッシュポップ) データを使用する場合は、以下を引用してください:

CashPop Protocol Team. (2027). CashPop Round Aggregates Qx-YYYY [Dataset]. https://datasets.cashpop.meme

正式なBibTeXエントリはリリースごとに提供されます。

Built on TON.