Skip to content

开放数据集

CashPop (积分协议) 以 CC-BY-4.0 许可在 datasets.cashpop.meme 发布匿名化聚合数据集。

发布节奏

  • 每日:通过 API 提供滚动 30 天指标端点。
  • 每季度:完整季度快照,包含 Round (回合) 级别聚合数据。
  • 每年:带方法论论文的注释研究数据集。

数据产品

1. cashpop-rounds-Qx-YYYY.parquet

每回合聚合数据。模式:

round_id          int64
question_id       int64
start_ts          int64 (UTC 毫秒)
participant_count int32
commit_count_by_second  array<int32>  // 30 个元素
reveal_count_by_second  array<int32>  // 15 个元素
majority_outcome  int8           // 0 或 1
vote_ratio        float64        // 多数方占比
country_buckets   map<string, struct{count: int32, ratio: float64}>

2. cashpop-reservoir-Qx-YYYY.parquet

问题池快照。模式:

question_id       int64
question_text     string
category          string
language_origin   string
calibration_distribution  array<float64>  // 合成人群估计
actual_distribution       array<float64>  // 观测值
focal_point_index float64       // Schelling Point (谢林点) 分歧度

3. cashpop-timeseries-Qx-YYYY.parquet

每日聚合数据。模式:

date              date
dau               int32
mau               int32
total_rounds      int32
ad_revenue_usd    float64
prize_pool_distributed_usd  float64
unique_countries  int32
median_round_size int32

4. cashpop-focal-matrix-Qx-YYYY.parquet

跨国焦点相似度矩阵。模式:

question_category string
country_a         string  // ISO-3166
country_b         string
similarity        float64  // 基于响应分布的余弦相似度
sample_size_a     int32
sample_size_b     int32

方法论论文

每季度发布均附带方法论论文,涵盖:

  • 抽样决策与已知偏差
  • 匿名化参数(k-匿名阈值、差分隐私 ε)
  • 问题池校准分析
  • 复现说明

访问方式

bash
# 通过 API
curl https://datasets.cashpop.meme/api/v1/Q2-2027/rounds.parquet

# 通过直接下载
wget https://datasets.cashpop.meme/releases/Q2-2027/

# 通过 Python
import requests, pandas as pd
df = pd.read_parquet('https://datasets.cashpop.meme/releases/Q2-2027/cashpop-rounds.parquet')

复现代码

开源流水线位于 github.com/cashpop-protocol/data-pipeline。任何人都可以:

  1. 使用不同参数重新运行匿名化。
  2. 重新验证 k-匿名性和差分隐私保证。
  3. 复现已发表的分析结果。

许可协议

知识共享署名 4.0 国际许可协议 (CC-BY-4.0)。您可以为任何目的(包括商业用途)使用、再分发和改编数据,但需注明出处。

学术合作

已在进行或正在洽谈的合作:

  • 某研究大学的行为经济学团队(目标公告时间:2026 年第三季度)。
  • 计算社会科学联盟(目标公告时间:2026 年第四季度)。

寻求访问非聚合数据(需经适当的机构审查委员会审查并签署保密协议)的外部研究人员可联系:support@cashpop.meme

引用

如果您在已发表的研究中使用 CashPop 数据,请引用:

CashPop Protocol Team. (2027). CashPop Round Aggregates Qx-YYYY [Dataset]. https://datasets.cashpop.meme

每次发布将提供正式的 BibTeX 条目。

Built on TON.