开放数据集
CashPop (积分协议) 以 CC-BY-4.0 许可在 datasets.cashpop.meme 发布匿名化聚合数据集。
发布节奏
- 每日:通过 API 提供滚动 30 天指标端点。
- 每季度:完整季度快照,包含 Round (回合) 级别聚合数据。
- 每年:带方法论论文的注释研究数据集。
数据产品
1. cashpop-rounds-Qx-YYYY.parquet
每回合聚合数据。模式:
round_id int64
question_id int64
start_ts int64 (UTC 毫秒)
participant_count int32
commit_count_by_second array<int32> // 30 个元素
reveal_count_by_second array<int32> // 15 个元素
majority_outcome int8 // 0 或 1
vote_ratio float64 // 多数方占比
country_buckets map<string, struct{count: int32, ratio: float64}>2. cashpop-reservoir-Qx-YYYY.parquet
问题池快照。模式:
question_id int64
question_text string
category string
language_origin string
calibration_distribution array<float64> // 合成人群估计
actual_distribution array<float64> // 观测值
focal_point_index float64 // Schelling Point (谢林点) 分歧度3. cashpop-timeseries-Qx-YYYY.parquet
每日聚合数据。模式:
date date
dau int32
mau int32
total_rounds int32
ad_revenue_usd float64
prize_pool_distributed_usd float64
unique_countries int32
median_round_size int324. cashpop-focal-matrix-Qx-YYYY.parquet
跨国焦点相似度矩阵。模式:
question_category string
country_a string // ISO-3166
country_b string
similarity float64 // 基于响应分布的余弦相似度
sample_size_a int32
sample_size_b int32方法论论文
每季度发布均附带方法论论文,涵盖:
- 抽样决策与已知偏差
- 匿名化参数(k-匿名阈值、差分隐私 ε)
- 问题池校准分析
- 复现说明
访问方式
bash
# 通过 API
curl https://datasets.cashpop.meme/api/v1/Q2-2027/rounds.parquet
# 通过直接下载
wget https://datasets.cashpop.meme/releases/Q2-2027/
# 通过 Python
import requests, pandas as pd
df = pd.read_parquet('https://datasets.cashpop.meme/releases/Q2-2027/cashpop-rounds.parquet')复现代码
开源流水线位于 github.com/cashpop-protocol/data-pipeline。任何人都可以:
- 使用不同参数重新运行匿名化。
- 重新验证 k-匿名性和差分隐私保证。
- 复现已发表的分析结果。
许可协议
知识共享署名 4.0 国际许可协议 (CC-BY-4.0)。您可以为任何目的(包括商业用途)使用、再分发和改编数据,但需注明出处。
学术合作
已在进行或正在洽谈的合作:
- 某研究大学的行为经济学团队(目标公告时间:2026 年第三季度)。
- 计算社会科学联盟(目标公告时间:2026 年第四季度)。
寻求访问非聚合数据(需经适当的机构审查委员会审查并签署保密协议)的外部研究人员可联系:support@cashpop.meme。
引用
如果您在已发表的研究中使用 CashPop 数据,请引用:
CashPop Protocol Team. (2027). CashPop Round Aggregates Qx-YYYY [Dataset]. https://datasets.cashpop.meme
每次发布将提供正式的 BibTeX 条目。