공개 데이터셋
CashPop (캐시팝)은 CC-BY-4.0 라이선스 하에 익명화된 집계 데이터셋을 datasets.cashpop.meme에서 공개합니다.
배포 주기
- 매일: API를 통해 최근 30일 지표의 롤링 엔드포인트 제공.
- 분기별: Round (라운드) 수준 집계를 포함한 전체 분기 스냅샷.
- 연간: 방법론 논문이 포함된 주석 처리된 연구 데이터셋.
데이터 제품
1. cashpop-rounds-Qx-YYYY.parquet
Round별 집계. 스키마:
round_id int64
question_id int64
start_ts int64 (UTC ms)
participant_count int32
commit_count_by_second array<int32> // 30개 요소
reveal_count_by_second array<int32> // 15개 요소
majority_outcome int8 // 0 또는 1
vote_ratio float64 // 다수결 비율
country_buckets map<string, struct{count: int32, ratio: float64}>2. cashpop-reservoir-Qx-YYYY.parquet
질문 풀 스냅샷. 스키마:
question_id int64
question_text string
category string
language_origin string
calibration_distribution array<float64> // 합성 모집단 추정치
actual_distribution array<float64> // 관측치
focal_point_index float64 // Schelling (셸링) 발산도3. cashpop-timeseries-Qx-YYYY.parquet
일별 집계. 스키마:
date date
dau int32
mau int32
total_rounds int32
ad_revenue_usd float64
prize_pool_distributed_usd float64
unique_countries int32
median_round_size int324. cashpop-focal-matrix-Qx-YYYY.parquet
국가 간 초점점 유사도. 스키마:
question_category string
country_a string // ISO-3166
country_b string
similarity float64 // 응답 분포의 코사인 유사도
sample_size_a int32
sample_size_b int32방법론 논문
각 분기별 릴리스에는 다음을 다루는 방법론 논문이 함께 제공됩니다:
- 표본 추출 결정 및 알려진 편향
- 익명화 매개변수 (k-익명성 임계값, 차등 프라이버시 ε)
- 질문 풀의 보정 분석
- 재현 지침
접근 방법
bash
# API를 통해
curl https://datasets.cashpop.meme/api/v1/Q2-2027/rounds.parquet
# 직접 다운로드
wget https://datasets.cashpop.meme/releases/Q2-2027/
# Python을 통해
import requests, pandas as pd
df = pd.read_parquet('https://datasets.cashpop.meme/releases/Q2-2027/cashpop-rounds.parquet')재현 코드
오픈소스 파이프라인은 github.com/cashpop-protocol/data-pipeline에서 제공됩니다. 누구나 다음을 수행할 수 있습니다:
- 다른 매개변수로 익명화 재실행.
- k-익명성 및 차등 프라이버시 보장 재검증.
- 게시된 분석 재현.
라이선스
Creative Commons Attribution 4.0 International (CC-BY-4.0). 귀속 조건 하에 상업적 목적을 포함한 모든 목적으로 데이터를 사용, 재배포 및 수정할 수 있습니다.
학술 파트너십
진행 중 또는 협상 중인 사항:
- 한 연구 대학의 행동경제학 그룹 (2026년 3분기 발표 예정).
- 전산사회과학 컨소시엄 (2026년 4분기 발표 예정).
비집계 데이터에 접근하려는 외부 연구자 (적절한 IRB 검토 및 기밀성 프로토콜 필요)는 research@cashpop.meme로 문의하시기 바랍니다.
인용
게재된 연구에서 CashPop 데이터를 사용하는 경우 다음을 인용해 주십시오:
CashPop Protocol Team. (2027). CashPop Round Aggregates Qx-YYYY [Dataset]. https://datasets.cashpop.meme
릴리스별로 공식 BibTeX 항목이 제공됩니다.