Skip to content

공개 데이터셋

CashPop (캐시팝)은 CC-BY-4.0 라이선스 하에 익명화된 집계 데이터셋을 datasets.cashpop.meme에서 공개합니다.

배포 주기

  • 매일: API를 통해 최근 30일 지표의 롤링 엔드포인트 제공.
  • 분기별: Round (라운드) 수준 집계를 포함한 전체 분기 스냅샷.
  • 연간: 방법론 논문이 포함된 주석 처리된 연구 데이터셋.

데이터 제품

1. cashpop-rounds-Qx-YYYY.parquet

Round별 집계. 스키마:

round_id          int64
question_id       int64
start_ts          int64 (UTC ms)
participant_count int32
commit_count_by_second  array<int32>  // 30개 요소
reveal_count_by_second  array<int32>  // 15개 요소
majority_outcome  int8           // 0 또는 1
vote_ratio        float64        // 다수결 비율
country_buckets   map<string, struct{count: int32, ratio: float64}>

2. cashpop-reservoir-Qx-YYYY.parquet

질문 풀 스냅샷. 스키마:

question_id       int64
question_text     string
category          string
language_origin   string
calibration_distribution  array<float64>  // 합성 모집단 추정치
actual_distribution       array<float64>  // 관측치
focal_point_index float64       // Schelling (셸링) 발산도

3. cashpop-timeseries-Qx-YYYY.parquet

일별 집계. 스키마:

date              date
dau               int32
mau               int32
total_rounds      int32
ad_revenue_usd    float64
prize_pool_distributed_usd  float64
unique_countries  int32
median_round_size int32

4. cashpop-focal-matrix-Qx-YYYY.parquet

국가 간 초점점 유사도. 스키마:

question_category string
country_a         string  // ISO-3166
country_b         string
similarity        float64  // 응답 분포의 코사인 유사도
sample_size_a     int32
sample_size_b     int32

방법론 논문

각 분기별 릴리스에는 다음을 다루는 방법론 논문이 함께 제공됩니다:

  • 표본 추출 결정 및 알려진 편향
  • 익명화 매개변수 (k-익명성 임계값, 차등 프라이버시 ε)
  • 질문 풀의 보정 분석
  • 재현 지침

접근 방법

bash
# API를 통해
curl https://datasets.cashpop.meme/api/v1/Q2-2027/rounds.parquet

# 직접 다운로드
wget https://datasets.cashpop.meme/releases/Q2-2027/

# Python을 통해
import requests, pandas as pd
df = pd.read_parquet('https://datasets.cashpop.meme/releases/Q2-2027/cashpop-rounds.parquet')

재현 코드

오픈소스 파이프라인은 github.com/cashpop-protocol/data-pipeline에서 제공됩니다. 누구나 다음을 수행할 수 있습니다:

  1. 다른 매개변수로 익명화 재실행.
  2. k-익명성 및 차등 프라이버시 보장 재검증.
  3. 게시된 분석 재현.

라이선스

Creative Commons Attribution 4.0 International (CC-BY-4.0). 귀속 조건 하에 상업적 목적을 포함한 모든 목적으로 데이터를 사용, 재배포 및 수정할 수 있습니다.

학술 파트너십

진행 중 또는 협상 중인 사항:

  • 한 연구 대학의 행동경제학 그룹 (2026년 3분기 발표 예정).
  • 전산사회과학 컨소시엄 (2026년 4분기 발표 예정).

비집계 데이터에 접근하려는 외부 연구자 (적절한 IRB 검토 및 기밀성 프로토콜 필요)는 research@cashpop.meme로 문의하시기 바랍니다.

인용

게재된 연구에서 CashPop 데이터를 사용하는 경우 다음을 인용해 주십시오:

CashPop Protocol Team. (2027). CashPop Round Aggregates Qx-YYYY [Dataset]. https://datasets.cashpop.meme

릴리스별로 공식 BibTeX 항목이 제공됩니다.

Built on TON.