Skip to content

ชุดข้อมูลแบบเปิด (Open Datasets)

CashPop เผยแพร่ชุดข้อมูลรวมที่ไม่ระบุตัวตนภายใต้สัญญาอนุญาต CC-BY-4.0 ที่ datasets.cashpop.meme

ความถี่ในการเผยแพร่

  • รายวัน: จุดสิ้นสุด (endpoint) ข้อมูลเมตริกแบบหมุนเวียน 30 วันผ่าน API
  • รายไตรมาส: ภาพรวมรายไตรมาสแบบเต็ม รวมถึงข้อมูลรวมระดับ Round (รอบ)
  • รายปี: ชุดข้อมูลวิจัยพร้อมเอกสารระเบียบวิธี (methodology paper)

ผลิตภัณฑ์ข้อมูล

1. cashpop-rounds-Qx-YYYY.parquet

ข้อมูลรวมต่อ Round (รอบ) โครงสร้าง:

round_id          int64
question_id       int64
start_ts          int64 (UTC ms)
participant_count int32
commit_count_by_second  array<int32>  // 30 องค์ประกอบ
reveal_count_by_second  array<int32>  // 15 องค์ประกอบ
majority_outcome  int8           // 0 หรือ 1
vote_ratio        float64        // สัดส่วนของเสียงข้างมาก
country_buckets   map<string, struct{count: int32, ratio: float64}>

2. cashpop-reservoir-Qx-YYYY.parquet

ภาพรวมคลังคำถาม (Question Reservoir) โครงสร้าง:

question_id       int64
question_text     string
category          string
language_origin   string
calibration_distribution  array<float64>  // ค่าประมาณประชากรสังเคราะห์
actual_distribution       array<float64>  // ค่าที่สังเกตได้
focal_point_index float64       // ค่าความแตกต่างของ Schelling (Schelling divergence)

3. cashpop-timeseries-Qx-YYYY.parquet

ข้อมูลรวมรายวัน โครงสร้าง:

date              date
dau               int32
mau               int32
total_rounds      int32
ad_revenue_usd    float64
prize_pool_distributed_usd  float64
unique_countries  int32
median_round_size int32

4. cashpop-focal-matrix-Qx-YYYY.parquet

ความคล้ายคลึงของจุดโฟกัส (focal point) ข้ามประเทศ โครงสร้าง:

question_category string
country_a         string  // ISO-3166
country_b         string
similarity        float64  // โคไซน์บนการกระจายของคำตอบ
sample_size_a     int32
sample_size_b     int32

เอกสารระเบียบวิธี (Methodology Paper)

การเผยแพร่รายไตรมาสแต่ละครั้งจะมาพร้อมกับเอกสารระเบียบวิธีที่ครอบคลุม:

  • การตัดสินใจในการสุ่มตัวอย่างและอคติที่ทราบ
  • พารามิเตอร์การไม่ระบุตัวตน (เกณฑ์ k-anonymity, ε สำหรับ differential privacy)
  • การวิเคราะห์การปรับเทียบ (calibration) ของคลังคำถาม
  • คำแนะนำในการทำซ้ำผลลัพธ์

วิธีการเข้าถึง

bash
# ผ่าน API
curl https://datasets.cashpop.meme/api/v1/Q2-2027/rounds.parquet

# ผ่านการดาวน์โหลดโดยตรง
wget https://datasets.cashpop.meme/releases/Q2-2027/

# ผ่าน Python
import requests, pandas as pd
df = pd.read_parquet('https://datasets.cashpop.meme/releases/Q2-2027/cashpop-rounds.parquet')

โค้ดสำหรับทำซ้ำผลลัพธ์ (Replication Code)

ไปป์ไลน์โอเพนซอร์สที่ github.com/cashpop-protocol/data-pipeline ทุกคนสามารถ:

  1. ดำเนินการไม่ระบุตัวตนอีกครั้งด้วยพารามิเตอร์ที่แตกต่างกัน
  2. ตรวจสอบการรับประกัน k-anonymity และ DP อีกครั้ง
  3. ทำซ้ำการวิเคราะห์ที่เผยแพร่แล้ว

สัญญาอนุญาต

Creative Commons Attribution 4.0 International (CC-BY-4.0) คุณสามารถใช้ แจกจ่าย และดัดแปลงข้อมูลเพื่อวัตถุประสงค์ใดก็ได้ รวมถึงเชิงพาณิชย์ โดยต้องระบุแหล่งที่มา

ความร่วมมือทางวิชาการ

ที่ดำเนินการอยู่หรืออยู่ระหว่างการเจรจา:

  • กลุ่มเศรษฐศาสตร์พฤติกรรมจากมหาวิทยาลัยวิจัย (เป้าหมายประกาศ Q3 2026)
  • กลุ่มความร่วมมือด้านสังคมศาสตร์เชิงคำนวณ (เป้าหมายประกาศ Q4 2026)

นักวิจัยภายนอกที่ต้องการเข้าถึงข้อมูลที่ไม่ใช่ข้อมูลรวม (โดยผ่านการทบทวน IRB และโปรโตคอลการรักษาความลับที่เหมาะสม) สามารถติดต่อได้ที่: research@cashpop.meme

การอ้างอิง (Citation)

หากคุณใช้ข้อมูล CashPop ในงานวิจัยที่เผยแพร่ โปรดอ้างอิงดังนี้:

CashPop Protocol Team. (2027). CashPop Round Aggregates Qx-YYYY [Dataset]. https://datasets.cashpop.meme

รายการ BibTeX อย่างเป็นทางการจะถูกจัดเตรียมไว้ในการเผยแพร่แต่ละครั้ง

Built on TON.