ชุดข้อมูลแบบเปิด (Open Datasets)
CashPop เผยแพร่ชุดข้อมูลรวมที่ไม่ระบุตัวตนภายใต้สัญญาอนุญาต CC-BY-4.0 ที่ datasets.cashpop.meme
ความถี่ในการเผยแพร่
- รายวัน: จุดสิ้นสุด (endpoint) ข้อมูลเมตริกแบบหมุนเวียน 30 วันผ่าน API
- รายไตรมาส: ภาพรวมรายไตรมาสแบบเต็ม รวมถึงข้อมูลรวมระดับ Round (รอบ)
- รายปี: ชุดข้อมูลวิจัยพร้อมเอกสารระเบียบวิธี (methodology paper)
ผลิตภัณฑ์ข้อมูล
1. cashpop-rounds-Qx-YYYY.parquet
ข้อมูลรวมต่อ Round (รอบ) โครงสร้าง:
round_id int64
question_id int64
start_ts int64 (UTC ms)
participant_count int32
commit_count_by_second array<int32> // 30 องค์ประกอบ
reveal_count_by_second array<int32> // 15 องค์ประกอบ
majority_outcome int8 // 0 หรือ 1
vote_ratio float64 // สัดส่วนของเสียงข้างมาก
country_buckets map<string, struct{count: int32, ratio: float64}>2. cashpop-reservoir-Qx-YYYY.parquet
ภาพรวมคลังคำถาม (Question Reservoir) โครงสร้าง:
question_id int64
question_text string
category string
language_origin string
calibration_distribution array<float64> // ค่าประมาณประชากรสังเคราะห์
actual_distribution array<float64> // ค่าที่สังเกตได้
focal_point_index float64 // ค่าความแตกต่างของ Schelling (Schelling divergence)3. cashpop-timeseries-Qx-YYYY.parquet
ข้อมูลรวมรายวัน โครงสร้าง:
date date
dau int32
mau int32
total_rounds int32
ad_revenue_usd float64
prize_pool_distributed_usd float64
unique_countries int32
median_round_size int324. cashpop-focal-matrix-Qx-YYYY.parquet
ความคล้ายคลึงของจุดโฟกัส (focal point) ข้ามประเทศ โครงสร้าง:
question_category string
country_a string // ISO-3166
country_b string
similarity float64 // โคไซน์บนการกระจายของคำตอบ
sample_size_a int32
sample_size_b int32เอกสารระเบียบวิธี (Methodology Paper)
การเผยแพร่รายไตรมาสแต่ละครั้งจะมาพร้อมกับเอกสารระเบียบวิธีที่ครอบคลุม:
- การตัดสินใจในการสุ่มตัวอย่างและอคติที่ทราบ
- พารามิเตอร์การไม่ระบุตัวตน (เกณฑ์ k-anonymity, ε สำหรับ differential privacy)
- การวิเคราะห์การปรับเทียบ (calibration) ของคลังคำถาม
- คำแนะนำในการทำซ้ำผลลัพธ์
วิธีการเข้าถึง
# ผ่าน API
curl https://datasets.cashpop.meme/api/v1/Q2-2027/rounds.parquet
# ผ่านการดาวน์โหลดโดยตรง
wget https://datasets.cashpop.meme/releases/Q2-2027/
# ผ่าน Python
import requests, pandas as pd
df = pd.read_parquet('https://datasets.cashpop.meme/releases/Q2-2027/cashpop-rounds.parquet')โค้ดสำหรับทำซ้ำผลลัพธ์ (Replication Code)
ไปป์ไลน์โอเพนซอร์สที่ github.com/cashpop-protocol/data-pipeline ทุกคนสามารถ:
- ดำเนินการไม่ระบุตัวตนอีกครั้งด้วยพารามิเตอร์ที่แตกต่างกัน
- ตรวจสอบการรับประกัน k-anonymity และ DP อีกครั้ง
- ทำซ้ำการวิเคราะห์ที่เผยแพร่แล้ว
สัญญาอนุญาต
Creative Commons Attribution 4.0 International (CC-BY-4.0) คุณสามารถใช้ แจกจ่าย และดัดแปลงข้อมูลเพื่อวัตถุประสงค์ใดก็ได้ รวมถึงเชิงพาณิชย์ โดยต้องระบุแหล่งที่มา
ความร่วมมือทางวิชาการ
ที่ดำเนินการอยู่หรืออยู่ระหว่างการเจรจา:
- กลุ่มเศรษฐศาสตร์พฤติกรรมจากมหาวิทยาลัยวิจัย (เป้าหมายประกาศ Q3 2026)
- กลุ่มความร่วมมือด้านสังคมศาสตร์เชิงคำนวณ (เป้าหมายประกาศ Q4 2026)
นักวิจัยภายนอกที่ต้องการเข้าถึงข้อมูลที่ไม่ใช่ข้อมูลรวม (โดยผ่านการทบทวน IRB และโปรโตคอลการรักษาความลับที่เหมาะสม) สามารถติดต่อได้ที่: research@cashpop.meme
การอ้างอิง (Citation)
หากคุณใช้ข้อมูล CashPop ในงานวิจัยที่เผยแพร่ โปรดอ้างอิงดังนี้:
CashPop Protocol Team. (2027). CashPop Round Aggregates Qx-YYYY [Dataset]. https://datasets.cashpop.meme
รายการ BibTeX อย่างเป็นทางการจะถูกจัดเตรียมไว้ในการเผยแพร่แต่ละครั้ง