ระเบียบวิธีวิจัยการทดลองทางสังคม (Social Experiment Methodology)
กรอบแนวคิด (The framing)
CashPop เป็นเกมบน Telegram นอกจากนี้ยังเป็นการทดลองแบบเรียลไทม์ต่อเนื่องในระดับดาวเคราะห์เกี่ยวกับการประสานงานของมนุษย์ ความเชื่อร่วม (focal beliefs) ความลึกเชิงกลยุทธ์ และการแพร่กระจายความรู้ร่วม (common-knowledge propagation) โครงสร้างเชิงพาณิชย์ของโปรโตคอล (ที่ได้รับทุนจากโฆษณาและแจกจ่ายโทเค็นกลับ) คือสิ่งที่ทำให้การทดลองนี้มีความยั่งยืนทางการเงิน ในทางกลับกัน การทดลองนี้เองก็ทำให้โปรโตคอลกลายเป็นสมบัติทางวิทยาศาสตร์ที่ยั่งยืน
หน้านี้บันทึกสิ่งที่เราวัด วิธีการทำให้ข้อมูลไม่ระบุตัวตน สิ่งที่เราเผยแพร่ และความร่วมมือทางวิชาการที่เกี่ยวข้อง
ตัวแปรที่สังเกต (Variables observed)
สำหรับทุกๆ Round (รอบ) เราจะบันทึกข้อมูลดังนี้:
| ตัวแปร | ชนิด | ความละเอียด |
|---|---|---|
| Round ID (รหัสรอบ) | จำนวนเต็ม | ไม่ซ้ำกัน |
| Question ID (รหัสคำถาม) | จำนวนเต็ม | เชื่อมโยงกับรายการในคลังสาธารณะ |
| เวลาเริ่มต้น Round (รอบ) | UTC ms | แม่นยำ |
| จำนวนผู้เข้าร่วม | จำนวนเต็ม | แม่นยำ |
| จำนวน Commit (การยืนยัน) แยกตามช่วงเวลา ms | อาร์เรย์ | จัดกลุ่มเป็นช่วง 1 วินาที |
| จำนวน Reveal (การเปิดเผย) แยกตามช่วงเวลา ms | อาร์เรย์ | จัดกลุ่มเป็นช่วง 1 วินาที |
| ผลลัพธ์ข้างมาก | แม่นยำ | |
| สัดส่วนคะแนนเสียง | ทศนิยม | แม่นยำ |
| การแจกแจงทางประชากรศาสตร์แบบรวม | ข้อมูลรวม | จัดกลุ่มที่ ≥100 คนต่อกลุ่ม |
เรา ไม่ บันทึก:
- ข้อมูลประจำตัวผู้ใช้รายบุคคลในทุกระดับ
- คะแนนเสียงของผู้ใช้รายบุคคล (เฉพาะสัดส่วนรวม)
- ที่อยู่ IP (เฉพาะรหัสประเทศที่ระดับการรวม ≥100 คน)
- พฤติกรรมข้าม Round (รอบ) ของผู้ใช้รายใดรายหนึ่ง (ผู้ใช้แต่ละคนปรากฏเป็นโทเค็นที่ไม่ระบุตัวตนและไม่สามารถเชื่อมโยงข้าม Round (รอบ) ได้)
โปรโตคอลการทำให้ไม่ระบุตัวตน (Anonymization protocol)
ข้อมูลที่เผยแพร่ทั้งหมดต้องผ่าน เกณฑ์ k-anonymity ที่ k=100: ไม่มีเซลล์ข้อมูลรวมใดที่มีผู้เข้าร่วมน้อยกว่า 100 คน เซลล์ที่ต่ำกว่า k จะถูกรวมกับเซลล์ข้างเคียงหรือถูกระงับ
สำหรับการแจกแจงทางประชากรศาสตร์ (ประเทศ ช่วงอายุ ภาษา) เราใช้ differential privacy (ความเป็นส่วนตัวเชิงอนุพันธ์) ด้วย ε = 1.0: มีการเพิ่มกลไกสัญญาณรบกวน Laplace ที่ได้รับการปรับเทียบแล้วลงในจำนวนนับของแต่ละเซลล์
หลักฐานเชิงการเข้ารหัส: ท่อส่งข้อมูล (data pipeline) สำหรับการทำให้ไม่ระบุตัวตนเป็นโอเพนซอร์ส (github.com/cashpop-protocol/data-pipeline) และผู้ตรวจสอบภายนอกสามารถตรวจสอบได้ว่าชุดข้อมูลที่เผยแพร่นั้นสอดคล้องกับกฎการทำให้ไม่ระบุตัวตน
สิ่งที่เราเผยแพร่ (What we publish)
ชุดข้อมูลรวมรายไตรมาส (Quarterly aggregated datasets)
ในแต่ละไตรมาส เราจะเผยแพร่:
- ข้อมูลรวมระดับ Round (รอบ): สถิติต่อ Round (รอบ) (จำนวน สัดส่วน ข้อมูลประชากร) — ผ่าน k-anonymity
- ภาพรวมคลังคำถาม (Question reservoir snapshot): คำถามที่ใช้ การกระจายคำตอบ การประมาณค่าจุดร่วม (focal-point estimates)
- อนุกรมเวลา (Time-series): DAU (ผู้ใช้รายวันที่ใช้งาน), MAU (ผู้ใช้รายเดือนที่ใช้งาน), จำนวน Round (รอบ), การกระจาย Prize Pool (พูลรางวัล) รายสัปดาห์
- เมทริกซ์จุดร่วมข้ามประเทศ (Cross-country focal-point matrix): ต่อหมวดหมู่คำถาม ความคล้ายคลึงโคไซน์ของการกระจายคำตอบข้ามประเทศ
ชุดข้อมูลทั้งหมด: ใบอนุญาต CC-BY-4.0 เผยแพร่ที่ datasets.cashpop.meme
รายงานการวิจัยประจำปี (Annual research reports)
ในแต่ละปี โปรโตคอลจะเผยแพร่รายงานการวิจัยที่มีคุณภาพเทียบเท่ากับการตรวจสอบโดยผู้ทรงคุณวุฒิ เราให้คำมั่นว่า:
- อย่างน้อยหนึ่งบทความ preprint รายไตรมาสที่ส่งไปยัง SSRN / arXiv (econ.GT, cs.GT)
- อย่างน้อยหนึ่งรายงานประจำปีที่เขียนร่วมกับพันธมิตรทางวิชาการ (เป้าหมาย: กลุ่มเศรษฐศาสตร์พฤติกรรมที่มหาวิทยาลัยวิจัย)
- คณะกรรมการตรวจสอบข้อมูลแบบเปิดซึ่งรวมถึงผู้ตรวจสอบทางวิชาการภายนอก
รายงานฉบับแรก — ซึ่งครอบคลุมชุดข้อมูลไตรมาสที่ 1 ปี 2027 — มีเป้าหมายเผยแพร่ในไตรมาสที่ 2 ปี 2027
ระเบียบวิธีที่กำลังสำรวจ (Methodologies being explored)
แนวทางการวิจัยที่กำลังดำเนินการ (อยู่ระหว่างการตรวจสอบโดยผู้ทรงคุณวุฒิ):
- ดัชนีความแตกต่างของ Schelling Point (จุดแชลลิง) ข้ามวัฒนธรรม (Cross-cultural Schelling-point divergence index) ตัวชี้วัดว่าจุดร่วม (focal points) มีความเฉพาะเจาะจงทางวัฒนธรรมมากน้อยเพียงใด โดยขึ้นอยู่กับประเภทของคำถามและระยะห่างทางวัฒนธรรม
- การประมาณค่าส่วนผสมระดับ-k ในระดับประชากร (Level-k mixture estimation at population scale) การใช้ข้อมูลเวลา Commit (การยืนยัน) และคำตอบในระดับ Round (รอบ) เพื่อประมาณการกระจายระดับ-k ของประชากร
- ความหน่วงของการแพร่กระจายความรู้ร่วม (Common-knowledge propagation latency) ความเชื่อเกี่ยวกับความเชื่อแพร่กระจายผ่านกราฟสังคม Telegram ได้เร็วแค่ไหน? วัดได้ผ่านความสอดคล้องข้าม Round (รอบ) สำหรับชุดคำถามที่ซิงโครไนซ์กัน
- การปรับเทียบภูมิปัญญาฝูงชนเทียบกับความจริงพื้นฐาน (Wisdom-of-crowds calibration vs. ground truth) สำหรับคำถามเชิงข้อเท็จจริง การเปรียบเทียบเสียงข้างมากของ CashPop กับความจริงพื้นฐานที่ได้รับการยืนยัน
- ความแตกต่างของความลึกเชิงกลยุทธ์ตามชั้นประชากร (Strategic-depth heterogeneity by demographic stratum) ผู้สูงอายุมีแนวโน้มเป็นระดับ-1 มากกว่าหรือไม่? ผู้ที่เชี่ยวชาญคริปโตมีแนวโน้มเป็นระดับ-3 มากกว่าหรือไม่? สามารถทดสอบเชิงประจักษ์ได้
- การแก้ไขความเชื่อภายใต้ภาวะช็อกข้อมูล (Belief-revision under information shocks) ดำเนินการชุดคำถามก่อนและหลังเหตุการณ์ข่าวสำคัญ วัดการเปลี่ยนแปลง
เหตุใดสิ่งนี้จึงสำคัญ (Why this matters)
สามเหตุผล:
เชิงวิทยาศาสตร์ (Scientific) การทดลอง Beauty Contest (การประกวดความงาม) ได้ดำเนินการกับอาสาสมัครน้อยกว่า 200 คนในห้องปฏิบัติการที่มีการควบคุมมาเป็นเวลา 30 ปี CashPop ดำเนินการกับอาสาสมัครประมาณ 10,000 คนต่อ Round (รอบ) ในสภาพสนามจริง ข้ามวัฒนธรรม และสามารถตรวจสอบได้ด้วยการเข้ารหัส อำนาจเชิงประจักษ์นั้นไม่เคยมีมาก่อน
เชิงพลเมือง (Civic) โครงสร้างความรู้ร่วม (Aumann, Rubinstein, Vives) เป็นรากฐานของทุกสิ่งตั้งแต่โครงสร้างจุลภาคของตลาดไปจนถึงผลการเลือกตั้ง การวัดที่ดีขึ้นว่าความรู้ร่วมก่อตัวและสลายตัวอย่างไรเป็นสาธารณประโยชน์
เชิงชื่อเสียง (Reputational) ความชอบธรรมในระยะยาวของโปรโตคอลขึ้นอยู่กับอัตลักษณ์ของตนในฐานะสมบัติข้อมูลส่วนรวม (data-commons) CashPop ไม่ได้ดึงข้อมูลจากผู้ใช้ แต่กำลังร่วมผลิตทรัพยากรทางวิทยาศาสตร์ร่วมกับพวกเขา
ข้อจำกัดที่เรายอมรับ (Limitations we acknowledge)
- อคติจากการเลือก (Selection bias) ผู้ใช้ CashPop ไม่ใช่กลุ่มตัวอย่างที่เป็นตัวแทนของมนุษยชาติ พวกเขาเป็นผู้ใช้ Telegram ที่มีความอยากรู้เกี่ยวกับคริปโตและมีเวลาเล่นเกม ผลลัพธ์ของเราสามารถสรุปทั่วไปได้กับประชากรกลุ่มนี้ ไม่ใช่กับมนุษยชาติโดยรวม
- การปนเปื้อนจากแรงจูงใจ (Incentive contamination) ผู้เล่นได้รับค่าตอบแทน (เป็น POP (คะแนน)) สิ่งนี้เปลี่ยนแปลงเกมเชิงกลยุทธ์เมื่อเทียบกับการศึกษาในห้องปฏิบัติการที่ไม่มีแรงจูงใจ เราจะบันทึกและวัดปริมาณผลกระทบนี้
- อคติของคลังคำถาม (Question reservoir bias) คลังคำถามถูกสร้างโดย LLM และลดอคติด้วยความพยายามอย่างเต็มที่ แต่อคติที่หลงเหลืออยู่ยังคงมีอยู่ เราเผยแพร่คลังคำถามอย่างเปิดเผยเพื่อให้นักวิจัยภายนอกสามารถวิเคราะห์ซ้ำด้วยวิธีการลดอคติของตนเอง
เอกสารอ้างอิง (References)
- Aumann, R.J. (1976). Agreeing to Disagree. Annals of Statistics 4(6).
- Rubinstein, A. (1989). The Electronic Mail Game. AER 79.
- Vives, X. (2008). Information and Learning in Markets. Princeton.
- Surowiecki, J. (2004). The Wisdom of Crowds. Doubleday.
- Galton, F. (1907). Vox Populi. Nature 75.