ระเบียบวิธีวิจัยการทดลองทางสังคม (Social Experiment Methodology)

กรอบแนวคิด (The framing)

CashPop เป็นเกมบน Telegram นอกจากนี้ยังเป็นการทดลองแบบเรียลไทม์ต่อเนื่องในระดับดาวเคราะห์เกี่ยวกับการประสานงานของมนุษย์ ความเชื่อร่วม (focal beliefs) ความลึกเชิงกลยุทธ์ และการแพร่กระจายความรู้ร่วม (common-knowledge propagation) โครงสร้างเชิงพาณิชย์ของโปรโตคอล (ที่ได้รับทุนจากโฆษณาและแจกจ่ายโทเค็นกลับ) คือสิ่งที่ทำให้การทดลองนี้มีความยั่งยืนทางการเงิน ในทางกลับกัน การทดลองนี้เองก็ทำให้โปรโตคอลกลายเป็นสมบัติทางวิทยาศาสตร์ที่ยั่งยืน

หน้านี้บันทึกสิ่งที่เราวัด วิธีการทำให้ข้อมูลไม่ระบุตัวตน สิ่งที่เราเผยแพร่ และความร่วมมือทางวิชาการที่เกี่ยวข้อง

ตัวแปรที่สังเกต (Variables observed)

สำหรับทุกๆ Round (รอบ) เราจะบันทึกข้อมูลดังนี้:

ตัวแปร	ชนิด	ความละเอียด
Round ID (รหัสรอบ)	จำนวนเต็ม	ไม่ซ้ำกัน
Question ID (รหัสคำถาม)	จำนวนเต็ม	เชื่อมโยงกับรายการในคลังสาธารณะ
เวลาเริ่มต้น Round (รอบ)	UTC ms	แม่นยำ
จำนวนผู้เข้าร่วม	จำนวนเต็ม	แม่นยำ
จำนวน Commit (การยืนยัน) แยกตามช่วงเวลา ms	อาร์เรย์	จัดกลุ่มเป็นช่วง 1 วินาที
จำนวน Reveal (การเปิดเผย) แยกตามช่วงเวลา ms	อาร์เรย์	จัดกลุ่มเป็นช่วง 1 วินาที
ผลลัพธ์ข้างมาก		แม่นยำ
สัดส่วนคะแนนเสียง	ทศนิยม	แม่นยำ
การแจกแจงทางประชากรศาสตร์แบบรวม	ข้อมูลรวม	จัดกลุ่มที่ ≥100 คนต่อกลุ่ม

เรา ไม่ บันทึก:

ข้อมูลประจำตัวผู้ใช้รายบุคคลในทุกระดับ
คะแนนเสียงของผู้ใช้รายบุคคล (เฉพาะสัดส่วนรวม)
ที่อยู่ IP (เฉพาะรหัสประเทศที่ระดับการรวม ≥100 คน)
พฤติกรรมข้าม Round (รอบ) ของผู้ใช้รายใดรายหนึ่ง (ผู้ใช้แต่ละคนปรากฏเป็นโทเค็นที่ไม่ระบุตัวตนและไม่สามารถเชื่อมโยงข้าม Round (รอบ) ได้)

โปรโตคอลการทำให้ไม่ระบุตัวตน (Anonymization protocol)

ข้อมูลที่เผยแพร่ทั้งหมดต้องผ่าน เกณฑ์ k-anonymity ที่ k=100: ไม่มีเซลล์ข้อมูลรวมใดที่มีผู้เข้าร่วมน้อยกว่า 100 คน เซลล์ที่ต่ำกว่า k จะถูกรวมกับเซลล์ข้างเคียงหรือถูกระงับ

สำหรับการแจกแจงทางประชากรศาสตร์ (ประเทศ ช่วงอายุ ภาษา) เราใช้ differential privacy (ความเป็นส่วนตัวเชิงอนุพันธ์) ด้วย ε = 1.0: มีการเพิ่มกลไกสัญญาณรบกวน Laplace ที่ได้รับการปรับเทียบแล้วลงในจำนวนนับของแต่ละเซลล์

หลักฐานเชิงการเข้ารหัส: ท่อส่งข้อมูล (data pipeline) สำหรับการทำให้ไม่ระบุตัวตนเป็นโอเพนซอร์ส (github.com/cashpop-protocol/data-pipeline) และผู้ตรวจสอบภายนอกสามารถตรวจสอบได้ว่าชุดข้อมูลที่เผยแพร่นั้นสอดคล้องกับกฎการทำให้ไม่ระบุตัวตน

สิ่งที่เราเผยแพร่ (What we publish)

ชุดข้อมูลรวมรายไตรมาส (Quarterly aggregated datasets)

ในแต่ละไตรมาส เราจะเผยแพร่:

ข้อมูลรวมระดับ Round (รอบ): สถิติต่อ Round (รอบ) (จำนวน สัดส่วน ข้อมูลประชากร) — ผ่าน k-anonymity
ภาพรวมคลังคำถาม (Question reservoir snapshot): คำถามที่ใช้ การกระจายคำตอบ การประมาณค่าจุดร่วม (focal-point estimates)
อนุกรมเวลา (Time-series): DAU (ผู้ใช้รายวันที่ใช้งาน), MAU (ผู้ใช้รายเดือนที่ใช้งาน), จำนวน Round (รอบ), การกระจาย Prize Pool (พูลรางวัล) รายสัปดาห์
เมทริกซ์จุดร่วมข้ามประเทศ (Cross-country focal-point matrix): ต่อหมวดหมู่คำถาม ความคล้ายคลึงโคไซน์ของการกระจายคำตอบข้ามประเทศ

ชุดข้อมูลทั้งหมด: ใบอนุญาต CC-BY-4.0 เผยแพร่ที่ datasets.cashpop.meme

รายงานการวิจัยประจำปี (Annual research reports)

ในแต่ละปี โปรโตคอลจะเผยแพร่รายงานการวิจัยที่มีคุณภาพเทียบเท่ากับการตรวจสอบโดยผู้ทรงคุณวุฒิ เราให้คำมั่นว่า:

อย่างน้อยหนึ่งบทความ preprint รายไตรมาสที่ส่งไปยัง SSRN / arXiv (econ.GT, cs.GT)
อย่างน้อยหนึ่งรายงานประจำปีที่เขียนร่วมกับพันธมิตรทางวิชาการ (เป้าหมาย: กลุ่มเศรษฐศาสตร์พฤติกรรมที่มหาวิทยาลัยวิจัย)
คณะกรรมการตรวจสอบข้อมูลแบบเปิดซึ่งรวมถึงผู้ตรวจสอบทางวิชาการภายนอก

รายงานฉบับแรก — ซึ่งครอบคลุมชุดข้อมูลไตรมาสที่ 1 ปี 2027 — มีเป้าหมายเผยแพร่ในไตรมาสที่ 2 ปี 2027

ระเบียบวิธีที่กำลังสำรวจ (Methodologies being explored)

แนวทางการวิจัยที่กำลังดำเนินการ (อยู่ระหว่างการตรวจสอบโดยผู้ทรงคุณวุฒิ):

ดัชนีความแตกต่างของ Schelling Point (จุดแชลลิง) ข้ามวัฒนธรรม (Cross-cultural Schelling-point divergence index) ตัวชี้วัดว่าจุดร่วม (focal points) มีความเฉพาะเจาะจงทางวัฒนธรรมมากน้อยเพียงใด โดยขึ้นอยู่กับประเภทของคำถามและระยะห่างทางวัฒนธรรม
การประมาณค่าส่วนผสมระดับ-k ในระดับประชากร (Level-k mixture estimation at population scale) การใช้ข้อมูลเวลา Commit (การยืนยัน) และคำตอบในระดับ Round (รอบ) เพื่อประมาณการกระจายระดับ-k ของประชากร
ความหน่วงของการแพร่กระจายความรู้ร่วม (Common-knowledge propagation latency) ความเชื่อเกี่ยวกับความเชื่อแพร่กระจายผ่านกราฟสังคม Telegram ได้เร็วแค่ไหน? วัดได้ผ่านความสอดคล้องข้าม Round (รอบ) สำหรับชุดคำถามที่ซิงโครไนซ์กัน
การปรับเทียบภูมิปัญญาฝูงชนเทียบกับความจริงพื้นฐาน (Wisdom-of-crowds calibration vs. ground truth) สำหรับคำถามเชิงข้อเท็จจริง การเปรียบเทียบเสียงข้างมากของ CashPop กับความจริงพื้นฐานที่ได้รับการยืนยัน
ความแตกต่างของความลึกเชิงกลยุทธ์ตามชั้นประชากร (Strategic-depth heterogeneity by demographic stratum) ผู้สูงอายุมีแนวโน้มเป็นระดับ-1 มากกว่าหรือไม่? ผู้ที่เชี่ยวชาญคริปโตมีแนวโน้มเป็นระดับ-3 มากกว่าหรือไม่? สามารถทดสอบเชิงประจักษ์ได้
การแก้ไขความเชื่อภายใต้ภาวะช็อกข้อมูล (Belief-revision under information shocks) ดำเนินการชุดคำถามก่อนและหลังเหตุการณ์ข่าวสำคัญ วัดการเปลี่ยนแปลง

เหตุใดสิ่งนี้จึงสำคัญ (Why this matters)

สามเหตุผล:

เชิงวิทยาศาสตร์ (Scientific) การทดลอง Beauty Contest (การประกวดความงาม) ได้ดำเนินการกับอาสาสมัครน้อยกว่า 200 คนในห้องปฏิบัติการที่มีการควบคุมมาเป็นเวลา 30 ปี CashPop ดำเนินการกับอาสาสมัครประมาณ 10,000 คนต่อ Round (รอบ) ในสภาพสนามจริง ข้ามวัฒนธรรม และสามารถตรวจสอบได้ด้วยการเข้ารหัส อำนาจเชิงประจักษ์นั้นไม่เคยมีมาก่อน
เชิงพลเมือง (Civic) โครงสร้างความรู้ร่วม (Aumann, Rubinstein, Vives) เป็นรากฐานของทุกสิ่งตั้งแต่โครงสร้างจุลภาคของตลาดไปจนถึงผลการเลือกตั้ง การวัดที่ดีขึ้นว่าความรู้ร่วมก่อตัวและสลายตัวอย่างไรเป็นสาธารณประโยชน์
เชิงชื่อเสียง (Reputational) ความชอบธรรมในระยะยาวของโปรโตคอลขึ้นอยู่กับอัตลักษณ์ของตนในฐานะสมบัติข้อมูลส่วนรวม (data-commons) CashPop ไม่ได้ดึงข้อมูลจากผู้ใช้ แต่กำลังร่วมผลิตทรัพยากรทางวิทยาศาสตร์ร่วมกับพวกเขา

ข้อจำกัดที่เรายอมรับ (Limitations we acknowledge)

อคติจากการเลือก (Selection bias) ผู้ใช้ CashPop ไม่ใช่กลุ่มตัวอย่างที่เป็นตัวแทนของมนุษยชาติ พวกเขาเป็นผู้ใช้ Telegram ที่มีความอยากรู้เกี่ยวกับคริปโตและมีเวลาเล่นเกม ผลลัพธ์ของเราสามารถสรุปทั่วไปได้กับประชากรกลุ่มนี้ ไม่ใช่กับมนุษยชาติโดยรวม
การปนเปื้อนจากแรงจูงใจ (Incentive contamination) ผู้เล่นได้รับค่าตอบแทน (เป็น POP (คะแนน)) สิ่งนี้เปลี่ยนแปลงเกมเชิงกลยุทธ์เมื่อเทียบกับการศึกษาในห้องปฏิบัติการที่ไม่มีแรงจูงใจ เราจะบันทึกและวัดปริมาณผลกระทบนี้
อคติของคลังคำถาม (Question reservoir bias) คลังคำถามถูกสร้างโดย LLM และลดอคติด้วยความพยายามอย่างเต็มที่ แต่อคติที่หลงเหลืออยู่ยังคงมีอยู่ เราเผยแพร่คลังคำถามอย่างเปิดเผยเพื่อให้นักวิจัยภายนอกสามารถวิเคราะห์ซ้ำด้วยวิธีการลดอคติของตนเอง

เอกสารอ้างอิง (References)

Aumann, R.J. (1976). Agreeing to Disagree. Annals of Statistics 4(6).
Rubinstein, A. (1989). The Electronic Mail Game. AER 79.
Vives, X. (2008). Information and Learning in Markets. Princeton.
Surowiecki, J. (2004). The Wisdom of Crowds. Doubleday.
Galton, F. (1907). Vox Populi. Nature 75.

ระเบียบวิธีวิจัยการทดลองทางสังคม (Social Experiment Methodology) ​

กรอบแนวคิด (The framing) ​

ตัวแปรที่สังเกต (Variables observed) ​

โปรโตคอลการทำให้ไม่ระบุตัวตน (Anonymization protocol) ​

สิ่งที่เราเผยแพร่ (What we publish) ​

ชุดข้อมูลรวมรายไตรมาส (Quarterly aggregated datasets) ​

รายงานการวิจัยประจำปี (Annual research reports) ​

ระเบียบวิธีที่กำลังสำรวจ (Methodologies being explored) ​

เหตุใดสิ่งนี้จึงสำคัญ (Why this matters) ​

ข้อจำกัดที่เรายอมรับ (Limitations we acknowledge) ​

เอกสารอ้างอิง (References) ​