Phương pháp luận thí nghiệm xã hội

Bối cảnh

CashPop là một trò chơi trên Telegram. Nó cũng là một thí nghiệm thời gian thực, quy mô hành tinh, liên tục về sự phối hợp của con người, niềm tin trọng tâm, chiều sâu chiến lược và sự lan truyền kiến thức chung. Cấu trúc thương mại của giao thức (tài trợ quảng cáo, phân phối lại token) là thứ giúp thí nghiệm bền vững về mặt tài chính. Ngược lại, thí nghiệm là thứ biến giao thức thành một tài sản khoa học lâu dài.

Trang này ghi lại những gì chúng tôi đo lường, cách chúng tôi ẩn danh hóa, những gì chúng tôi công bố và các quan hệ đối tác học thuật liên quan.

Các biến số được quan sát

Đối với mỗi Round (vòng), chúng tôi ghi lại:

Biến số	Loại	Độ phân giải
ID Round	số nguyên	duy nhất
ID Câu hỏi	số nguyên	ánh xạ tới mục nhập kho dữ liệu công khai
Dấu thời gian bắt đầu Round	UTC ms	chính xác
Số lượng người tham gia	số nguyên	chính xác
Số lượng Commit theo nhóm ms pha	mảng	được nhóm theo khoảng 1 giây
Số lượng Reveal theo nhóm ms pha	mảng	được nhóm theo khoảng 1 giây
Kết quả đa số		chính xác
Tỷ lệ bỏ phiếu	số thực	chính xác
Phân tích nhân khẩu học tổng hợp	tổng hợp	được nhóm với ≥100 người tham gia mỗi nhóm

Chúng tôi KHÔNG ghi lại:

Danh tính người dùng cá nhân ở bất kỳ cấp độ nào
Lượt bỏ phiếu của từng người dùng (chỉ tỷ lệ tổng hợp)
Địa chỉ IP (chỉ mã quốc gia ở mức tổng hợp >100 người tham gia)
Hành vi xuyên Round của bất kỳ người dùng cụ thể nào (mỗi người dùng xuất hiện dưới dạng token ẩn danh, không tương quan chéo trong mỗi Round)

Giao thức ẩn danh hóa

Tất cả dữ liệu được công bố đều trải qua ngưỡng k-ẩn danh là k=100: không có ô tổng hợp nào chứa ít hơn 100 người tham gia. Các ô dưới k sẽ được hợp nhất với các ô lân cận hoặc bị loại bỏ.

Đối với các phân tích nhân khẩu học (quốc gia, nhóm tuổi, ngôn ngữ), chúng tôi áp dụng quyền riêng tư vi sai với ε = 1.0: một cơ chế nhiễu Laplace đã được hiệu chuẩn được thêm vào mỗi số lượng ô.

Bằng chứng mật mã: pipeline ẩn danh hóa là mã nguồn mở (github.com/cashpop-protocol/data-pipeline) và một người xác minh bên thứ ba có thể xác minh rằng tập dữ liệu được công bố nhất quán với các quy tắc ẩn danh hóa.

Những gì chúng tôi công bố

Bộ dữ liệu tổng hợp hàng quý

Mỗi quý, chúng tôi phát hành:

Tổng hợp cấp Round: thống kê theo từng Round (số lượng, tỷ lệ, nhân khẩu học) — đã được k-ẩn danh hóa.
Ảnh chụp kho câu hỏi: các câu hỏi đã sử dụng, phân phối câu trả lời, ước tính điểm trọng tâm.
Chuỗi thời gian: DAU, MAU hàng tuần, số lượng Round, phân phối Prize Pool (quỹ giải thưởng).
Ma trận điểm trọng tâm xuyên quốc gia: theo danh mục câu hỏi, độ tương đồng cosine của phân phối câu trả lời giữa các quốc gia.

Tất cả bộ dữ liệu: Giấy phép CC-BY-4.0. Được công bố tại datasets.cashpop.meme.

Báo cáo nghiên cứu hàng năm

Mỗi năm, giao thức công bố một báo cáo nghiên cứu chất lượng ngang hàng. Chúng tôi đã cam kết:

Ít nhất một bản in trước bài báo hàng quý nhắm mục tiêu SSRN / arXiv (econ.GT, cs.GT).
Ít nhất một báo cáo hàng năm đồng tác giả với một đối tác học thuật (mục tiêu: nhóm kinh tế học hành vi tại một trường đại học nghiên cứu).
Một hội đồng đánh giá dữ liệu mở bao gồm các nhà đánh giá học thuật bên ngoài.

Báo cáo đầu tiên như vậy — bao gồm bộ dữ liệu Q1 2027 — được nhắm mục tiêu công bố vào Q2 2027.

Các phương pháp luận đang được khám phá

Các hướng nghiên cứu đang hoạt động (chịu sự đánh giá ngang hàng):

Chỉ số phân kỳ Schelling Point (điểm Schelling) xuyên văn hóa. Một thước đo về mức độ cụ thể về văn hóa của các điểm trọng tâm, như một hàm của loại câu hỏi và khoảng cách văn hóa.
Ước tính hỗn hợp cấp-k ở quy mô dân số. Sử dụng dữ liệu thời gian Commit và câu trả lời cấp Round để ước tính phân phối cấp-k của một quần thể.
Độ trễ lan truyền kiến thức chung. Niềm tin về niềm tin lan truyền nhanh như thế nào qua đồ thị xã hội Telegram? Có thể đo lường thông qua tính nhất quán xuyên Round cho các bộ câu hỏi đồng bộ hóa.
Hiệu chuẩn trí tuệ đám đông so với sự thật cơ bản. Đối với các câu hỏi thực tế, so sánh đa số CashPop với sự thật cơ bản đã được xác minh.
Tính không đồng nhất về chiều sâu chiến lược theo tầng lớp nhân khẩu học. Người cao tuổi có thiên về cấp-1 hơn không, người bản địa crypto có thiên về cấp-3 hơn không? Có thể kiểm tra thực nghiệm.
Điều chỉnh niềm tin dưới các cú sốc thông tin. Chạy các bộ câu hỏi trước và sau các sự kiện tin tức lớn; đo lường sự thay đổi.

Tại sao điều này quan trọng

Ba lý do:

Khoa học. Các thí nghiệm Beauty Contest (Cuộc thi sắc đẹp) đã được tiến hành với <200 đối tượng trong các phòng thí nghiệm có kiểm soát trong 30 năm. CashPop chạy ~10.000 đối tượng mỗi Round, trong điều kiện thực tế, xuyên suốt các nền văn hóa, với khả năng kiểm toán mật mã. Đòn bẩy thực nghiệm là chưa từng có.
Công dân. Cấu trúc kiến thức chung (Aumann, Rubinstein, Vives) hỗ trợ mọi thứ từ cấu trúc vi mô thị trường đến kết quả bầu cử. Đo lường tốt hơn cách kiến thức chung hình thành và tan rã là một lợi ích công cộng.
Danh tiếng. Tính hợp pháp lâu dài của giao thức phụ thuộc vào bản sắc tài sản dữ liệu chung của nó. CashPop không khai thác từ người dùng; nó đang đồng sản xuất một nguồn tài nguyên khoa học với họ.

Những hạn chế chúng tôi thừa nhận

Thiên lệch chọn lọc. Người dùng CashPop không phải là mẫu đại diện của nhân loại. Họ là người dùng Telegram có sự tò mò về crypto và thời gian để chơi trò chơi. Kết quả của chúng tôi khái quát hóa cho nhóm dân số này, không phải cho toàn bộ nhân loại.
Nhiễu động cơ. Người chơi được trả tiền (bằng POP (điểm)). Điều này thay đổi trò chơi chiến lược so với các nghiên cứu trong phòng thí nghiệm không có động cơ. Chúng tôi ghi lại và định lượng hiệu ứng này.
Thiên lệch kho câu hỏi. Kho câu hỏi được tạo bởi LLM và được khử thiên lệch một cách tốt nhất, nhưng vẫn tồn tại các thiên lệch dư. Chúng tôi công bố kho câu hỏi một cách công khai để các nhà nghiên cứu bên ngoài có thể phân tích lại với phương pháp khử thiên lệch của riêng họ.

Tài liệu tham khảo

Aumann, R.J. (1976). Agreeing to Disagree. Annals of Statistics 4(6).
Rubinstein, A. (1989). The Electronic Mail Game. AER 79.
Vives, X. (2008). Information and Learning in Markets. Princeton.
Surowiecki, J. (2004). The Wisdom of Crowds. Doubleday.
Galton, F. (1907). Vox Populi. Nature 75.

Phương pháp luận thí nghiệm xã hội ​

Bối cảnh ​

Các biến số được quan sát ​

Giao thức ẩn danh hóa ​

Những gì chúng tôi công bố ​

Bộ dữ liệu tổng hợp hàng quý ​

Báo cáo nghiên cứu hàng năm ​

Các phương pháp luận đang được khám phá ​

Tại sao điều này quan trọng ​

Những hạn chế chúng tôi thừa nhận ​

Tài liệu tham khảo ​