Metodología del Experimento Social

El marco

CashPop es un juego de Telegram. También es un experimento continuo, a escala planetaria y en tiempo real sobre coordinación humana, creencias focales, profundidad estratégica y propagación del conocimiento común. La estructura comercial del protocolo (financiado con publicidad, redistribución de tokens) es lo que hace que el experimento sea financieramente sostenible. El experimento, a su vez, es lo que convierte al protocolo en un bien común científico perdurable.

Esta página documenta qué medimos, cómo anonimizamos, qué publicamos y las alianzas académicas involucradas.

Variables observadas

Para cada Round (ronda), registramos:

Variable	Tipo	Resolución
ID del Round	entero	único
ID de la pregunta	entero	se asigna a una entrada del depósito público
Marca de tiempo de inicio del Round	UTC ms	exacta
Cantidad de participantes	entero	exacta
Conteo de Commits (compromisos) por bucket de ms de fase	arreglo	agrupado en intervalos de 1 segundo
Conteo de Reveals (revelaciones) por bucket de ms de fase	arreglo	agrupado en intervalos de 1 segundo
Resultado mayoritario		exacto
Proporción de votos	flotante	exacta
Descomposición demográfica	agregada	agrupada en ≥100 participantes por grupo

NO registramos:

Identidad individual de usuario en ningún nivel
Voto individual de usuario (solo proporciones agregadas)
Direcciones IP (solo código de país con agregación de >100 participantes)
Comportamiento entre Rounds de ningún usuario específico (cada usuario aparece como un token anónimo y no correlacionado en cada Round)

Protocolo de anonimización

Todos los datos publicados pasan por un piso de k-anonimato de k=100: ninguna celda de agregación contiene menos de 100 participantes. Las celdas por debajo de k se fusionan con celdas vecinas o se suprimen.

Para las descomposiciones demográficas (país, grupo etario, idioma), aplicamos privacidad diferencial con ε = 1.0: se añade un mecanismo de ruido de Laplace calibrado a cada conteo de celda.

Prueba criptográfica: el pipeline de anonimización es de código abierto (github.com/cashpop-protocol/data-pipeline), y un verificador externo puede verificar que el conjunto de datos publicado es consistente con las reglas de anonimización.

Lo que publicamos

Conjuntos de datos agregados trimestrales

Cada trimestre, publicamos:

Agregado a nivel de Round: estadísticas por Round (conteo, proporción, demografía) — anonimizado con k-anonimato.
Instantánea del depósito de preguntas: preguntas utilizadas, distribuciones de respuestas, estimaciones de punto focal.
Series temporales: DAU semanal, MAU mensual, conteo de Rounds, distribución del Prize Pool (fondo de premios).
Matriz de puntos focales entre países: por categoría de pregunta, la similitud coseno de las distribuciones de respuestas entre países.

Todos los conjuntos de datos: licencia CC-BY-4.0. Publicados en datasets.cashpop.meme.

Informes de investigación anuales

Cada año, el protocolo publica un informe de investigación de calidad revisada por pares. Nos hemos comprometido a:

Al menos un preprint trimestral dirigido a SSRN / arXiv (econ.GT, cs.GT).
Al menos un informe anual coautorado con un socio académico (objetivo: grupo de economía conductual de una universidad de investigación).
Un consejo de revisión de datos abiertos que incluya revisores académicos externos.

El primer informe de este tipo — que cubre el conjunto de datos del Q1 2027 — está previsto para su publicación en el Q2 2027.

Metodologías en exploración

Líneas de investigación activas (sujetas a revisión por pares):

Índice de divergencia de puntos focales transculturales. Una métrica de cuán específicos culturalmente son los puntos focales, en función del tipo de pregunta y la distancia cultural.
Estimación de mezcla de nivel-k a escala poblacional. Uso de datos de tiempo de Commit y respuesta a nivel de Round para estimar la distribución de nivel-k de una población.
Latencia de propagación del conocimiento común. ¿Qué tan rápido se propagan las creencias sobre las creencias a través de los grafos sociales de Telegram? Medible mediante la consistencia entre Rounds para baterías de preguntas sincronizadas.
Calibración de la sabiduría de las masas frente a la verdad fundamental. Para preguntas factuales, comparación de la mayoría de CashPop con la verdad fundamental verificada.
Heterogeneidad de la profundidad estratégica por estrato demográfico. ¿Son los seniors más de nivel-1, son los nativos cripto más de nivel-3? Empíricamente comprobable.
Revisión de creencias bajo choques informativos. Ejecutar baterías de preguntas antes y después de eventos noticiosos importantes; medir el cambio.

Por qué esto es importante

Tres razones:

Científica. Los experimentos de Beauty Contest (Concurso de Belleza) se han realizado con <200 sujetos en laboratorios controlados durante 30 años. CashPop ejecuta ~10,000 sujetos por Round, en condiciones de campo, entre culturas, con auditabilidad criptográfica. El apalancamiento empírico no tiene precedentes.
Cívica. Las estructuras de conocimiento común (Aumann, Rubinstein, Vives) sustentan todo, desde la microestructura del mercado hasta los resultados electorales. Una mejor medición de cómo se forma y disuelve el conocimiento común es un bien público.
Reputacional. La legitimidad a largo plazo del protocolo depende de su identidad como bien común de datos. CashPop no está extrayendo de los usuarios; está coproduciendo un recurso científico con ellos.

Limitaciones que reconocemos

Sesgo de selección. Los usuarios de CashPop no son una muestra representativa de la humanidad. Son usuarios de Telegram con curiosidad cripto y tiempo para jugar. Nuestros resultados se generalizan a esta población, no a la humanidad en su conjunto.
Contaminación por incentivos. Los jugadores reciben pago (en POP). Esto cambia el juego estratégico en comparación con los estudios de laboratorio sin incentivos. Documentamos y cuantificamos este efecto.
Sesgo del depósito de preguntas. El depósito es generado por LLM y se ha desesgado al mejor esfuerzo, pero persisten sesgos residuales. Publicamos el depósito abiertamente para que investigadores externos puedan reanalizarlo con su propio desesgado.

Referencias

Aumann, R.J. (1976). Agreeing to Disagree. Annals of Statistics 4(6).
Rubinstein, A. (1989). The Electronic Mail Game. AER 79.
Vives, X. (2008). Information and Learning in Markets. Princeton.
Surowiecki, J. (2004). The Wisdom of Crowds. Doubleday.
Galton, F. (1907). Vox Populi. Nature 75.

Metodología del Experimento Social ​

El marco ​

Variables observadas ​

Protocolo de anonimización ​

Lo que publicamos ​

Conjuntos de datos agregados trimestrales ​

Informes de investigación anuales ​

Metodologías en exploración ​

Por qué esto es importante ​

Limitaciones que reconocemos ​

Referencias ​