Metodología del Experimento Social
El marco
CashPop es un juego de Telegram. También es un experimento continuo, a escala planetaria y en tiempo real sobre coordinación humana, creencias focales, profundidad estratégica y propagación del conocimiento común. La estructura comercial del protocolo (financiado con publicidad, redistribución de tokens) es lo que hace que el experimento sea financieramente sostenible. El experimento, a su vez, es lo que convierte al protocolo en un bien común científico perdurable.
Esta página documenta qué medimos, cómo anonimizamos, qué publicamos y las alianzas académicas involucradas.
Variables observadas
Para cada Round (ronda), registramos:
| Variable | Tipo | Resolución |
|---|---|---|
| ID del Round | entero | único |
| ID de la pregunta | entero | se asigna a una entrada del depósito público |
| Marca de tiempo de inicio del Round | UTC ms | exacta |
| Cantidad de participantes | entero | exacta |
| Conteo de Commits (compromisos) por bucket de ms de fase | arreglo | agrupado en intervalos de 1 segundo |
| Conteo de Reveals (revelaciones) por bucket de ms de fase | arreglo | agrupado en intervalos de 1 segundo |
| Resultado mayoritario | exacto | |
| Proporción de votos | flotante | exacta |
| Descomposición demográfica | agregada | agrupada en ≥100 participantes por grupo |
NO registramos:
- Identidad individual de usuario en ningún nivel
- Voto individual de usuario (solo proporciones agregadas)
- Direcciones IP (solo código de país con agregación de >100 participantes)
- Comportamiento entre Rounds de ningún usuario específico (cada usuario aparece como un token anónimo y no correlacionado en cada Round)
Protocolo de anonimización
Todos los datos publicados pasan por un piso de k-anonimato de k=100: ninguna celda de agregación contiene menos de 100 participantes. Las celdas por debajo de k se fusionan con celdas vecinas o se suprimen.
Para las descomposiciones demográficas (país, grupo etario, idioma), aplicamos privacidad diferencial con ε = 1.0: se añade un mecanismo de ruido de Laplace calibrado a cada conteo de celda.
Prueba criptográfica: el pipeline de anonimización es de código abierto (github.com/cashpop-protocol/data-pipeline), y un verificador externo puede verificar que el conjunto de datos publicado es consistente con las reglas de anonimización.
Lo que publicamos
Conjuntos de datos agregados trimestrales
Cada trimestre, publicamos:
- Agregado a nivel de Round: estadísticas por Round (conteo, proporción, demografía) — anonimizado con k-anonimato.
- Instantánea del depósito de preguntas: preguntas utilizadas, distribuciones de respuestas, estimaciones de punto focal.
- Series temporales: DAU semanal, MAU mensual, conteo de Rounds, distribución del Prize Pool (fondo de premios).
- Matriz de puntos focales entre países: por categoría de pregunta, la similitud coseno de las distribuciones de respuestas entre países.
Todos los conjuntos de datos: licencia CC-BY-4.0. Publicados en datasets.cashpop.meme.
Informes de investigación anuales
Cada año, el protocolo publica un informe de investigación de calidad revisada por pares. Nos hemos comprometido a:
- Al menos un preprint trimestral dirigido a SSRN / arXiv (econ.GT, cs.GT).
- Al menos un informe anual coautorado con un socio académico (objetivo: grupo de economía conductual de una universidad de investigación).
- Un consejo de revisión de datos abiertos que incluya revisores académicos externos.
El primer informe de este tipo — que cubre el conjunto de datos del Q1 2027 — está previsto para su publicación en el Q2 2027.
Metodologías en exploración
Líneas de investigación activas (sujetas a revisión por pares):
- Índice de divergencia de puntos focales transculturales. Una métrica de cuán específicos culturalmente son los puntos focales, en función del tipo de pregunta y la distancia cultural.
- Estimación de mezcla de nivel-k a escala poblacional. Uso de datos de tiempo de Commit y respuesta a nivel de Round para estimar la distribución de nivel-k de una población.
- Latencia de propagación del conocimiento común. ¿Qué tan rápido se propagan las creencias sobre las creencias a través de los grafos sociales de Telegram? Medible mediante la consistencia entre Rounds para baterías de preguntas sincronizadas.
- Calibración de la sabiduría de las masas frente a la verdad fundamental. Para preguntas factuales, comparación de la mayoría de CashPop con la verdad fundamental verificada.
- Heterogeneidad de la profundidad estratégica por estrato demográfico. ¿Son los seniors más de nivel-1, son los nativos cripto más de nivel-3? Empíricamente comprobable.
- Revisión de creencias bajo choques informativos. Ejecutar baterías de preguntas antes y después de eventos noticiosos importantes; medir el cambio.
Por qué esto es importante
Tres razones:
Científica. Los experimentos de Beauty Contest (Concurso de Belleza) se han realizado con <200 sujetos en laboratorios controlados durante 30 años. CashPop ejecuta ~10,000 sujetos por Round, en condiciones de campo, entre culturas, con auditabilidad criptográfica. El apalancamiento empírico no tiene precedentes.
Cívica. Las estructuras de conocimiento común (Aumann, Rubinstein, Vives) sustentan todo, desde la microestructura del mercado hasta los resultados electorales. Una mejor medición de cómo se forma y disuelve el conocimiento común es un bien público.
Reputacional. La legitimidad a largo plazo del protocolo depende de su identidad como bien común de datos. CashPop no está extrayendo de los usuarios; está coproduciendo un recurso científico con ellos.
Limitaciones que reconocemos
- Sesgo de selección. Los usuarios de CashPop no son una muestra representativa de la humanidad. Son usuarios de Telegram con curiosidad cripto y tiempo para jugar. Nuestros resultados se generalizan a esta población, no a la humanidad en su conjunto.
- Contaminación por incentivos. Los jugadores reciben pago (en POP). Esto cambia el juego estratégico en comparación con los estudios de laboratorio sin incentivos. Documentamos y cuantificamos este efecto.
- Sesgo del depósito de preguntas. El depósito es generado por LLM y se ha desesgado al mejor esfuerzo, pero persisten sesgos residuales. Publicamos el depósito abiertamente para que investigadores externos puedan reanalizarlo con su propio desesgado.
Referencias
- Aumann, R.J. (1976). Agreeing to Disagree. Annals of Statistics 4(6).
- Rubinstein, A. (1989). The Electronic Mail Game. AER 79.
- Vives, X. (2008). Information and Learning in Markets. Princeton.
- Surowiecki, J. (2004). The Wisdom of Crowds. Doubleday.
- Galton, F. (1907). Vox Populi. Nature 75.