Stack Overflow, la popular plataforma social de preguntas y respuestas para desarrolladores, gastó el pasado 1 de abril una ingeniosa 'inocentada' con ocasión del 'April's Fools: cada vez que un usuario intentaba copiar código colgado en la plataforma, se mostraba un mensaje avisando de que ya no le quedaban "copia/pegas gratuitos", y animándole a obtener una clave para solventarlo.
Pero mientras preparaban esta broma, se dieron cuenta de que, si podían detectar cuándo alguien intentaba copiar código desde una de sus páginas, también podrían elaborar estadísticas que mostrasen qué códigos eran los más copiados.
Así, desarrollaron una herramienta de seguimiento web de cosecha propia, creando eventos personalizados para monitorizar cuándo uno de los usuarios del sitio copiaba texto del mismo. Dichos eventos permitían recopilar datos como si el texto procedía de preguntas, de respuestas o de comentarios, de un bloque de código o de texto normal, o conocer la reputación del 'copiador'.
Luego, procedieron a recopilar esos datos durante dos semanas enteras, entre el 26 de marzo y el 9 de abril, período en que se realizaron 40.623.987 copias. Y así descubrieron algunos datos curiosos (y otros, claro, bastante esperables):
La mayoría de los copypastes proceden de usuarios anónimos (un 86%): a medida que sube la 'reputación' del usuario en el sitio, menor es el conteo de copias de código.
Los copypastes se llevaban a cabo con mayor frecuencia en días y horario laboral.
Uno de cada cuatro usuarios que visitaban alguna pregunta de Stack Overflow copiaban un fragmento de código a los cinco minutos de llegar a la web.
Curiosamente, la mayoría (el 52,4%) de las copias proceden de respuestas no aceptadas, aunque las aceptadas cosechan una mayor tasa de copias por publicación.
A la hora de comprobar las etiquetas que originan más copypastes, nos encontramos con el siguiente ranking:
1. |html|css|
2. |javascript|
3. |python|
4. |python|pandas|
5. |javascript|jquery|
6. |python|pandas|dataframe|
7. |python|matplotlib|
8. |git|
9. |php|
10. |jquery|
¿Cuáles son las publicaciones más copiadas?
Bloque de código de una respuesta: "Con una puntuación de publicación de 3.497 y 11.829 copias, me complace anunciar que 'How to iterate over rows in a DataFrame in Pandas' recibió la mayor cantidad de copias. Respondida en 2013, esta pregunta sigue ayudando a miles de personas cada semana".
Texto sin formato de una respuesta: "En cuanto a la respuesta más copiada con texto sin formato, tenemos 'TypeError: this.getOptions is not a function [closed]' con una puntuación de publicación de 218 y 1.570 copias totales. Aunque no pudimos confirmarlo, sospechamos que lo que se está copiando es el 'sass-loader@10.1.1'".
Bloque de código de una pregunta: "Y la pregunta más copiada con una puntuación de publicación de 2.147 y 3.665 copias, tenemos 'How to create an HTML button that acts like a link'".
Opmerkingen