Un estudiante llamado Jan Strehmel decidió dedicar su tesis a analizar la relación entre la calidad del código abierto y la aparición en él de palabrotas y términos malsonantes. Tan intrascendente investigación demostraría de una vez por todas si incluir improperios en los comentarios del código (o en los nombres de variables) tiene alguna relación con su calidad. El resultado fue que el código que contiene palabrotas tiene una calidad objetivamente superior, aunque no puede inferirse una causa-efecto directo, pero ya el dato da algunas pistas sobre lo que sucede.
¿Cómo se hace un análisis de este tipo? En total se revisaron 11.400 proyectos de código abierto escritos en C disponibles en Github. Utilizando diccionarios se vio que unos 3.800 contenían palabras malsonantes Para medir la calidad del código se utilizó SoftWipe, que es un software bastante conocido para comprobar si el código cumple con ciertos estándares y convenciones de codificación, en una escala de 0 a 10. Los repositorios que contenían palabrotas obtuvieron una nota de 5,87 de promedio; el resto, solo un 5,41.
Es divertido ver cómo la gente incluye palabrotas en expresiones de todo tipo y variantes: «fuck» (joder), que es obviamente una de las más repetidas, aparece como Fuck, whatTheFuck, this_Fuck_ing0ddity, WHAT_THE_FUCK, FUCK_MY-badExamples y similares. El software filtra ese código con una expresión regular intentando pillarlas todas. En la tesis se explican los tests estadísticos realizados respecto a todos los palabros, incluyendo histogramas y gráficos.
Strehmel considera que una posible explicación para este fenómeno es que usar palabrotas en el código «implica una mayor implicación emocional». Como detalle, descubrió que aunque la diferencia en las puntuaciones de código-con-tacos y código-sin-tacos es pequeña, el uso de ciertas palabrotas se concentra en los repositorios de alta calidad. Puestos a plantear posibles explicaciones, sugiere que dedicarle improperios al código o a otros programadores sirve para aliviar el estrés y, por ende, a programar mejor.
La tesis completa de Jan Strehmel tiene más de 45 páginas y puede leerse aquí: Is there a Correlation between the Use of Swearwords and Code Quality in Open Source Code? Si alguna vez te ha intrigado el tema o te has preguntado el porqué de esas palabrotas, igual esta explicación sacia tu curiosidad.