Parte de este texto fue escrito por Carlos F. Lira Gómez, MSc. en Ciencias Marinas, tomando varias referencias bibliográficas para su elaboración.
La ley de Benford es una ley matemática que describe la distribución de los dígitos en los números naturales. Esta ley fue descubierta por el físico estadounidense Frank Benford en 1938, y desde entonces ha sido ampliamente utilizada en varios campos, incluyendo la auditoría, la economía, la física y la estadística.
La ley de Benford afirma que en una serie de números naturales, el primer dígito 1 ocurre con más frecuencia que cualquier otro número, seguido por el 2 y así sucesivamente hasta el 9. De acuerdo con la ley de Benford, el primer dígito 1 ocurre con una frecuencia del aproximadamente el 30%, mientras que el número 9 ocurre con una frecuencia del aproximadamente el 4.6%.
Esta ley se aplica a una amplia gama de datos, desde el volumen de agua en los ríos hasta el número de accidentes de tráfico. Además, también se ha demostrado que la ley de Benford se aplica a los datos financieros, como los balances de las compañías y las estadísticas de los ingresos.
La ley de Benford es útil en la auditoría financiera, ya que permite a los auditores detectar patrones anómalos en los datos financieros. Por ejemplo, si los primeros dígitos de una serie de números no siguen la distribución esperada de la ley de Benford, es posible que haya algún tipo de manipulación o fraude.
Además, la ley de Benford también se utiliza en la investigación de datos, donde se puede utilizar para determinar la autenticidad de un conjunto de datos. Por ejemplo, si un conjunto de datos no sigue la distribución esperada de la ley de Benford, es posible que haya errores o falsificaciones en los datos.
En resumen, la ley de Benford es una ley matemática importante que se utiliza en una amplia gama de campos. Desde su descubrimiento en 1938, ha sido ampliamente utilizada para detectar patrones anómalos y autenticar datos en la auditoría financiera, la investigación de datos y otros campos.
Esta ley se puede aplicar para:
Detectar Fraudes Contables
Hal Varian en 1972 y Mark Nigrini en 1992, sugirieron que la ley podría usarse para la detección de posibles fraudes, de hecho fueron la tesis doctoral de Nigrini (1992) y las subsecuentes publicaciones de este profesor de contabilidad, las que popularizaron la ley de Benford.
Mark Nigrini combinó los trabajos de Charles Carslaw (1988) y Thomas J.K. (1989), sobre contabilidad creativa y el trabajo de Benford, para realizar su tesis doctoral acerca de la detección de evasión fiscal, mediante el análisis de distribuciones de dígitos.
Hoy en día muchas firmas contables y gobiernos en todo el mundo emplean la ley de Benford para detectar posibles fraudes contables y financieros.
Detectar fraudes electorales
El politólogo y estadístico Walter Mebane, fue el primero en utilizar la ley de Benford del segundo dígito (prueba 2BL), en la ciencia forense electoral para identificar posibles fraudes. Aunque los resultados de Mebane han sido criticados y tildados de engañosos por algunos investigadores, este autor aun considera que sus resultados son bastante fiables, aunque reconoce y acepta algunas estas las críticas.
La ley de Benford ha sido aplicada como prueba estadística para determinar la posible existencia de fraude electoral en las elecciones presidenciales de EE.UU. (2000 y 2004), Irán (2009), elecciones federales alemanas (2009), entre otras.
COVID- 19
El matemático Chase Marchand y el informático Dalton Maahs han publicado recientemente un artículo en la revista CHANCE, titulado “Ley de Benford y datos COVID-19”. En este artículo evalúan el potencial uso de los datos suministrados por los gobiernos, sobre las cifras del COVID-19, ante las muchas dudas acerca de sí dichos datos son fiables.
Marchand y Maahs determinaron con datos analizados de los EE.UU., del año 2020, que en ciertos casos (por ejemplo casos confirmados + casos probables, y muertes acumuladas confirmadas + probables), se ajustan perfectamente a la ley de Benford.
Además sugieren que mientras más datos son suministrados por los gobiernos, más y mejor se ajustan a la ley de Benford.
Conjunto de números que se ajustan a la ley de Benford
Después de que en el año 1992 se hiciese popular la ley de Benford, muchos matemáticos, ingenieros, estadísticos y entusiastas de las matemáticas, comenzaron a buscar coincidencias de conjuntos de números que se ajustaran o no a la misma, demostrando que los siguientes datos siguen el patrón predictivo:
Los tiempos de duración entre las notas musicales en una canción, crean un conjunto de datos que al ser analizados se ajustan muy bien a la curva de Benford.
Las estadísticas deportivas: goles, puntos, carreras, pases, cambios, patadas, faltas, entre otros.
Las estadísticas poblacionales.
El precio del mercado de valores.
Conjunto de números que no se ajustan a la ley de Benford
No todos los conjuntos de datos siguen la ley de Benford, ejemplo de ellos son:
Los números de teléfono de un área determinada, ya que el código de área es el mismo número.
Poblaciones con rangos definidos, por ejemplo de 300 a 800 habitantes.
La altura de los humanos adultos.
Números provenientes de distribuciones uniformes, por ejemplo las loterías.
Historia
Este patrón predecible de distribución de dígitos de números naturales, fue descubierto por primera vez por el astrónomo y matemático canadiense-estadounidense Simon Newcomb, y publicado en 1881 en el American Journal of Mathematics.
Newcomb durante el empleo de tablas de logaritmos, notó que las primeras páginas de la tabla que estaba utilizando estaban mucho más desgastadas que las últimas, fenómeno que se repetía en otras tablas logarítmicas.
Debido a esto, Newcomb dedujo que las personas utilizaban y consultaban en las tablas con mayor frecuencia el logaritmo de números que comienzan con dígitos pequeños, que el de los que empiezan por dígitos altos.
Así pues, los logaritmos de números que comienzan con 1 son buscados con más frecuencia que los que comienzan con 2, los números que comienzan con 2 son buscados con mayor frecuencia que los comienzan con 3, y así sucesivamente hasta los logaritmos de números que comienzan con 9, que son los menos buscados respecto a los otros números.
Sin embargo, el astrónomo no aportó una explicación matemática robusta a este hecho, por lo que su publicación fue tomada como una sencilla curiosidad matemática, que pronto fue olvidada por la comunidad.
Este fenómeno matemático permaneció olvidado, o mejor dicho sin ser analizado, hasta 1938 (57 años después), cuando el físico e ingeniero eléctrico estadounidense Frank Albert Benford Jr. lo redescubrió.
Frank Benford, trabajando para la General Electric Company notó el mismo patrón de desgaste en las hojas de las tablas logarítmicas que años antes había observado Newcomb, así que, emocionado con tal hallazgo probó y publicó sus resultados del análisis de 20 conjuntos de datos (algunos autores dicen que fueron 17 conjuntos de datos) completamente diferentes e independientes unos de otros, y por esta razón se le atribuyó el mérito del descubrimiento al bautizar la ley con su nombre.
Los conjuntos de datos analizados por Benford incluían la superficie de 335 ríos, el número de personas en 3.259 poblaciones de EE. UU., la tasa de mortalidad de 418 localidades, 5000 entradas de un manual de matemáticas, las direcciones de las primeras 342 personas enumeradas en American Men of Science, 104 constantes físicas, 1458 datos de la liga americana de beisbol, 1800 masas moleculares, entre otros.
Aunque Benford aportó numerosos datos para comprobar la universalidad de este fenómeno matemático, no fue capaz de explicar el por qué ocurría, ni por qué en muchos otros conjuntos de datos no ocurría lo mismo.
Fue en 1961 que el matemático estadounidense Roger Pinkham dio los primeros pasos para resolver los problemas que Benford y otros no pudieron.
Pinkham en su artículo titulado «Sobre la distribución de los primeros dígitos significativos», propuso el siguiente razonamiento: suponiendo que existe realmente una ley de frecuencias de dígitos, en tal caso, dicha ley debería ser completamente universal. Tanto si calculamos los precios en dólares, como en euros, colones o yenes, o si medimos la longitud en centímetros, pulgadas, metros o kilómetros, la frecuencia de aparición de los dígitos debería permanecer inalterada.
Así pues, Pinkham afirmó y demostró que la distribución de frecuencias de los dígitos es invariable frente a cambios de escala, por lo que concluyó que se estaba ante la presencia de una ley universal, a pesar de la existencia de opiniones adversas a este razonamiento.
Hasta la fecha han sido varios los autores que han contribuido al conocimiento de esta ley, entre los que destacan Ralph Raimi, Mark Nigrini, Theodore Hill, entre otros.
Utiliza Tableau Software para crear una representación gráfica de la ley de Benford en un conjunto de datos, en este particular caso, puedes utilizar el archivo de ejemplo de Superstore que se incluye con el software.
Para este proceso deberás hacer lo siguiente:
Crear campos calculados para utilizarlos en la vista.
Configurar la vista.
En las siguientes secciones se desglosan estos procedimientos en instrucciones específicas.
Crear campos calculados para utilizarlos en la vista
En el menú Análisis, seleccione Crear campo calculado para abrir el editor de cálculo. Asigne al cálculo el nombre <First Digit> y escriba o pegue lo siguiente en la sección de fórmulas: LEFT(STR([Sales]),1)
Cree un segundo campo calculado con el nombre <Benfords Law>. Escriba o pegue lo siguiente en la sección de fórmulas: LOG(INT([First Digit])+1)-LOG(INT([First Digit]))
Configurar la vista
En el panel Datos, arrastre <First Digit> a Columnas y, a continuación, arrastre Orders(Count) a Filas.
Haga clic en CNT(Orders) en Filas y seleccione Cálculo de tabla rápido > Porcentaje del total. En la vista ahora se muestra la distribución de los primeros dígitos, mientras que el tamaño de las barras (decreciente de izquierda a derecha) sugiere que, en este caso, los datos se ajustan a la ley de Benford. Pero podemos hacer más cosas para encuadrar los datos añadiendo distribuciones de referencia.
En el panel Datos, arrastre <Benfords Law> a Detalles en la tarjeta Marcas. Haga clic en <Benfords Law> en la tarjeta Marcas y seleccione Medida > Mínima.
Vaya del panel Datos al panel Análisis y arrastre Banda de distribución a la vista. Suéltelo en Celda.
En el cuadro de diálogo Editar línea de referencia, banda o cuadro, haga lo siguiente:
Haga clic en el campo Valor para ver un conjunto adicional de opciones:
En el área Porcentajes, escriba 80,100,120. Aquí se especifica que las bandas oscilarán entre el 80 y el 100 % y entre el 100 y el 120 %. Luego especificará a qué valor hacen referencia los porcentajes.
En el campo Porcentaje de, seleccione MIN(Benfords Law). En el campo Valor ahora debería aparecer 80%,100%,120% of Average Min. Benfords Law. En el resto de los pasos se configura la apariencia de las bandas de referencia.
Establezca Etiqueta en Ninguno.
Establezca Línea en la línea más delgada que haya disponible.
Seleccione Relleno inferior.
En Relleno, seleccione Semáforo.
Haga clic en Aceptar para cerrar el cuadro de diálogo Editar línea de referencia, banda o cuadro.
Haga clic en el botón de la barra de herramientas para mostrar las etiquetas de marca:
La vista acabada debería tener este aspecto:
Aunque la fuente de datos Superstore contiene datos de demostración, es realista, puesto que se ajusta a la ley de Benford. Las barras azules que indican los porcentajes reales de los dígitos iniciales se alinean muy bien con el valor 100 % (es decir, la línea que separa la zona verde de la zona amarilla en las bandas de distribución) que muestra los valores de Benford previstos en la vista.
¿Quieres conocer más?
Contáctanos para una demostración y una prueba gratuita