Ciência de Dados: A Lei de Newcomb-Benford e o poder dos números
Talvez você já tenha ouvido falar de proporção áurea ou alguma outra lei natural da matemática, mas já conhecia a lei de Newcomb-Benford? É uma das diversas leis matemáticas usadas por cientistas de dados, e é possível aplicá-la em praticamente qualquer coisa!
Mas, pra começar, senta que vem história... Em 1881, o matemático Simon Newcomb notou em um livro com tabelas de logaritmos (numa época onde ainda não existiam calculadoras) que as primeiras páginas estavam mais gastas que as últimas, fazendo-o perceber que os números começavam geralmente com 1, 2, 3... ou seja, os primeiros dígitos eram sempre os menores números. O físico Frank Benford futuramente, em 1938, quis estudar a fundo e analisou diversas coisas naturais, como pesos moleculares, contas de eletricidade, constantes físicas, preços de ações e entre outras fontes de dados, e acabou encontrando a mesma coisa: a frequência com que os números menores apareciam era maior que os números maiores.
Deu pra entender? Então, basicamente, qualquer fonte de dado que você possa analisar (a página de um jornal ou de um site, investimentos de uma empresa, e até mesmo os pixels de uma imagem) é possível encontrar a Lei de Newcomb-Benford. Mas há algumas exceções, como números sequenciais, números estipulados por humanos e dados com mínimo e máximo. Portanto, como é uma lei natural da matemática, nos anos 70 os economistas já começavam a utilizá-la para detecção de fraudes! E tudo isso apenas observando a frequência dos números, pois um fraudador os distribuiria de maneira mais uniforme, quebrando assim a naturalidade.
Nenhum comentário:
Postar um comentário