Modelos de decisão para deteção de fraudes
Redes neuronais artificias, árvores de decisão, redes Bayesianas e máquinas de vetores de suporte são métodos que têm sido aplicados, a fim de detectar demonstrações financeiras fraudulentas.[1]
Mineração de dados e fraude financeira
Mineração de dados é uma ferramenta essencial para analisar e classificar bancos de dados complexos. A mineração de dados auxilia na identificação de eventos importantes que possam estar escondidos em análises de grandes quantidades de dados, sendo possível resumir os dados em um modelo estruturado para fornecer uma referência para a tomada de decisão. Mineração de dados possui muitas funções diferentes, tais como classificação, associação, clustering e previsão. Demonstrações financeiras fraudulentas pode ser visto como um problema de classificação.[1]
O problema de classificação envolve cálculo com uso das características das variáveis de alguns dados de classificação conhecidos, a fim de obter classificação - regras de classificação relacionadas. Os dados desconhecidos de classificação são introduzidos nas regras a fim de obter os resultados da classificação final. Quanto à questão das demonstrações financeiras fraudulentas, grande parte das investigações anteriores propuseram o uso do método de mineração de dados devido à sua superioridade em termos de previsão após a introdução de grandes quantidades de dados para a aprendizagem automática, bem como a sua precisão em termos da classificação e previsão, que é muito maior do que a análise de regressão convencional.[1]
Estudo de Taiwan de 2016 realizado por Chen, S. sobre fraudes em relatórios financeiros argumenta que estudos de investigação anteriores não são suficientes nem completos por usarem somente 1 a 2 métodos estatísticos, não possuírem modelos de comparação, sendo que a maioria usa tratamento estatístico one-stage, a fim de estabelecer o modelo de detecção, o que não seria prudente. O mesmo estudo propõe então um modelo melhor para detectar potenciais demonstrações financeiras fraudulentas, de modo que as perdas sofridas pelos investidores e causadas por auditores poderia ser reduzida, a) tratamento estatístico de dois estágios; b) cinco técnicas de mineração de dados para criar o modelo de detecção para comparação de precisão do modelo; c) validação cruzada ten-fold (divisão do conjunto total de dados em 10 subconjuntos mutuamente exclusivos de mesmo tamanho) que com o objetivo de ser prudente e é comumente usado no campo acadêmico. Tal estudo estabelece modelos de classificação para fins de comparação através da combinação de árvores de classificação e regressão, Chi squared automatic interaction detector - CHAID, redes Bayesianas, máquinas de vetores de suporte, e redes neuronais artificiais.[1]
Referências Bibliográficas