Lutte contre la fraude : les promesses de l’analyse de la data

Juin 14, 2021 | Secteur Public

Prestations sociales, fiscalité, banque, assurance, e-commerce…aucun secteur n’est épargné par la fraude. Un phénomène encore accentué par la révolution digitale, la profusion des usages numériques et l’obsolescence de certaines architectures de système d’information.

Ce sont ainsi des milliards d’euros qui s’envolent chaque année pour l’administration et les entreprises au profit de fraudeurs aux méthodes de plus en plus sophistiquées.

Pour mettre un frein à la fraude, un des leviers majeurs consiste à mieux exploiter les données transactionnelles, une approche non seulement assez fiable à ce jour, mais aussi pleine de promesses d’efficacité.

Nouveau call-to-action

Détection de fraude : renforcer les moyens humains par des solutions améliorant le score de risque

Près d’un demi-milliard d’euros de fraude identifiée en IARD en 2018 [1] et 1,182 milliard d’euros de fraude aux transactions scripturales en 2019 [2]  : rien que dans les domaines de l’assurance et de la banque, les chiffres sont éloquents.

Dès lors que surgit la possibilité d’un avantage concurrentiel ou financier, la fraude se fait universelle. Et c’est sans compter la fraude à l’impôt sur les sociétés et à l’impôt sur le revenu que l’Etat et la Cour des comptes peinaient encore à estimer, ou la fraude sociale estimée entre 14 et 45 milliards d’euros par an, une fourchette aussi vaste qu’imprécise.

Si la fraude tend à croître au rythme de la multiplication des données engendrées par le tout numérique, la data elle-même est néanmoins au cœur de la solution.

Sa collecte, son traitement, et son exploitation permettent en effet une lutte efficace contre la fraude, grâce à sa détection par des automates, a posteriori, ou dans l’idéal, a priori. En tout état de cause, face à des volumes exponentiels de données, la recherche de fraude par l’humain semble peu réaliste ou efficiente.

Pour autant, toute intervention humaine n’est pas encore complètement écartée du processus. Pour des sujets sensibles, comme le terrorisme ou la lutte anti-blanchiment, il est important de conserver un double degré de vérification : détection par la machine puis confirmation par l’humain.

Dans le secteur privé, cette double vérification est effectuée selon des critères de risque et de rentabilité, et n’est par conséquent en rien systématique. Quoi qu’il en soit, la tendance de demain sera au « 0 manuel » : à la clef, gain de temps et de productivité, détection en temps réel, ainsi que fiabilité des résultats par l’effet d’autoapprentissage de la machine.

Vers la réduction des faux positifs

Détecter la fraude au moyen du Machine Learning et du Big Data, c’est avoir pour finalité le repérage de comportements atypiques et l’établissement d’un score de risque. Toujours est-il que ces comportements atypiques, pratiques inhabituelles, peuvent être identifiés par la machine en tant que fraudes alors qu’il n’en sont pas.

Et c’est là l’un des principaux problèmes de la détection de la fraude par les automates et l’intelligence artificielle (IA) : la survenue de faux positifs. Ces derniers nuisent en effet à la fiabilité de la détection, ce qui requiert à nouveau de la part des entreprises et des administrations de mettre en place une étape de vérification humaine.

Seule solution pour réduire ou éradiquer les faux positifs : prendre en compte la dimension « temps » des comportements atypiques. Ainsi, un comportement atypique récurrent ne constituera pas une difficulté insurmontable en matière d’identification.

Face à la répétition de ce type de comportement, la machine, autoapprenante, sera à l’avenir capable de déceler s’il s’agit d’une fraude ou d’un faux positif. Devant un comportement atypique non récurrent cependant, il manquera à la machine la profondeur de données nécessaires à son autoapprentissage et donc à une détection correcte de la fraude.

Seule solution : gagner en finesse dans l’analyse des données et en puissance de calcul.

 

L’enrichissement de données, facteur de fiabilité

Le succès de la détection de la fraude repose principalement sur la pertinence de l’algorithme ou de la suite d’algorithmes utilisés, la profondeur des données manipulées, et sur la puissance de calcul à disposition.

Dans ce contexte, comment gagner à l’avenir en finesse d’analyse ? Par l’enrichissement de données. Croiser un nombre de données supérieur, aux sources diverses, permettra nécessairement d’obtenir un scoring de risque plus juste et une détection de la fraude optimisée.

Pour preuve, la récente circulaire envoyée par le gouvernement aux administrations en vue de mettre en œuvre une politique « open data » . Avec la promulgation de la loi de finances de 2020, l’Etat avait déjà franchi un pas concernant l’enrichissement de données comme moyen d’optimisation de la lutte contre la fraude : ce texte autorise les administrations fiscales et douanières à collecter les données personnelles disponibles sur Internet (réseaux sociaux notamment), et à les exploiter dans un objectif d’identification de fraudes.

> À LIRE AUSSI : Marchés Publics : les enjeux de la data en 2021

 

Les apports de l’IA et de la biométrie

En matière de repérage de la fraude, le Machine Learning est la technologie dominante. Il ne fait aucun doute que l’ajout d’une couche d’intelligence artificielle permettrait d’obtenir des calculs plus nuancés, une analyse plus fine de la donnée, et par conséquent une détection plus poussée de la fraude.

Aujourd’hui, nous sommes limités par l’existence des faux positifs et par la faiblesse des calculs qui empêchent de multiplier les corrélations. Avec l’IA, il serait possible de référencer de nouveaux types d’atypismes, c’est-à-dire d’alimenter les référentiels de fraudes existants par de nouveaux modèles. Attention, l’ajout de technologies ne saurait se substituer à une suite d’algorithmes pertinente, à une profondeur de données suffisante, ou encore à l’expérience des professionnels chargés de mettre en place les moyens de détection de la fraude.

Autre technologie prometteuse et déjà employée par l’Etat et le secteur privé : la biométrie. Quel moyen plus efficace pour lutter contre la fraude que de l’empêcher ? L’utilisation d’informations d’identification unique (empreinte digitale, reconnaissance faciale) couplées à un ou plusieurs mots de passe pourrait certainement donner un coup de frein à la progression des fraudeurs, et ce sur tous les terrains.

Envisageons par exemple l’arrivée de la signature biométrique dans les contrats de banque ou d’assurance, ou une application étendue de la biométrie dans le domaine de la Sécurité sociale. Mais encore faudrait-il que les entreprises et les administrations aient les moyens et la volonté d’assumer le coût de stockage considérable que représentent ces informations ultra-personnelles.

 

[1] Selon l’Agence de Lutte contre la Fraude à l’Assurance
https://www.alfa.asso.fr/fraude-a-lassurance/#chiffres-cles

[2] Selon le rapport 2019 de l’Observatoire de la sécurité des moyens de paiement (p. 18)
https://www.banque-france.fr/sites/default/files/medias/documents/820124_osmp2019_web_vf.pdf

 

La rédaction vous conseille

> L’intelligence de la donnée au service de la modernisation de l’Etat

> Transformation du secteur public : les enjeux du traitement des données

 

Livre Blanc

Mise en œuvre d'une stratégie 
de qualité des données 

Livre Blanc

Feuille de route d'une stratégie
de Data Management 

Baromètre annuel de la data

Les priorités des décideurs
data en 2022 

Share This

Fatal error: Uncaught TypeError: str_replace(): Argument #3 ($subject) must be of type array|string, null given in /home/clients/eb2ede746a0eeb48b74c26b6903bdcc1/sites/datavalue-consulting.com/wp-content/plugins/wp-rocket/inc/Engine/Optimization/RegexTrait.php:151 Stack trace: #0 /home/clients/eb2ede746a0eeb48b74c26b6903bdcc1/sites/datavalue-consulting.com/wp-content/plugins/wp-rocket/inc/Engine/Optimization/RegexTrait.php(151): str_replace(Array, Array, NULL) #1 /home/clients/eb2ede746a0eeb48b74c26b6903bdcc1/sites/datavalue-consulting.com/wp-content/plugins/wp-rocket/inc/Engine/Media/AboveTheFold/Frontend/Controller.php(170): WP_Rocket\Engine\Media\AboveTheFold\Frontend\Controller->restore_html_comments(NULL) #2 /home/clients/eb2ede746a0eeb48b74c26b6903bdcc1/sites/datavalue-consulting.com/wp-content/plugins/wp-rocket/inc/Engine/Media/AboveTheFold/Frontend/Controller.php(97): WP_Rocket\Engine\Media\AboveTheFold\Frontend\Controller->set_fetchpriority(Object(stdClass), NULL) #3 /home/clients/eb2ede746a0eeb48b74c26b6903bdcc1/sites/datavalue-consulting.com/wp-content/plugins/wp-rocket/inc/Engine/Media/AboveTheFold/Frontend/Controller.php(64): WP_Rocket\Engine\Media\AboveTheFold\Frontend\Controller->preload_lcp('<!DOCTYPE html>...', Object(WP_Rocket\Engine\Media\AboveTheFold\Database\Rows\AboveTheFold)) #4 /home/clients/eb2ede746a0eeb48b74c26b6903bdcc1/sites/datavalue-consulting.com/wp-content/plugins/wp-rocket/inc/Engine/Common/PerformanceHints/Frontend/Processor.php(69): WP_Rocket\Engine\Media\AboveTheFold\Frontend\Controller->optimize('<!DOCTYPE html>...', Object(WP_Rocket\Engine\Media\AboveTheFold\Database\Rows\AboveTheFold)) #5 /home/clients/eb2ede746a0eeb48b74c26b6903bdcc1/sites/datavalue-consulting.com/wp-content/plugins/wp-rocket/inc/Engine/Common/PerformanceHints/Frontend/Subscriber.php(47): WP_Rocket\Engine\Common\PerformanceHints\Frontend\Processor->maybe_apply_optimizations('<!DOCTYPE html>...') #6 /home/clients/eb2ede746a0eeb48b74c26b6903bdcc1/sites/datavalue-consulting.com/wp-includes/class-wp-hook.php(324): WP_Rocket\Engine\Common\PerformanceHints\Frontend\Subscriber->maybe_apply_optimizations('<!DOCTYPE html>...') #7 /home/clients/eb2ede746a0eeb48b74c26b6903bdcc1/sites/datavalue-consulting.com/wp-includes/plugin.php(205): WP_Hook->apply_filters('<!DOCTYPE html>...', Array) #8 /home/clients/eb2ede746a0eeb48b74c26b6903bdcc1/sites/datavalue-consulting.com/wp-content/plugins/wp-rocket/inc/Engine/Optimization/Buffer/Optimization.php(100): apply_filters('rocket_buffer', '<!DOCTYPE html>...') #9 [internal function]: WP_Rocket\Engine\Optimization\Buffer\Optimization->maybe_process_buffer('<!DOCTYPE html>...', 9) #10 /home/clients/eb2ede746a0eeb48b74c26b6903bdcc1/sites/datavalue-consulting.com/wp-content/themes/Divi-Child-Theme/functions.php(31): ob_end_flush() #11 /home/clients/eb2ede746a0eeb48b74c26b6903bdcc1/sites/datavalue-consulting.com/wp-includes/class-wp-hook.php(324): {closure}('') #12 /home/clients/eb2ede746a0eeb48b74c26b6903bdcc1/sites/datavalue-consulting.com/wp-includes/class-wp-hook.php(348): WP_Hook->apply_filters(NULL, Array) #13 /home/clients/eb2ede746a0eeb48b74c26b6903bdcc1/sites/datavalue-consulting.com/wp-includes/plugin.php(517): WP_Hook->do_action(Array) #14 /home/clients/eb2ede746a0eeb48b74c26b6903bdcc1/sites/datavalue-consulting.com/wp-includes/load.php(1280): do_action('shutdown') #15 [internal function]: shutdown_action_hook() #16 {main} thrown in /home/clients/eb2ede746a0eeb48b74c26b6903bdcc1/sites/datavalue-consulting.com/wp-content/plugins/wp-rocket/inc/Engine/Optimization/RegexTrait.php on line 151