Titre | Machine learning et nouvelles sources de données pour le scoring de crédit | |
---|---|---|
Auteur | Christophe Hurlin, Christophe Pérignon | |
Revue | Revue d'économie financière | |
Numéro | no 135, 3eme trimestre 2019 Technologies et mutations de l'activité financière | |
Rubrique / Thématique | Technologies et mutations de l'activité financière |
|
Page | 21-50 | |
Résumé |
Dans cet article, nous proposons une réflexion sur l'apport des techniques d'apprentissage automatique (machine learning) et des nouvelles sources de données (new data) pour la modélisation du risque de crédit. Le scoring de crédit fut historiquement l'un des premiers champs d'application des techniques de machine learning. Aujourd'hui, ces techniques permettent d'exploiter de « nouvelles » données rendues disponibles par la digitalisation de la relation clientèle et les réseaux sociaux. La conjonction de l'émergence de nouvelles méthodologies et de nouvelles données a ainsi modifié de façon structurelle l'industrie du crédit et favorisé l'émergence de nouveaux acteurs. Premièrement, nous analysons l'apport des algorithmes de machine learning à un ensemble d'information constant. Nous montrons qu'il existe des gains de productivité liés à ces nouvelles approches, mais que les gains de prévision du risque de crédit restent en revanche modestes. Deuxièmement, nous évaluons l'apport de cette « datadiversité », que ces nouvelles données soient exploitées ou non par des techniques de machine learning. Il s'avère que certaines de ces données permettent de révéler des signaux faibles qui améliorent sensiblement la qualité de l'évaluation de la solvabilité des emprunteurs. Au niveau microéconomique, ces nouvelles approches favorisent l'inclusion financière et l'accès au crédit des emprunteurs les plus fragiles. Cependant, le machine learning appliqué à ces données peut aussi conduire à des biais et à des phénomènes de discrimination.
Classification JEL : C10, C38, C55, G21, G29. Source : Éditeur (via Cairn.info) |
|
Résumé anglais |
In this article, we discuss the contribution of machine learning techniques and new data sources (new data) to credit-risk modelling. Credit scoring was historically one of the first fields of application of machine learning techniques. Today, these techniques permit to exploit new sources of data made available by the digitalization of customer relationships and social networks. The combination of the emergence of new methodologies and new data has structurally changed the credit industry and favored the emergence of new players. First, we analyse the incremental contribution of machine learning techniques per se. We show that they lead to significant productivity gains but that the forecasting improvement remains modest. Second, we quantify the contribution of the "datadiversity", whether or not these new data are exploited through machine learning. It appears that some of these data contain weak signals that significantly improve the quality of the assessment of borrowers' creditworthiness. At the microeconomic level, these new approaches promote financial inclusion and access to credit for the most vulnerable borrowers. However, machine learning applied to these data can also lead to severe biases and discrimination.
Classification JEL : C10, C38, C55, G21, G29. Source : Éditeur (via Cairn.info) |
|
Article en ligne | http://www.cairn.info/article.php?ID_ARTICLE=ECOFI_135_0021 |