Sami-CrediScore
Risk Analytics Platform
Modélisation

Comparaison des trois modèles

Performances mesurées sur l'échantillon de test (61 503 observations, partition stratifiée 80/20).

Métriques sur l'échantillon de test

ModèleAUC-ROCAccuracyPrecisionRecallF1-score
Régression logistique0,73890,67980,15650,67570,2541
Random Forest0,73840,70690,16310,63670,2596
XGBoostBest0,75580,72660,17440,63890,2740
Aire sous la courbe — pouvoir discriminant

Courbes ROC superposées

Top 10 variables — modèle XGBoost

Importance globale SHAP

61 503 observations · seuil 0,5

Matrices de confusion (échantillon test)

Logit
VP
3 357
FN
1 611
FP
18 077
VN
38 458
Random Forest
VP
3 163
FN
1 805
FP
16 221
VN
40 314
XGBoost
VP
3 175
FN
1 793
FP
14 998
VN
41 537
Ajustement interactif du seuil

Arbitrage Precision / Recall — XGBoost

Un seuil bas privilégie la détection (recall) au prix de plus de faux positifs ; un seuil haut accroît la précision mais laisse passer plus de défauts.

Precision
40,0%
Recall
60,0%
F1-score
48,0%
Accuracy
75,0%