Sentinelle-Plateforme – Plateforme de Décision Risque & Fraude

Une plateforme orientée production pour la décision de crédit et de fraude en temps réel, avec auditabilité, explicabilité et supervision humaine (Conçu pour RGPD / AI Act).

1. Problème Métier

Les institutions financières doivent prendre des décisions de crédit et de fraude en temps réel tout en respectant des contraintes réglementaires strictes (RGPD, AI Act). Ce projet propose une plateforme de décision capable d'évaluer le risque de crédit et de fraude, d'expliquer ses décisions (SHAP), et de permettre une supervision humaine (Humain dans la boucle).

⏱️ Demo en 60 secondes

docker compose up --build
curl -X POST http://localhost:8000/decision -H "Content-Type: application/json" -d @examples/accept.json
open http://localhost:8000/docs
open http://localhost:5001
open http://localhost:3000

🎨 Aperçu Visuel

🖥️ Dashboard Sentinelle

Interface de décision pour les analystes (Risque & Fraude combinés)

📊 Monitoring ML (Grafana)

Suivi temps réel : Latence, Volume de décisions, et Dérive des données (Drift)

🧪 Tracking des modèles (MLflow)

Gestion du cycle de vie des modèles, versions et métriques d'entraînement

2. Fonctionnalités Clés (MVP)

Endpoint de décision unifié : POST /decision → ACCEPT / REVIEW / REJECT / ALERT
Piste d'audit : chaque décision est stockée avec horodatage, règle de politique et version du modèle
Pseudonymisation : les identifiants clients sont hashés avant stockage
Supervision humaine : revue manuelle et surcharge via POST /review/{decision_id}
Endpoint d'explication : GET /explain/{decision_id} (Le MVP renvoie un aperçu, vrai SHAP en Phase 2)

3. Stack Technique

API : FastAPI, Pydantic, SQLAlchemy
Moteur de Décision Hybride : Combine un score de risque (Régression Logistique) et un score de fraude (Isolation Forest - Non supervisé).
Explicabilité :
- SHAP Global (analyse offline, MLflow)
- SHAP Local (calcul temps réel via LinearExplainer)
Agent IA Générative : Un agent LLM analyse les résultats techniques pour générer un rapport narratif compréhensible par un humain.
MLOps Complet : Suivi des expérimentations avec MLflow, versioning des modèles.
Observabilité : Dashboard Grafana & Prometheus pour suivre la production et le drift des données.
DevOps & CI/CD : Déploiement via Docker Compose, Pipeline GitHub Actions pour les tests automatiques.
Base de données : SQLite (MVP) → PostgreSQL (production-ready)

4. Architecture

graph TD
    Client[App Client] -->|POST /decision| API[Gateway FastAPI]
    API -->|Score Risque & Fraude| ML[Service de Scoring (Modèles Risque Crédit + Fraude)]
    API -->|Vérification Règles| Policy[Moteur de Règles]
    API -->|Log Audit| DB[(SQLite/PostgreSQL)]
    API --> Decision[Décision : ACCEPT/REVIEW/REJECT/ALERT]
    Decision -->|Si REVIEW| Human[Réviseur Humain]
    Human -->|POST /review| API

5. Politique de Décision (Règles Métier)

Si fraud_score >= 0.85 → ALERT
Sinon si risk_score >= 0.70 → REJECT
Sinon si risk_score dans [0.45, 0.70) → REVIEW (human-in-the-loop)
Sinon → ACCEPT

Ces seuils sont configurables via des variables d'environnement.

6. Démarrage Rapide

cp .env.example .env
docker compose up --build

API : http://localhost:8000 OpenAPI (Swagger) : http://localhost:8000/docs ReDoc : http://localhost:8000/redoc

7. Endpoints & Exemples

Décision (`POST /decision`)

curl -X POST "http://localhost:8000/decision" \
  -H "Content-Type: application/json" \
  -d '{
    "client": {
      "client_id": "C123456",
      "age": 34,
      "income_annual": 45000,
      "employment_status": "CDI",
      "debt_to_income": 0.28,
      "credit_history_length_months": 72,
      "num_open_accounts": 3,
      "late_payments_12m": 0
    },
    "transaction": {
      "amount": 120.50,
      "merchant_category": "electronics",
      "country": "FR",
      "hour": 21,
      "is_new_device": true,
      "distance_from_home_km": 18.4
    }
  }'

Exemple de réponse

{
  "decision_id": "dcn_20260212_9f3a2c",
  "decision": "ACCEPT",
  "risk_score": 0.436,
  "fraud_score": 0.432,
  "policy_rule": "otherwise => ACCEPT",
  "model_versions": {
    "credit_risk": "credit_risk:logreg(seed=42, run_id=abc123)",
    "fraud": "fraud:isolation_forest(seed=42)"
  },
  "report_summary": "Décision ACCEPT..."
}

Explication (`GET /explain/{decision_id}`)

curl "http://localhost:8000/explain/dcn_..."

Revue Humaine (`POST /review/{decision_id}`)

curl -X POST "http://localhost:8000/review/dcn_..." \
  -H "Content-Type: application/json" \
  -d '{
    "human_decision": "APPROVE",
    "comment": "Identité client vérifiée par téléphone.",
    "reviewer_id": "agent_007"
  }'

8. Modèles & Métriques

✅ Risque de Crédit (Supervisé)

Régression Logistique (référence)
XGBoost (candidat)
Suivi MLflow activé
Sélection automatique du meilleur modèle (AUC + Rappel défaut)
Artefacts versionnés (model.joblib, metrics.json)

✅ Détection de Fraude (Anomalies)

Isolation Forest (contamination calibrée)
Normalisation des scores vers [0,1]
Évaluation via AUC & Average Precision
Artefacts versionnés

Métriques observées (synthetic data)

AUC Credit Risk ≈ > 0.85
Recall défaut ≈ > 0.70
AUC Fraud ≈ > 0.90 (synthetic benchmark)

Toutes les expériences sont visibles dans MLflow : http://localhost:5001

9. Explicabilité

Global : Importance des features (SHAP) disponible dans les notebooks MLflow.
Local : Top facteurs influençant chaque décision individuelle (calculé en temps réel via shap.LinearExplainer).
Chaque réponse API inclut une section explanations_preview détaillée.

10. Conformité (AI Act / RGPD)

Minimisation des données : pas d'identifiants directs stockés (pas de nom, adresse, etc.)
Pseudonymisation : les IDs clients sont hashés avant stockage
Auditabilité : décisions logguées avec règle de politique + version du modèle
Supervision humaine : les cas limites sont dirigés vers REVIEW + surcharge manuelle supportée.
Pas uniquement automatisé (Esprit RGPD Art.22) : les cas limites sont dirigés vers REVIEW pour supervision humaine.
Rétention (démo) : politique de rétention configurable pour les décisions stockées (prévu)

Voir :

docs/AI_COMPLIANCE.md
docs/MODEL_CARD.md
docs/DATA_SHEET.md

11. Tests & CI/CD

Le projet inclut une suite de tests unitaires et un pipeline CI/CD. Pour lancer les tests localement :

pytest api/tests

Le pipeline GitHub Actions se lance automatiquement à chaque push sur main.

📈 Observabilité & Monitoring (Senior++)

Infrastructure as Code (IaC) : La stack de monitoring est entièrement provisionnée par code (Docker, YAML, JSON), garantissant la reproductibilité.

1. Métriques Exposées (FastAPI + Prometheus)

Les métriques sont définies dans api/app/services/monitoring.py et exposées sur /metrics.

Métrique	Type	Description
`decision_total_count_total`	Counter	Nombre de décisions par type (`ACCEPT`, `REJECT`...) et règle.
`model_inference_seconds`	Histogram	Latence pure du modèle ML (hors réseau/DB).
`risk_score_distribution`	Histogram	Distribution des scores pour détecter le drift de sortie.
`model_drift_warning`	Gauge	Alerte binaire (0/1) si les entrées dévient de la baseline.

2. Requêtes PromQL (Exemples)

Taux de décisions par seconde sur 1 minute :

sum(rate(decision_total_count_total[1m])) by (decision)

Latence p95 (95ème centile) :

histogram_quantile(0.95, sum(rate(model_inference_seconds_bucket[5m])) by (le))

3. Dashboard Grafana

Accessible sur http://localhost:3000 (admin/admin). Le dashboard est provisionné automatiquement via monitoring/grafana/provisioning.

📚 Documentation

12. Données & Avertissement

Ceci est un projet de démonstration utilisant des données publiques ou synthétiques. Il n'est pas destiné à prendre de vraies décisions de crédit sans validation, gouvernance et revue réglementaire appropriées.

Name		Name	Last commit message	Last commit date
Latest commit History 16 Commits
.github/workflows		.github/workflows
agent		agent
api		api
docs		docs
examples		examples
ml		ml
mlflow/artifacts/81306944a2ac412383e1cc9e55e6f9d1/artifacts		mlflow/artifacts/81306944a2ac412383e1cc9e55e6f9d1/artifacts
monitoring		monitoring
.env		.env
.env.example		.env.example
.gitignore		.gitignore
README.md		README.md
docker-compose.yml		docker-compose.yml

Folders and files

Latest commit

History

Repository files navigation

Sentinelle-Plateforme – Plateforme de Décision Risque & Fraude

1. Problème Métier

⏱️ Demo en 60 secondes

🎨 Aperçu Visuel

🖥️ Dashboard Sentinelle

📊 Monitoring ML (Grafana)

🧪 Tracking des modèles (MLflow)

2. Fonctionnalités Clés (MVP)

3. Stack Technique

4. Architecture

5. Politique de Décision (Règles Métier)

6. Démarrage Rapide

7. Endpoints & Exemples

Décision (POST /decision)

Explication (GET /explain/{decision_id})

Revue Humaine (POST /review/{decision_id})

8. Modèles & Métriques

✅ Risque de Crédit (Supervisé)

✅ Détection de Fraude (Anomalies)

Métriques observées (synthetic data)

9. Explicabilité

10. Conformité (AI Act / RGPD)

11. Tests & CI/CD

📈 Observabilité & Monitoring (Senior++)

1. Métriques Exposées (FastAPI + Prometheus)

2. Requêtes PromQL (Exemples)

3. Dashboard Grafana

📚 Documentation

12. Données & Avertissement

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Décision (`POST /decision`)

Explication (`GET /explain/{decision_id}`)

Revue Humaine (`POST /review/{decision_id}`)

Packages