Société Générale

Rejoignez l'équipe Société Générale!

PROFIL DE L’ENTREPRISE

Secteur : Banque de financement & d’investissement et Services financiers
Fondée en : 1974

PARTICIPER

Intéressé.e à résoudre des problèmes industriels concrets tout en développant une expérience de travail inouïe? Merci de remplir le formulaire de participation ci-dessous. Nous vérifierons votre admissibilité et vous fournirons le lien d’inscription plus tard.

DESCRIPTION DU PROBLÈME

Sélection de variables catégorielles dans la modélisation des risques

Dans les institutions financières, les caractéristiques catégorielles apparaissent assez souvent dans les ensembles de données de crédit et dans les modèles de conformité, par exemple, les caractéristiques liées au profil de risque des clients.

Les méthodes traditionnelles de sélection d’entités (par exemple, signification statistique, élimination d’entités récursives, LASSO) ne fonctionnent pas bien avec les entités catégorielles, car ces méthodes conservent certains niveaux en supprimant d’autres de la même entité. L’approche LASSO groupé s’est montrée plus stable en termes de sélection de variables mais présente des lacunes en termes de prévisibilité. Pour une caractéristique donnée, serait-il plus approprié de concevoir une méthode qui agrège ensemble certains niveaux avoisinants afin d’obtenir un espace de représentation des caractéristiques qui varie mieux avec la variable à prédire?

En raison des nombreuses façons de représenter les variables catégorielles et de sélectionner les variables importantes, nous nous demandons quelles sont les méthodes les plus appropriées pour améliorer la sélection des caractéristiques catégorielles ?

  • La Société Générale souhaite disposer d’un cadre de modélisation, basé sur la littérature, comparant les avantages et les inconvénients de plusieurs méthodes de sélection de variables différentes.
  • Elle aimerait aussi comparer les performances du modèle en fonction de leur ensemble de données.

Des données bancaires et de crédit anonymisées seront utilisées pour les besoins de l’exercice.

ÉQUIPE

Alejandro Murua
Professeur titulaire – Département de Mathématiques et de Statistique, Université de Montréal.

Adrian Gonzalez Sanchez
Chargé de cours, HEC Montréal et Université Concordia.

Helena Liu
Vice-présidente en charge de la validation des modèles, Société Générale.

Jiaxin Yang
Conseiller quantitatif, Société Générale.

Zouheir Malki
Conseiller aux partenariats, IVADO.

Nom:
Formation: