Banque nationale du Canada

Rejoignez l'équipe Banque nationale du Canada !

PROFIL DE L’ENTREPRISE

Secteur : Banque
Fondée en : 1859

PARTICIPER

Intéressé.e à résoudre des problèmes industriels concrets tout en développant une expérience de travail inouïe? Merci de remplir le formulaire de participation ci-dessous. Nous vérifierons votre admissibilité et vous fournirons le lien d’inscription plus tard.

DESCRIPTION DU PROBLÈME

Anonymisation de données

La sécurité et la confidentialité des données est aujourd’hui au cœur des préoccupations des organisations. L’enjeu est de trouver un compromis entre la valorisation des données et le risque d’utiliser des données personnelles pour des projets analytiques et d’intelligence artificielle.

La gouvernance des données partage la responsabilité avec d’autres équipes, notamment les experts en cybersécurité, de mettre en place des mesures nécessaires pour garder un contrôle granulaire sur les droits d’accès de chaque employé. Par exemple, elle définit des niveaux d’accès par rôle directement sur les données. Cependant, la mise en place de ces mesures et des processus qui en découlent restreint l’accès aux données, et ce, quelle que soit l’utilisation qu’on veut en faire. Cette approche atteint aussi ses limites lorsqu’on souhaite donner des accès partiels à des bases de données, car les risques d’inférence et de re-identification augmentent.

Des alternatives existent et constituent des domaines de recherche très actifs. Elles peuvent être regroupées en trois catégories (non disjointes) :

  • Techniques d’anonymisation de données (p. ex. : “k-anonymisation”) visant à rendre moins sensible les données d’origine.
  • Analyses conçues pour conserver la confidentialité des données (p. ex.: “Differential Privacy”). On utilise les données d’origine et on désensibilise les calculs sur les données.
  • Modèles génératifs de données synthétiques.

Ces approches introduisent le concept de mesure de confidentialité et donc une quantité associable au risque des données.

Compte tenu de leurs avantages et inconvénients inhérents quelle(s) approche(s) faudrait-il favoriser pour optimiser le compromis entre le risque de confidentialité et la valorisation des données?

La Banque Nationale est actuellement en train de bâtir une plateforme d’anonymisation des données. Son objectif serait d’identifier les approches avec le meilleur potentiel et développer un prototype de solution, selon la catégorie d’approche choisie, sur un ensemble de données et de cas pratiques fournis par la Banque.

La BNC va fournir des données structurées simulées de transactions de cartes de crédit.

ÉQUIPE

Gilles Caporossi
Professeur titulaire et directeur – Département de sciences de la décision, HEC Montréal.

Sébastien Gambs
Professeur adjoint – Département d’informatique, Université du Québec à Montréal.

Julien Crowe
Leader, Intelligence artificielle, Technologies de l’information, Banque nationale du Canada.

Mehdi Taobane
Conseiller aux partenariats, IVADO.

Guy Bertrand
Travailleur autonome.

Stéphane Gazaille
Chercheur en Traitement du langage naturel (NLP), Croesus.

Simon Kassab
Baccalauréat en Génie informatique, Université de Sherbrooke.

Baksheesh Kaur
Baccalauréat en Informatique, Université d’Alberta.

Elnaz Karimian Sichani
Doctorat en Mathématiques & Statistiques, Université d’Ottawa.

Leila Vanessa Nombo
Doctorat en Mathématiques & Statistiques, Université Laval.