Description
Identification de la fonction
Titre de la fonction : Senior Data Engineer
Département : Département de l’Information Médicale
Service : Groupe Exploitation des données
Titre du responsable hiérarchique : Manager de l’Exploitation des eHealth Data
Titre de l’évaluateur : Chief Medical Information Officer
Contexte de la mission
En tant qu’Hôpital académique de l’UCLouvain, les Cliniques universitaires Saint-Luc ont pour pour mission d’offrir des soins de qualité aux patients, de former les meilleurs professionnels de santé et de mener des programmes de recherche clinique de pointe. En 2020, les Cliniques se sont dotées d’une solution de dossiers patients informatisés base sur EPIC® qui révolutionne les pratiques cliniques.
Actuellement, dans le cadre de l’espace européen des données de santé (European Health Data Space), elles mettent en place une infrastructure et des outils nécessaires, y compris des outils basés sur l’intelligence artificielle, pour l’exploitation des données de santé dans des buts de recherche et d’amélioration continue des soins. Ce faisant, elles portent avec une attention particulière à la sécurité des données, au respect de la règlementation général de la protection des données (RGPD) et à la réglementation concernant l’intelligence artificielle (AI Act). Pour ce faire, les Cliniques participent à des projets collaboratifs avec d’autres hôpitaux belges et européens, ainsi qu’avec des centres de recherches académiques. En effet, il est essentiel de rendre les systèmes d’exploitation de données interopérables entre institutions afin du supporter des recherches au niveau national, européen, voire international.
Rôle
En tant qu’ingénieur d’exploitation de données dans un hôpital académique, vous travaillez sous la responsabilité du Manager Exploitation des eHealth Data, lui-même sous la responsabilité de la Chief Medical Information Officer (CMIO). Vous travaillez en étroite collaboration avec les coordinateurs de projets, l’équipe IT infrastructure, les utilisateurs (chercheurs, médecins, paramédicaux, scientifiques, …) et les partenaires externes.
Conception
- Conception de l’architecture de l’environnement de recherche (bases de données, programmes basés sur l’Intelligence Artificielle, outils d’analyse fédérée/federated learning), en collaboration avec l’IT et le manager Exploitation eHealth Data, tout en comprenant l’architecture réseau, l’organisation des bases de données existantes, les besoins des utilisateurs, les besoins d’évolution continue, les impératifs de sécurité et cybersécurité
- Nécessité de se former au modèle des donnes EPIC®
- Conception des algorithmes d’extraction, transformation et chargement (ETL) afin de transformer les données de santé locales dans des modèles communs (ex. OMOP CDM), ou dans un data lake sécurisé, en collaboration avec les data scientists internes et les collaborateurs externes
- Conception de catalogues de données
Mise en œuvre et maintenance
- Installer, configurer et maintenir, sur des serveurs, avec un système Docker ou non,
- des systèmes de gestion de bases de données (SGBD), tels que PostGre SQL, MySQL, Oracle, SQL Server, etc.
- des plateformes d’analyse fédérée comme Vantage6
- des programmes basés sur l’intelligence artificielle, NLP, DeepLearning, LLM, configuration pour assurer la connectivité avec les bases de données
- Gestion des accès
- Développement des ETL, ex code SQL, Python, … ex, pour transformer des données EPIC vers le CDM OMOP ou vers un data lake sécurisé.
- Développement de catalogues de données
- Supervision d’informaticiens et chercheurs collaborant à ces tâches
- Participation à la révision de la qualité des données, assurer la disponibilité, la sécurité et l’intégrité des données stockées dans les bases de données.
- Surveiller les performances des bases de données et mettre en œuvre des ajustements pour garantir une réponse rapide aux requêtes.
- Collaborer avec les équipes de développement pour optimiser les requêtes et améliorer les performances globales du système.
Sécurité des données
- Mettre en place des mécanismes de sécurité robustes pour protéger les données sensibles.
- Gérer les droits d’accès aux bases de données et assurer la conformité avec les normes de sécurité.
Sauvegarde et récupération
- Élaborer des stratégies de sauvegarde efficaces et assurer la récupération des données en cas d’incident.
- Tester régulièrement les procédures de sauvegarde et de récupération.
Documentation
- Maintenir une documentation complète de l’architecture des systèmes de gestion des données, y compris la structure, les procédures stockées et les configurations.
Formation
- Participer à la formation des utilisateurs et des membres de l’équipe sur l’utilisation des outils mis en place
Profil
- Diplôme en informatique, génie logiciel et intelligence artificielle, minimum master
- PhD souhaité avec expérience en recherche et expérience de publications scientifiques
- Expérience démontrée dans l’administration de bases de données, gestion et optimisation de plateformes de données, data warehouse, pipelines de données et métadonnées
- Connaissance approfondie de logiciels de bases de données SQL
- Connaissance approfondie de programmation SQL, Python, Java, R, …
- Conception, développement et gestion d’ETL (Extract Transform Load), optimisation des performances, la migration des données et la gestion des tâches planifiées
- Expérience DevOps : mise en place, configuration et maintenance de l’infrastructure « données » (Docker, Git)
- Compétences dans la gestion des serveurs (Windows et Linux), et des unités de stockage.
- Compréhension d’une architecture réseau d’une grande organisation
- Expertise en intelligence artificielle
- Gestion de données dans le domaine médical, en particulier en relation avec les domaines de l’oncologie, de la neurologie et de la psychologie
- Maitrise des vocabulaires standards médicaux et du Common Data model OMOP
- Compréhension des requis concernant le RGPD
- Connaissance de l’anglais écrit et parlé, capacité de participer activement et efficacement à une conversation en anglais.
- Excellentes capacités d’analyse
- Capacité à travailler de manière autonome et à collaborer efficacement au sein d’une équipe pluridisciplinaire, avec des collaborateurs internes et externes à l’organisation
- Résistant au stress, autonome et pro-actif
- Méticuleux et organisé
- Orienté « service » et résultat, solides compétences en communication
- Ouvert à l’apprentissage continu