Risques et perspectives du big data et de l’intelligence artificielle

Les avancées technologiques ont démultiplié les circuits d’accès aux données , leur traitement et leur diffusion. Les données sont devenues la matière première des systèmes d’information et sont indispensables à la vie et au développement des organisations ; surtout avec la croissance rapide des capacités de calcul des processeurs ces dernières années. Nous assistons, ainsi, à une explosion du stockage et du traitement des données avec les technologies de l’information et de la communication (TIC). Ces technologies ont atteint un niveau de développement très important avec pour aboutissement l’apogée de technologies connexes que sont : le big data , le cloud computing , les objets connectés et l’intelligence artificielle (IA).

Le big data, terme très utilisé de nos jours mais méconnu des Français , s’est développé dans un premier temps dans les domaines de l’économie, de la gestion et du marketing pour la gestion de la relation client, l’amélioration des processus opérationnels, la création de nouvelles valeurs et la prise de décision efficiente. Mais ces dernières années, les envies d’utilisation dans le domaine de la santé connaissent un essor important ; envies liées notamment aux promesses d’économies énormes sur les dépenses de la santé, à leur impact sur la recherche dans les domaines médicaux et pharmaceutiques et à l’amélioration de la prise en charge des individus.

Le big data a pour objectif de transformer les données brutes en connaissance directement exploitable en lien direct avec les consommateurs. Dans le domaine de la santé, les concepteurs promettent des réductions de dépenses de santé, l’amélioration de la qualité de soin et des politiques de santé. En effet, l’étude McKinsey (MANYIKA ET AL., 2011) sur le système de santé aux Etats Unis a montré qu’en analysant les données de santé , on notait une amélioration considérable de l’efficacité, de l’efficience et de la qualité du système de santé. Cette utilisation des données de santé pourrait créer une valeur de 300 milliards de dollars américains dont deux tiers sous forme de baisse des dépenses de santé. La protection de la santé est non seulement un réflexe individuel mais aussi une obligation pour l’Etat visà-vis de la population ; Ainsi, du fait de la rareté des ressources financières et de la recherche permanente d’efficience et de qualité, l’Etat s’est saisi de l’opportunité qu’offre le numérique pour mettre en place une politique de santé fondée sur les TIC.

Contexte

Rappel historique 

Dès 1998, l’Etat s’est lancé dans la mise en place de la télémédecine afin d’améliorer l’accès aux soins à un plus grand nombre d’individus. En 2000, le premier arrêté pour la mise en œuvre de la télémédecine dans un hôpital a été signé. En avril 2005, l’Etat a mis en place un groupement d’intérêt public (GIP DMP) qui devait mettre en œuvre le dossier médical personnel aujourd’hui devenu le dossier médical partagé (DMP). Le but du DMP était d’une part, de fournir au médecin traitant l’information la plus complète pour qu’il puisse proposer le traitement ou les examens les plus adaptés et, d’autre part, d’éviter des redondances inutiles d’examens ou de prescriptions.

L’État a encouragé le numérique dans tous les domaines avec la promulgation de la loi n 2016-1321 du 7 octobre 2016 pour une République numérique . L’objectif de l’utilisation du numérique par l’Etat est de réduire les dépenses de santé et d’améliorer la qualité de la prise en charge des patients. Cette loi a été suivie d’actions telles que la relance du DMP et la création d’un « Data Health Hub » pour améliorer l’accès aux données de santé à la recherche.

L’utilisation des TIC dans le domaine de la santé a donné naissance à l’e-santé. Pour l’Organisation Mondiale de la Santé (OMS), l’e-santé se définit comme « les services du numérique au service du bien-être de la personne » (WHO, 2016). Elle se définit également comme « l’utilisation des outils de production, de transmission, de gestion et de partage d’informations numérisées au bénéfice des pratiques tant médicales que médico sociales » (WHO, 2016). Elle ne se résume pas à la télémédecine et ne doit pas être assimilée au vaste ensemble des TIC-santé qui englobent l’ensemble des applications numériques au service de l’offre de soins.

Mais le domaine de la santé a une particularité spécifique – l’humain comme objet d’étude – qui mérite d’être prise en compte dans l’utilisation des TIC ; car une négligence de cette spécificité peut aboutir à des conséquences importantes pour le système de santé, les individus et la société .

Contexte spécifique de la santé

Le domaine de la santé est un système complexe très dynamique qui repose sur la médecine et l’Homme qui sont également des systèmes complexes. Aujourd’hui, la combinaison du big data, de l’intelligence artificielle (IA) et des objets connectés conduit à une médecine préventive et individuelle qui prend en compte les vulnérabilités de chaque personne en vue d’assurer un meilleur suivi (un analyseur électrocardiographique surveille en temps réel les alertes cardiovasculaires, la surveillance des patients chroniques à distance ou de l’activité sportive et des paramètres vitaux des patients, etc.…). Toutes ces technologies aboutissent à une production massive de données qui nécessitera des moyens pour les stocker, les gérer et les utiliser. Toutefois, la sécurité des données devrait être prise en compte afin de protéger le secret médical – fondement de la pratique médicale -, la vie privée, l’intimité des individus et garantir l’accessibilité des données à tout moment aux soignants afin de leur permettre d’assurer la continuité des soins.

Le big data prend essentiellement naissance dans et par l’informatique ; dépassant les solutions classiques existantes pour la collecte, le stockage et le traitement des données. Le changement d’échelle, qui a fait passer des bases de données aux masses de données, réinterroge ces problématiques. Concernant la collecte des données tout d’abord, les méthodes de fouille des réseaux sociaux comme l’intégration de données provenant de multiples capteurs (objets connectés, dispositifs de surveillance médicale, puces, smartphones, etc.…) et leur croisement est riche de potentialités applicatives tout en posant différemment les problématiques liées à la vie publique / vie privée et à la visibilité́ plus ou moins contrôlée et plus ou moins contrôlable via les algorithmes, des individus. Le stockage et le traitement calculatoire de ces données, la croissance des capacités de stockage et la structuration, des data center (centres de données ou ferme de données), ouvrent des problématiques aussi bien techniques (pour l’organisation et l’optimisation de ces systèmes), qu’énergétiques ou économiques. Pour l’exploitation de ces données, le big data a imposé́ la découverte de nouvelles méthodes dans des domaines pourtant assez anciens, comme le data mining (fouille de données) pour l’exploitation efficace de ces données par l’IA en intégrant à la fois des méthodes de machine learning et de deep learning. Le traitement des données massives pose de sérieux problèmes juridiques – notamment en ce qui concerne leur contrôle, leur protection, leur sécurité́ et leur propriété́ intellectuelle – et des questions sur la commensurabilité du parcours de vie et du parcours de soins à travers le numérique.

L’innovation technologique du big data, dont l’Internet des objets (objets connectés), et les stratégies de ciblage, de marketing et de visibilité auxquelles elles donnent lieu, forcent à interroger le cadre juridique qui leur est applicable. La visibilité sur le web implique également un questionnement sur la portée des droits fondamentaux à caractère informationnel. S’il existe une volonté de renforcer les droits des personnes sur leurs données, ceux-ci doivent subir de nécessaires limites, de façon à ce que certaines données puissent être traitées légitimement .

L’utilisation de l’Internet dans le domaine de la santé et des objets connectés laissent des traces dont l’impact social pour les individus sur l’utilisation de leurs données de santé est considérable. Les technologies du big data sont fondées sur le web sémantique et l’interrogation transversale (data mining) des bases de données permet le profilage qui conduit à exclure tacitement des personnes (COLLOC, 2015). Ces risques d’exclusion ont été rappelés dans le discours de Edith Ramirez (RAMIREZ, 2014) sous la notion de « discrimination par algorithme» consécutif au big data.

La pratique de la médecine est inconcevable sans l’utilisation des données personnelles. L’exploitation informatisée des données personnelles dans le domaine de la santé est très sensible en ce qu’elles font intimement partie de la vie des individus et de leur famille. Pour protéger la vie privée des individus, le législateur a prévu la loi relative à l’informatique, aux fichiers et aux libertés depuis 1978 en France complétée récemment par le règlement (UE) 2016/679 du Parlement européen et du Conseil du 27 avril 2016 relatif à la protection des personnes physiques à l’égard du traitement des données à caractère personnel et à la libre circulation de ces données, et abrogeant ainsi la directive 95/46/CE. Ainsi, la question de la protection de la vie privée des individus était déjà abordée dans les années 1970 avant même le développement important des TIC, témoignant de l’importance de celle-ci au sein de la population mais également au niveau de l’Etat. Elle a abouti à la création de la Commission Nationale de l’Informatique et des Libertés (CNIL) . Toutefois, sur le plan individuel, le partage des données de santé des personnes ne peut se concevoir qu’entre les soignants dans le respect du secret professionnel afin de préserver la confiance dans la relation de soin. Le DMP doit assurer la sécurité (disponibilité, intégrité, traçabilité, confidentialité) des données. Mais le secret médical est actuellement remis en question par l’utilisation des TIC comme les clouds administrés le plus souvent à l’étranger ou des hébergeurs accrédités par le ministère de la santé pour le stockage des données de santé et l’entrée en jeu d’autres acteurs ne faisant pas partie de l’équipe de soins. Le « privacy shield » a donc été mis en place pour permettre la protection des données des ressortissants de l’Union Européenne transférées vers les Etats Unis en remplacement du « Safe Harbor ». L’anonymat est devenu pratiquement « impossible » à l’heure du tout numérique. Le concept de « privacy by design » est l’une des solutions proposées par Ann Cavoukian (CAVOUKIAN, 2006) pour assurer un minimum de protection des données personnelles.

Le rapport de stage ou le pfe est un document d’analyse, de synthèse et d’évaluation de votre apprentissage, c’est pour cela chatpfe.com propose le téléchargement des modèles complet de projet de fin d’étude, rapport de stage, mémoire, pfe, thèse, pour connaître la méthodologie à avoir et savoir comment construire les parties d’un projet de fin d’étude.

Table des matières

1 Introduction générale
1.1 Contexte
1.1.1 Rappel historique
1.1.2 Contexte spécifique de la santé
1.2 Problématique et hypothèses de recherche
1.2.1 Problématique des traces numériques et de la privacy dans le cadre du big data et de l’intelligence artificielle
1.2.2 Place de l’éthique et questions épistémologiques
1.2.3 Complexité des questions posées
1.2.4 Intérêt de notre sujet de thèse
1.2.5 Objectifs de notre thèse
2 Méthodologique de la recherche
2.1 Méthodes
2.1.1 Phase exploratoire
2.1.2 Méthode d’enquête
2.2 Techniques de recueil de données
2.2.1 Technique de questionnaire
2.2.2 Technique d’entrevue ou d’entretien
2.3 Echantillonnage
2.3.1 Population cible
2.3.2 Population d’étude
2.4 Techniques d’analyse
2.4.1 Techniques d’analyse qualitative
2.4.2 Techniques d’analyse quantitative
2.4.3 Logiciels d’analyse des données
2.5 Réalisation des outils de collecte
2.5.1 Guide d’entretien des médecins
2.5.2 Questionnaire des patients
2.5.3 Guide d’entretien des personnes ressources
2.6 Déroulement des entretiens et remplissage des questionnaires
2.7 Considérations éthiques et juridiques
3 Etat de l’art
3.1 Big data
3.1.1 Définitions
3.1.2 Description des technologies du big data
3.1.3 Big data et cloud computing
3.2 Intelligence artificielle
3.2.1 Généralités
3.2.2 Méthodes utilisées dans le développement de l’IA
3.2.3 Données de l’IA
3.2.4 Utilisation de l’IA dans le domaine de la santé
3.3 Textes juridiques de protection des données de santé
3.3.1 Définitions
3.3.2 Principes
3.3.3 Droits des personnes
3.3.4 Sécurité et confidentialité des données
3.3.5 Transfert des données hors de l’UE
3.4 Ethique
3.4.1 Ethique médicale ou théorie du principisme
3.4.2 Déontologisme
3.4.3 Utilitarisme
3.4.4 Ethique de la vertu
3.4.5 Prise de décision en médecine
4 Système d’aide à la décision médicale à partir d’un espace vectoriel flou : cas de l’embolie pulmonaire
4.1 Diagnostic de l’embolie pulmonaire
4.1.1 Facteurs de risque thromboemboliques
4.1.2 Stratégie diagnostique
4.2 Espace vectoriel flou : une extension de la logique floue
4.2.1 Proposition d’un espace vectoriel flou
4.2.2 Calcul de la norme de la résultante des trois vecteurs sur E
4.2.3 Généralisations à n paramètres
4.2.4 Représentation du temps
4.3 Modèle de la démarche clinique
4.4 Modèle temporel flou du diagnostic clinique
4.5 Méthodologie de la conception de notre score diagnostic
4.5.1 Choix des variables
4.5.2 Fonction caractéristique des variables
4.6 Intérêts de l’espace vectoriel flou temporel pour le diagnostic de l’EP
4.7 Méthodologie pour la conception d’un EVFT dans un contexte clinique
4.8 Perspectives
5 Traces numériques et pratique médicale
6 Conclusion générale

Lire le rapport complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *