JFHOD

P.137 - Amélioration du diagnostic des lésions classées en stades par l’IA en hépato-gastroentérologie

C. Vitellius, G. Hunault, F. Oberti, I. Fouchard-Hubert, A. Lannes, J. Boursier, F.X. Caroli-Bosc, P. Calès

Introduction

Nombre de scores diagnostiques ou prédictifs sont basés sur des références (gold standard) ayant des classifications semi-quantitatives (ou ordinales) : stades des tumeurs en cancérologie, des varices œsophagiennes, de fibrose hépatique (Metavir)... Nous avons développé un programme informatique ADORE (Automatisation du Diagnostic ORdonné par multiciblagE) basé sur l’intelligence artificielle (IA) et destiné aux scores prédictifs de cibles diagnostiques à classification ordinale. Notre but était d’évaluer le gain de performance diagnostique d’ADORE par rapport à un test diagnostique classique.

Patients et Methodes

Le programme ADORE se situe dans le cadre de l'apprentissage statistique supervisé, domaine très proche de l'apprentissage automatique de l'IA. A l'instar des réseaux de neurones multi-couches, il explore combinatoirement tous les modèles possibles de régression logistique binaire (RLB) liés aux modalités de la cible. Ces modèles sont partiels ou complets, prenant en compte tout ou partie des modalités. Après une sélection des meilleures RLB, les techniques statistiques de modélisation (régression linéaire, quadratique, LASSO, RIDEG, forêts aléatoires, séparateurs à vaste marge...) sont utilisées et comparées afin de fournir le meilleur modèle de prédiction pour des données dont le résultat de classification est connu. Comme en IA classique, le programme ADORE explore de nombreux sous-espaces de représentation et de modélisation pour trouver le meilleur modèle et fournit ensuite un mécanisme unique de prédiction applicable à de nouvelles données. En pratique, le temps de calcul d’un modèle classique sur PC est < 1 seconde vs jusqu’à environ 24 h pour ADORE. ADORE maximalise le biais d’optimisme dans la population de dérivation donc la validation nécessite une population indépendante de validation. 18215 patients ont été évalués dans 3 pathologies du colon, œsophage et foie.

Résultats

Le programme ADORE a été appliqué à plusieurs pathologies en hépato-gastroentérologie. 1/ Cancer colo-rectal (CCR) : dans une population de 11706 sujets soumis au dépistage du CCR et ayant rempli un questionnaire alimentaire et de mode de vie, il permettait d’obtenir un score prédictif pour toutes les lésions (adénomes et CCR, prévalence : 1,5%) avec AUROC de 0,83 vs 0,75 (p<0,001) par RLB classique vs pour les scores publiés : 0,64 pour le score de Huxley et 0,63 pour le score aHLI. Le score ADORE permettait de stratifier les patients en plusieurs niveaux de risque de lésions tumorales de 0 à ≥5%.  2/ Varices œsophagiennes nécessitant un traitement (VNT) : dans une population de 2290 patients avec hépatopathie chronique d’étiologies multiples avec prévalence de VNT de 14,9%, les AUROC pour VNT étaient : score PLR (ratio plaquettes/dureté hépatique) : 0,766, ANTICIPATE : 0,771 et, pour les scores dérivés dans cette population et incluant seulement les variables du bilan hépatique standard, soit par RLB classique : 0,806 ou par ADORE : 0,826 (p<0,001 vs autres tests). 3/ Tests de fibrose hépatique. Nous avons dérivé un test incluant seulement les variables du bilan hépatique standard dans une population de 1013 hépatites C et les résultats ont été comparés dans une population de validation de 3206 patients d’étiologies variées. L’AUROC pour la fibrose sévère (Metavir F≥3) était : APRI : 0,743, Fib4 : 0,786, Hepascore : 0,811, FM3G : 0,821, FM2G : 0,836 ; le bilan hépatique standard avait une AUROC de 0,796 par RLB classique vs 0,831 par ADORE vs (p<0,001). En incluant les marqueurs directs de fibrose du FM2G, ADORE produisait une AUROC à 0,860 (p<0,001 vs 0,836 du FM2G par RLB classique).

Discussion

Conclusion

Le programme ADORE, entièrement automatisé, permet d’augmenter très significativement la performance diagnostique dans de nombreuses pathologies. Il permet par son gain diagnostique de simplifier les variables utilisées et donc un gain de temps et économique. Autrement dit, il exploite au mieux les variables standards et permet d’éviter des marqueurs inhabituels. Il nécessite au mieux de grandes bases de données (de plusieurs centaines à plusieurs milliers de patients) pour la construction du test. Une fois le score obtenu, un calculateur en ligne permet une application transparente et immédiate en pratique clinique.

Remerciements

SATT Ouest  Valorisation