JFHOD

P.453 - Evaluation prospective des scores de propreté des vidéocapsules grêliques par des lecteurs indépendants : remise en question d'un gold standard ?

J.P. Le Mouel, G. Houist, J.C. Saurin, F. Cholet, R. Leenhardt, G. Vanbiervliet, C. Leandri, G. Rahmi, C. Duburque, J. Kirchgesner, X. Dray

Introduction

La détection des lésions lors des vidéo-capsules endoscopiques de l'intestin grêle (VCE-IG) dépend de la propreté des segments greliques. L'évaluation de la qualité de la préparation grelique et la comparaison des différentes modalités de purge exigent des scores fiables et reproductibles. Trois échelles, désignées indice quantitatif (QI), évaluation qualitative (QE) et évaluation de l'adéquation globale (OAA), ont été proposés par Brotz et al. pour évaluer la propreté des VCE-IG, et font actuellement références (1). Cependant, aucun de ces scores n'a fait l'objet d'une validation externe. L'objectif de notre étude était d'évaluer la reproductibilité de ces trois échelles spécifiques.

Matériels et méthodes

Cent cinquante-cinq enregistrements de VCE-IG de troisième génération, complètes, ont été extraits d'un essai multicentrique, contrôlé, randomisé, français (PREPINTEST - NCT01267981), qui évaluait trois modalités de préparation avant VCE-IG (2). Trois experts ont lu indépendamment les 155 enregistrements accéléres des VCE-IG, à deux reprises, dans un ordre aléatoire, sur des périodes de 48 heures, à intervalle de 6 semaines, en utilisant les scores QI, QE et OAA, comme décrits dans l'étude initiale. Les coefficients kappa (de Cohen) pondérés ont été calculés pour évaluer les corrélations intra- et inter-observateurs. L'interprétation des valeurs des coefficients kappa a été réalisée à l'aide du tableau proposé par Landis et Koch.

Résultats

La reproductibilité intra-observateur était faible à modérée, avec des coefficients kappa compris entre 0,37 et 0,46, 0,41 et 0,51, et 0,41 et 0,50, respectivement pour le QI, QE et OAA.

La reproductibilité inter-observateur était très variable, de faible à forte, avec des coefficients de corrélations kappa variant de 0,40 à 0,64, 0,29 à 0,65 et 0,52 à 0,71, pour ces trois mêmes scores.

Discussion

Dans cette étude de validation externe, les corrélations intra- et inter-observateurs des trois scores de propreté de l'intestin grêle se sont avérées faibles à modérées dans la plupart des cas (kappa < 0,60) et rarement fortes (kappa entre 0,61 et 0,80).

Dans l'ensemble, les méthodes et les résultats de notre étude sont semblables à ceux de l'étude princeps. En effet,  les coefficients de corrélation kappa sont relativement proches mais la différence majeure est constatée sur l'interprétation qu'en a fait l'équipe de Brotz.

Récemment, deux revues d'experts ont encore cité ces trois scores comme références pour l'évaluation la qualité de la propreté de l'intestin grêle (3). Cependant, nos constatations nous amènent à penser que ces échelles sont insuffisamment reproductibles pour être utilisées en soins courants ou en recherche clinique.

Conclusion

Les scores QI, QE et OAA, actuellement considérés comme les références pour l'évaluation de la qualité de la préparation des VCE-IG, se sont révélés insuffisamment reproductibles. De nouveaux scores ou méthodes d'évaluation de la propreté de l'intestin grêle sont donc nécessaires. Dans ce domaine, l'intelligence artificielle pourrait trouver toute sa place.

Remerciements