Segmentation dentaire par Intelligence Artificielle
18 000+ photos intra-orales annotées, 8 architectures de deep learning évaluées, un pipeline validé par des métriques cliniques et industrielles.
Étude réalisée par iTransform GP, février 2026
18k+
Photos annotées
6
Classes cliniques
8
Architectures évaluées
92%
IoU (Voting Classifier)
Les données
18 000+ photos intra-orales annotées, collectées en conditions cliniques réelles.
Source du dataset
Photos collectées en cabinet, couvrant une diversité de patients, pathologies et conditions d'éclairage.
18k+
Photos annotées
6
Angles / patient
Protocole de capture
6 angles standardisés par patient, deux arcades (maxillaire, mandibulaire), trois vues chacune (centrale, droite, gauche).
























Annotations : 6 classes cliniques
Chaque pixel est classifié manuellement par le Dr Romain Lateur.
Dent
Surface d'émail visible, classe la plus fréquente.
Gencive
Tissu gingival, couleur variable selon l'inflammation.
Tartre
Plaque minéralisée, zones irrégulières et petites.
Carie
Déminéralisation subtile, la plus difficile à détecter.
Gingivite
Inflammation gingivale, variation de texture et couleur.
Couronne
Restaurations prothétiques et directes (résine, métal).
Pipeline de prétraitement
Chaque photo passe par 4 étapes de normalisation avant l'inférence.
Image brute
Photo originale capturée par le patient ou le praticien.
CLAHE*
Contraste local amélioré pour détecter caries et tartre.
Resize 512×512
Format uniforme pour les modèles de segmentation.
Normalisation*
Pixels mis à l'échelle [0,1] pour un entraînement stable.
CLAHE*
Contrast Limited Adaptive Histogram Equalization : égalise le contraste localement sans saturer les hautes lumières.
Normalisation*
Pixels mis à l'échelle [0, 1], toutes les images sur la même base numérique, évitant les biais de luminosité.
Résultats : Voting Pixel Classifier
8 architectures combinées par vote majoritaire pixel par pixel.
Principe du Voting Classifier
Chaque image est analysée par 8 architectures indépendantes. Pour chaque pixel, la classe finale est déterminée par vote majoritaire, réduisant les erreurs individuelles pour des segmentations robustes.
UNet
~100M params
Attention UNet
~100M params
UNet++
~120M params
DeepLabV3+
~90M params
SegFormer
~80M params
PSPNet
Pyramid Pooling
TransUNet
~200M params
SwinUNet
Swin Transformer
92%
IoU
Recouvrement quasi-parfait entre prédiction et vérité terrain.
95,64%
Précision
Très peu de fausses alertes sur les prédictions positives.
95%
Recall
Quasiment toutes les zones pathologiques sont détectées.
Exemple de segmentation


Vous souhaitez en savoir plus ?
Découvrez notre démo live avec analyse de photos dentaires en temps réel, ou contactez-nous pour discuter de notre technologie.