Image en en-tête

Améliorer la classification documentaire grâce à une approche multimodale innovante

Le

Améliorer la classification documentaire grâce à une approche multimodale innovante

La classification automatique des documents repose traditionnellement sur des techniques de traitement automatique du langage naturel (NLP), basées uniquement sur le texte extrait des fichiers. Si cette approche est performante dans de nombreux cas, elle montre rapidement ses limites face à des documents visuellement complexes ou de faible qualité, notamment lorsque la reconnaissance optique de caractères (OCR) est imparfaite.

Pour relever ce défi, deux de nos experts du laboratoire interne AI.Lise, Pirlouit Dumez et Salah Zidi (en partenariat avec Centrale Lille), proposent une approche multimodale innovante publiée par l’IEEE (Institute of Electrical and Electronics Engineers) :

« Améliorer la classification des documents texte de faible qualité grâce à une approche multimodale »

Cette recherche introduit une méthode multimodale qui combine à la fois les informations textuelles et les éléments visuels des documents. En intégrant ces deux dimensions, le modèle ne dépend plus uniquement du texte issu de l’OCR : il exploite également la structure visuelle, la mise en page et d’autres caractéristiques graphiques pour affiner la classification.

Les résultats présentés dans l’article démontrent une amélioration significative de la précision, en particulier dans des scénarios où l’OCR est sensible ou dégradé. Cette avancée ouvre des perspectives concrètes pour les organisations traitant de grands volumes de documents hétérogènes, parfois numérisés dans des conditions imparfaites.

À travers cette publication, NeoLedge confirme son engagement en faveur d’une intelligence artificielle appliquée, pragmatique et orientée performance, au service de la gestion documentaire et de la fiabilité des processus.

Accédez à la publication complète ici.

Partager sur les réseaux

Ces articles peuvent vous intéresser

Aucun résultat !