Publication de recherche AI.Lise
Améliorer la classification documentaire grâce à une approche multimodale innovante
1. Limites de la classification basée uniquement sur le texte
La classification automatique des documents repose traditionnellement sur des techniques de traitement automatique du langage naturel (NLP), basées uniquement sur le texte extrait des fichiers. Si cette approche est performante dans de nombreux cas, elle montre rapidement ses limites face à des documents visuellement complexes ou de faible qualité, notamment lorsque la reconnaissance optique de caractères (OCR) est imparfaite.
2. Une approche multimodale innovante développée par AI.Lise
Pour relever ce défi, deux de nos experts du laboratoire interne AI.Lise, Pirlouit Dumez et Salah Zidi (en partenariat avec Centrale Lille), proposent une approche multimodale innovante publiée par l’IEEE (Institute of Electrical and Electronics Engineers) :
« Améliorer la classification des documents texte de faible qualité grâce à une approche multimodale »
3. Principe de la méthode multimodale
Cette recherche introduit une méthode multimodale qui combine à la fois les informations textuelles et les éléments visuels des documents. En intégrant ces deux dimensions, le modèle ne dépend plus uniquement du texte issu de l’OCR : il exploite également la structure visuelle, la mise en page et d’autres caractéristiques graphiques pour affiner la classification.
4. Des résultats nettement améliorés pour les documents dégradés
Les résultats présentés dans l’article démontrent une amélioration significative de la précision, en particulier dans des scénarios où l’OCR est sensible ou dégradé. Cette avancée ouvre des perspectives concrètes pour les organisations traitant de grands volumes de documents hétérogènes, parfois numérisés dans des conditions imparfaites.
5. Un engagement réaffirmé de NeoLedge en faveur d’une IA pragmatique
À travers cette publication, NeoLedge confirme son engagement en faveur d’une intelligence artificielle appliquée, pragmatique et orientée performance, au service de la gestion documentaire et de la fiabilité des processus.