En bref

"La satisfaction de nos clients par l'innovation est une priorité et un élément essentiel dans la stratégie du groupe". Nous développons de nombreux outils  d'optimisation et simplifions ainsi l'accès aux technologies pour nos clients.

 

Témoignages

François Chahuneau

Directeur des technologies

L’innovation au service de la performance.

Les mutations de marché et la concurrence exposent les entreprises à deux contraintes en termes de compétitivité. Elles doivent développer leur capacité d'innovation sur leur savoir-faire fondateurs pour construire un portefeuille d'activités différenciant. Elles doivent ensuite faire de la satisfaction du client le principe directeur de l'organisation de leur activité. Elles sont alors amenées à dépasser la fourniture d'un produit particulier pour offrir une solution globale et personnalisée.

La satisfaction de nos clients par l'innovation est une priorité pour Numen, c’est pourquoi la R&D constitue un élément essentiel dans la stratégie du groupe. Pour optimiser la qualité et les coûts des prestations de nos clients, augmenter l’efficacité nos chaînes de production et apporter à nos clients les services novateurs qui leur permettent de fidéliser les leurs, Numen investit annuellement 7% de son chiffre d’affaires en programme de recherche. »

25 ans dans la R&D, le conseil, et le développement de progiciels centrés sur le thème du document et de l’ordinateur … sous ses multiples facettes.

Témoignages

Institut Géographique National

Institution Publique

L'IGN (Institut Géographique National) est chargé par l'Etat de produire des données géographiques sur le territoire national et de les mettre à la disposition du public (sous forme de cartes, de fichiers électroniques ou via son site internet Géoportail).

Afin de créer une base de données géographique rattachant les données cadastrales de la DGI (Direction générale des impôts) aux données géographiques de l'Institut, l’IGN a confié à Numen des tâches complexes de production sur des images numériques. Il s’agit de géo-référencement, transformations, traitement des raccords et assemblage des plans cadastraux scannés.
La saisie vectorielle des limites administratives a nécessité le traitement de 200 000 plans cadastraux, correspondant à 10 millions de points de calage vidéocodés.

Projet IGN

SmartExtract

SmartExtract est la plateforme de capture de données développée par Numen pour couvrir tous les besoins de son activité BPO (Business Process Outsourcing)/DPO (Document Process Outsourcing). Cette plateforme, qui intègre le moteur OCR ABBYY, combine de multiples technologies « made by Numen » dans les domaines du traitement et de l’analyse d’image, de la classification automatique sur critères mixtes (contenus/mise en page), de la recherche floue et de l’apprentissage machine.

SmartExtract s’appuie sur SmartGED, le moteur de GED CMIS développé par Numen qui couvre tous les besoins liés au stockage, au workflow et au reporting de production. Une des particularités remarquables de SmartExtract est son IHM WebCapture 100% Web, développée en technologie « client-riche » AngularJS.

L’originalité de la conception de SmartExtract réside aussi dans l’omniprésence de techniques empruntées au data-mining, jusque dans le fonctionnement des outils interactifs manipulés par les opérateurs. SmartExtract implémente le concept de « masque d’extraction intelligent », pour lequel le zonage géométrique ne constitue qu’une première indication, largement complétée par les mécanismes de data-mining qui se déroulent en temps réel.

Cette conception tire parti de l’expérience de Numen dans de nombreux projets de data-mining complexe sur archives patrimoniales ou administratives, aujourd’hui transposée dans le domaine du BPO.

En savoir plus.

SmartGed

Le lancement du projet SmartGED a suivi de peu la parution de la version 1.1 du standard sectoriel CMIS . Il est né d’un besoin industriel qui ne pouvait être satisfait par les produits existants sur le marché, pourtant très encombré, des systèmes de GED et de gestion du contenu.

En effet, la gestion de documents issus des chaines éditiques et de numérisation, dont le contenu est figé mais dont les métadonnées qui lui sont associées sont évolutives nécessite un accès client pour les créer ou les modifier, parfois à plusieurs étapes du workflow de production. La GED associée doit de plus disposer de hautes performances en chargement de masse afin de supporter le débit des outils industriels utilisés pour l’alimenter.

Il s’agit donc de la première GED nativement compatible CMIS 1.1.

L’implémentation de SmartGED s’appuie le SGBD relationnel-objet PostgreSQL dont les fonctionnalités avancées et les extensions NoSQL récentes en font un support suffisant pour une implémentation efficace, en utilisant un design novateur basé sur l’utilisation des objets de type clé-valeur (Hstore).


Le respect d’un standard reconnu par les acteurs majeurs du secteur de la Gestion Electronique de Documents, associé à des choix technologiques judicieux nous permet aujourd’hui d’affirmer que SmartGED est un produit abouti capable de répondre aux besoins d’un système de production documentaire industriel :

  • capacités de chargement de masse à hautes performances
  •  couche de services offrant la possibilité de création de batch industriels,
  • souplesse et évolutivité des métadonnées associées au contenu.

Les principes de fonctionnement d’une GED de production nécessitent de spécialiser la norme CMIS en vue d’intégrer des fonctionnalités supplémentaires relatives aux spécificités de ce segment. L’intégration de fonctionnalités spécifiques et indispensables au monde de la production afin de répondre à nos besoins :

  • Structures de données orientées « reporting »,
  • Association de listes de tâches à des Folder, « Corbeille » de workflow,
  • Connexion à un moteur de workflow externe.

Projet Pacte

Comment améliorer sensiblement la qualité du texte issu de la numérisation ?

Le contexte des Investissements d’avenir pose avec acuité cette question en demandant à l’ensemble des détenteurs de documents patrimoniaux, dans une perspective de retour sur investissements, d’imaginer des modèles d’exploitation économique appliqués aux contenus numérisés. La valorisation de ces contenus est directement liée à leur haute qualité et à leur fidélité par rapport aux originaux.


Objectif du projet de R&D
:

Le projet PACTE (Projet d’Amélioration de la Capture TExtuelle) vise l’amélioration de la performance des processus de capture textuelle (OCR, reconnaissance d’écriture manuscrite, saisie manuelle, rédaction) par l’utilisation du traitement de la langue, et plus spécifiquement des méthodes linguistiques statistiques et hybrides. Il concerne le domaine applicatif des projets de numérisation du patrimoine écrit, dans un contexte multilingue.

Un partenariat d'acteurs complémentaires :

Le consortium PACTE réunit trois entreprises (Numen, A2IA, Isako) et deux laboratoires (Alpage, LIUM). Il regroupe ainsi l’ensemble des problématiques métier, les ressources lexicales, l’expertise scientifique et la technologie nécessaires pour traiter le sujet en profondeur.




Sujets Phares


Numen traite depuis plus de 40 ans des données sensibles, du contenu textuel complexe et multilingue. Numen se positionne aujourd’hui comme un acteur leader dans le domaine du BPO et des services de dématérialisation.

Numen est fier de compter sur une équipe solide développant et industrialisant des procédés à l’état de l’art de la recherche dans les champs d’applications suivants :

  • le traitement d’images de documents
  • l’OCR et les technologies de RAD-LAD
  • les technologies d’apprentissage statistique, appliquées notamment à la correction orthographique contextuelle *
  • le text-mining et l'indexation automatique de documents
  • le data-mining et l'analyse de flux de données métiers
  • la composition dynamique de documents
  • le routage automatique de documents par analyse intelligente des contenus (pattern matching)
  • les technologies liées à la sécurité de la numérisation (gestion d’identités, scellement et signature électronique, impression sécurisée)
  • l’informatique de traitement réparti (cloud, big data, moteurs de workflow)

7 % du CA en R&D

Cherchant à optimiser la qualité et les coûts des prestations de nos clients tout en ayant la volonté d'augmenter l'efficacité de nos chaînes de production, Numen investit annuellement 7% de son chiffre d'affaires en programme de recherche.

Une équipe

Les équipes de R&D sont rattachées à la Direction des Technologies, dont la mission est d’organiser la capitalisation du savoir-faire technologique à travers la diversité des projets menés pour les clients et la multiplicité des domaines d’application métier. Bénéficiant de fonds propres ainsi que d’un financement partiel de l’État, différents projets de R&D sont conduits en interne. D’autres sont menés en collaboration avec des sociétés partenaires et des laboratoires universitaires.

Numen est fier de compter sur une équipe solide dont les progrès augmentent à mesure que les challenges technologiques se révèlent.

Au travers de son pôle ingénierie et R&D, Numen automatise les processus de ses clients, solutionne les problématiques de productivité grâce à ses innovations en matière de capture mais aussi de traitement des données (text-mining, indexation automatique et statistique), ou encore, développe des systèmes d’information complexes. Numen intègre régulièrement de jeunes ingénieurs, issus des grandes écoles et des formations supérieures.

X