Fabrice de Salaberry, son directeur général, nous parle de SINEQUA...
/SDBRNews : Quelle est la genèse de Sinequa ?
Fabrice de Salaberry* : Sinequa est un éditeur de logiciels qui trouve ses racines françaises, il y a une vingtaine d’années, dans l’analyse et la compréhension des langues (à l’époque, l’entreprise s’appelait Cora). L’entreprise est devenue Sinequa lorsqu’elle a décidé, il y a sept ans, de se tourner vers les très grands comptes et vers l’analyse des très grands volumes de données empreintes de confidentialité et de sécurité très élevée : organisations internationales multilingues, publiques ou privées. Sinequa a développé, à ce moment-là, une plateforme logicielle adaptée à la gestion de très gros volumes : la plupart des grandes organisations ne savent pas traiter ou exploiter l’immense quantité de données dont elles disposent. Contrairement à certains concurrents sur ce marché, nous sommes capables de gérer des très gros volumes de données. Notre actionnariat est français et nos équipes de développement sont basées en France, même si nous nous sommes développés à l’international et significativement aux Etats-Unis. Nous avons une croissance très forte, avec une moyenne annuelle de 43% sur les trois derrières années et qui a atteint 91% en 2018.
SDBRNews : Que voulez-vous dire par « les organisations ne savent pas traiter leurs données » ?
Fabrice de Salaberry : Le premier problème des organisations est leur capacité à trouver et à interpréter la donnée dont elles ont besoin pour produire leur valeur ajoutée. Pour cela, il faut se connecter à toutes les briques du système d’information (SI) pour trouver les données, structurées autant que non structurées. Les données non structurées (contenus textuels) sont exprimées en général en langage naturel et dans n’importe quelle langue dans une organisation : elles sont significativement sous-exploitées voire non exploitées, or ces informations représentent jusqu’à 80% du volume total des données d’une entreprise. Sinequa apporte donc la capacité à se connecter à toutes ces données, quelque soit leur format ou leur localisation dans le SI, et à les traiter de façon « intelligente » pour en sortir une information : nous aidons l’organisation à traiter sa donnée pour en faire une aide à la décision opérationnelle. Exemple : avec le ministère des Armées françaises, nous avons commencé il y a quelques années à traiter leurs données (des millions de documents) pour en sortir des informations propices à aider les forces de commandement en particulier ; nous avons la même mission dans de grandes banques françaises ou pour de grands comptes industriels (Thales, Airbus, etc.). Les cas d’usage sont multiples.
SDBRNews : Quel est votre plus concurrentiel ?
Fabrice de Salaberry : Notre démarche consiste d’abord à atteindre les données de notre client (avec une famille de 180 connecteurs), que ce soit dans son SI ou à l’extérieur et que ce soient des données structurées ou non structurées, puis de les indexer : l’index désigne ainsi le bon emplacement des informations. Le traitement automatique de 135 langues, complété des ressources de l’intelligence artificielle et du machine learning, va permettre ensuite d’exploiter ces données. La conjonction de ces technologies nous permet de fabriquer des index d’une capacité supérieure à la moyenne, pour des organisations ayant des milliers de collaborateurs : des centaines de millions de documents et des milliards de données ! Notre couche logicielle permet donc non seulement de chercher dans la multitude de ces données mais aussi de pouvoir y faire de l’analyse en profondeur. Nous donnons au client un panorama consolidé d’informations dont il n’a jamais eu connaissance auparavant. Nous leur donnons aussi la possibilité d’une classification des données en fonction des risques de l’entreprise : données classifiées ou non, données d’importance vitale ou non, etc.
SDBRNews : Vous faisiez allusion aux sources externes. Avez-vous un cas d’usage à nous citer ?
Fabrice de Salaberry : Nous pouvons parler de l’investigation et du renseignement, par exemple. Un enquêteur de service officiel souhaitera savoir si telle personne a été vue avec telle autre, à tel endroit, au sein d’un véhicule portant telle plaque d’immatriculation, faisant usage de tel numéro de téléphone, etc. Si ces informations sont noyées dans des documents en russe, en arabe ou en japonais, vous ne les trouverez jamais. Là où l’analyse linguistique joue un rôle important, c’est qu’à partir de rapports d’enquêtes, de journaux, de réseaux sociaux, etc., nous allons fouiller dans ces textes pour déterminer si les données cherchées sont mentionnées. A la différence des outils de veille, de Google ou autres, nous ne posons pas des mots-clés pour déclencher des alertes, car nous ne savons souvent ni ce qu’on cherche ni ce qu’on va trouver, nous savons simplement à peu près dans quelle zone d’internet il faut chercher : un pays, une organisation terroriste, etc. Dans cet exemple d’application de notre progiciel, nos connecteurs d’indexation vont donc commencer à cibler ces zones ou ces noms en regardant les bons comptes Facebook, les bons comptes Twitter, les bons sites web, les bons fils RSS, etc. et notre outil Sinequa va corréler les résultats de ces différentes sources pour en faire une information exploitable. Nous apportons une aide à la recherche de la donnée et à l’interprétation de la donnée, pour faciliter ensuite le travail de l’opérateur client : nous lui offrons un gain de temps considérable et des moyens qu’il n’a pas forcément pour lui permettre de se consacrer à l’analyse et à l’exploitation de l’information. Nous développons nous-mêmes la plateforme, mais nous la confions ensuite à nos clients pour qu’ils l’opèrent de bout en bout, ce qui garantit la confidentialité de leurs opérations.
* Lors de cette interview, Fabrice de Salaberry, directeur général de Sinequa, était accompagné de Luc Manigot, VP Global Operations de Sinequa.
** Sinequa a rejoint le cluster Data Intelligence du GICAT qui regroupe une vingtaine de sociétés françaises disposant de technologies et solutions innovantes permettant de répondre aux enjeux du renseignement et du traitement massif des données. www.sinequa.com
Cette interview est parue dans la lettre SDBR le 11 juin 2019