Reconnaissance
L’industrie audio-visuelle montre un besoin grandissant en moyens d’analyse automatique pour la vision et pour le son (Intelligent Video Analytics - IVA), particulièrement lors d’évènements live mais potentiellement
aussi sur des archives. Placer un dispositif d’analyse intelligent, d'entraînement et d’indexation par Intelligence Artificielle directement à la source du flux (“edge on-device”) sur des appareils électroniques (caméras, micros, ...) peut se révéler un moyen beaucoup plus efficace (moindre bande passante, moindre latence, rapidité de traitement, traitement local spécifique et potentiellement collaboratif…) et à moindre coût que l’utilisation du Cloud face à des besoins massifs de bande-passante(de 100 à 200 Mbits/sec par vidéo).Phoenix AI, “Advanced partner” de NVIDIA, et membre du réseau Metropolis de NVIDIA (leader mondial des processeurs graphiques nécessaires à l’intelligence artificielle), a été consulté à de nombreuses occasions
par des entreprises et des établissements publics du secteur des médias à ce sujet. Ayant évalué ce besoin concret et à fort potentiel du marché et en s’appuyant sur son expertise technologique,
Phoenix AI a mobilisé ses partenaires wallons, tant au niveau du Hardware (Thelis), de l’expertise Deep et active learning (U Liège, UCL, SIRRIS) et du développement d’applications IA sur vidéo/son diversifiées dans les marchés les plus prometteurs (MEMOVIE, WNM, ACIC). L’objectif de ce projet est d’élaborer en consortium une solution complète (hardware et software) s’installant
directement sur un équipement audiovisuel (Edge computing on-device) et qui permette de développer et d’exploiter de manière autonome, sans aucune connexion de réseau, une “intelligence” sur le contenu. Véritable “couteau suisse” de fonctionnalités IA standard “ready-to-use” (Deep Learning) incluant même une fonctionnalité de customisation de modèles AI (Active Learning - Transfer Learning) afin d’être beaucoup plus pertinent sur des contenus spécifiques (objets, personnes, contexte, …), le produit final sera simple
d’utilisation et s’appliquera aux applications audiovisuelles les plus courantes et les plus diverses
(broadcast live, videosurveillance, reconnaissance de la voix, storytelling…).
L’objectif principal est d’élaborer une solution tout-en-un “on-device” à 2 étages :
- Une couche matérielle et logicielle pour l'entraînement de l’AI et pour le transfer learning- Une couche matérielle et logicielle pour l’inférence de l’AI (détection, segmentation, classification, etc). Le second objectif du projet est de développer 3 fonctionnalités IA applicatives standard “ready-to-use”en tant que briques logicielles à disposition de l’utilisateur pour des applications à fort potentiel. Le dernier objectif, et non le moindre, est d'élaborer une fonctionnalité IA de “customisation de modèles AI” basée sur de l’Active Learning et du Transfer Learning. La solution sera aussi conçue pour pouvoir intégrer du Federated Learning quand la technologie sera mature (“Ready for Federated Learning”).
Le projet est composé de 8 partenaires avec des expertises et expériences complémentaires:
- Les 3 partenaires académiques et centres de recherche avec un apport d’expertise scientifique- Les 2 partenaires edge computing (Phoenix AI et Thelis) avec un apport d’ingénierie entre les modèles algorithmiques, le design hardware et la capacité à développer en fonction de la demande- 3 partenaires « fonctionnalités » qui apportent leur savoir-faire et expertise dans leur domaine spécifique ainsi que la compréhension fine des besoins des utilisateurs et des contraintes techniques, Cet ensemble de très haut niveau d’expertise dans le domaine de l’Intelligence Artificielle, du Edge Computing et du traitement Vidéo est unique en Wallonie.Les études prévoient qu’en 2027, le marché du Edge computing hardware atteindra plus de 28 milliards de dollars (TCAM +20% p.a.) alors que celui du Edge computing software devrait représenter plus de 3 milliards de dollars (TCAM proche de +30% p.a.). En particulier, la reconnaissance de flux vidéo et d’images (Video and Image recognition) devrait représenter la plus forte croissance et atteindre un tiers du marché du software en 2027 : 1 milliard de dollars. Ainsi, dans un monde connecté entraînant des quantités toujours plus importantes de données audiovisuelles, le projet ReconnAIssance propose de développer l'ensemble d’une filière 100% belge dédiée au développement de solutions d’intelligence artificielle “Edge on-device” pour la vidéo et le son.