Développer un moteur de recherche vidéo cloud native grâce aux services de Machine Learning
Tirer parti des cloud providers pour construire les applications de demain.

Missions

  • Découvrir l’écosystème cloud, ses différents providers et plus particulièrement les services haut niveau d’analyse de médias vidéos.
  • Développer une solution permettant l’indexation de médias vidéos en vue d’être accessibles via un moteur de recherche.
  • Découvrir et mettre en œuvre une architecture innovante, Cloud native et serverless.

Conditions

Type of internship:Stage de fin d'étude, pré-embauche
Location:OCTO Technology 34 avenue de l'Opéra 75002 Paris
Salary:1500 € bruts
Date:Début 2019

Profile

  • Vous êtes autonome, curieux(se) et prêt(e) à prendre des initiatives.
  • Vous avez une première expérience de développement en Python, Java ou NodeJS.
  • Vous êtes intéressé(e) par les technologies et les enjeux liés au Cloud.
  • Une expérience du développement sur le Cloud est un plus mais n’est pas un prérequis pour ce stage

Context

Étape 1 : Cadrage

Dans un premier temps vous réaliserez une analyse des services d’analyse audio/vidéo existants chez les différents cloud provider que sont AWS, GCP et Azure. Ceci permettra d’en connaître les limites et de s’orienter vers le choix le plus pertinent. Accompagné de votre encadrant, vous définirez une première mouture de l’architecture cible pour votre application.

Étape 2 : Développement du workflow d’analyse sémantique

Après être monté(e) en compétences dans l’utilisation du cloud provider retenu, vous entrerez dans le vif du sujet en réalisant, accompagné de votre tuteur, une première version d’un workflow d’analyse sémantique de médias vidéos dont vous stockerez les résultats.

Étape 3 : Réalisation d’un moteur de recherche

Vous réaliserez dans un premier lieu une étude des services de recherche existants tels que ElasticSearch ou encore Algolia. A partir des données extraites de l’analyse des médias, que vous aurez pris soin d’indexer, vous réaliserez un moteur de recherche des médias vidéos en vous appuyant sur l’un des services retenus lors de l’étude précédente.

Étape 4 : Partage

Vous partagerez au sein de la communauté OCTO ce que vous aurez appris, à travers une restitution interne et un article sur le blog OCTO.

Internship target

Nous cherchons à réaliser un outil de recherche vidéos.
De nos jours, les algorithmes de machine learning avancés permettent d’extraire de l’information structurée de sources aussi complexes que des médias vidéos. Les services tels que Google Cloud Speech-to-Text, AWS Rekognition ou AWS Comprehend mettent la transcription audio, la reconnaissance d’image ou le NLP à portée d’API. La mise en place d’un moteur de recherche est également accompagnée par des services tels que ElasticSearch ou Algolia.
Avec l’avènement du cloud et plus récemment du paradigme serverless, il devient envisageable de construire des applications complexes reposant entièrement sur la composition de services haut niveau. Ainsi, vous devrez développer une application permettant de rechercher les vidéos, et vous disposerez des vidéos de conférences internes d’OCTO pour tester votre travail. Vous utiliserez les services d’extraction de paroles et de reconnaissance d’images pour analyser les vidéos et en extraire des métadonnées. Ces données seront indexées dans un service de moteur de recherche pour y être intégré à votre application.

Management

Vous serez encadré(e) par un consultant de la tribu Cloud Native Application chez OCTO. Vous serez suivi(e) tout au long de votre projet (entretiens hebdomadaires avec votre tuteur, soutien de la communauté OCTO en cas de difficultés techniques...).