Data / Data Science sur le Cloud

12 février 2019
19h00
156 Boulevard Haussmann, 75008 Paris

Qui n’a pas jamais rêvé d’accéder à des instances puissantes multi-GPU en quelques quelques appels d’API ? Souvent point de départ des projets de Data Science, les déploiements On Premise peuvent devenir un facteur limitant quant la capacité d’industrialisation, la facilité d’exploration des données ou encore la scalabilité des solutions construites. Le Cloud ouvre de nouvelles perspectives aux Data Scientistes, les possibilités autour de la Data Science dans le Cloud sont désormais multiples, nous vous proposons de découvrir cette diversité au travers les services de GCP, d’AWS, mais également à travers Kubernetes qui se veut plus agnostic.

Voir les vidéos

Speakers

Loïc Divad
Data Ingénieur - Xebia

Loïc est ingénieur logiciel chez Xebia. Il intervient sur des problématiques de Data Engineering comme l’acquisition, le traitement et le stockage des données. Il est développeur Scala depuis 3 ans et participe activement au partage de connaissance via des articles, formations et talks.

Loïc Divad
Data Ingénieur - Xebia
Giulia Bianchi
Data Scientist - Xebia

Giulia est Data Scientist et consultante à Xebia . Elle travaille actuellement sur des volumes de données importants en mettant en place des algorithmes de Machine Learning, avec un objectif concret d’industrialisation. Elle contribue activement à cet écosystème en donnant des talks et en écrivant sur le blog Xebia.

Giulia Bianchi
Data Scientist - Xebia
Yoann Benoit
Data Scientist et Technical Officer - Xebia

Yoann Benoit
Data Scientist et Technical Officer - Xebia
Diana Ortega
Senior Consultant & data lover - Xebia

Diana a plusieurs années d'expérience dans l'écosystème JVM, notamment dans le secteur bancaire et télécom. Elle est passionnée pour les bonnes pratiques de développement et l'intégration de logiciel.

Diana Ortega
Senior Consultant & data lover - Xebia

Programme

L’ Auto Scaling c’est l’argument phare d’un bon nombre de technologies en Data Engineering. Parmi les outils du moment, on retrouve Kafka-Streams. Avec sa forte intégration au bus de message Apache Kafka, il est pensé pour être un framework distribué capable de passer à l’échelle. Pourtant, dans la pratique, sa seule utilisation est limitée. L’orchestration de ces applications est généralement nécessaire.

Kafka-Streams est un framework vraiment pensé pour scaler, alors que va-t-il manquer exactement ? Ce talk met en avant quelque services cloud qui permettront de profiter pleinement de la scalabilité de notre application de Steam Processing.

Depuis son arrivée, GCP a démocratisé la conception et la mise en place de services basés sur l'IA sans avoir besoin en pré-requis de connaissances spécifiques en IA, Google Cloud AutoML étant le projet phare de cette tendance. Toutefois GCP met à disposition des services intéressants pour un Data Scientist tels que ML Engine pour entrainer et déployer ses propres modèles. Comment un Data Scientist peut-il s'orienter dans ce monde qui n'est pas le sien pour exploiter tout le potentiel de GCP ?

L’intelligence artificielle est devenue un enjeu majeur pour les différents providers du cloud, et AWS n’y fait pas exception. La promesse d’AWS SageMaker est notamment de faciliter le développement et l’industrialisation des modèles de machine learning pour tous les développeurs, qu’ils soient Data Scientists ou non, quelque soit leur niveau de connaissances en la matière.
Durant ce talk, nous vous montrerons comment utiliser cet outil pour mettre en place une application réelle qui utilise un modèle exporté, et vous ferons un retour d’expérience sur l’outil dans son ensemble.

Vidéos de la soirée

Mois du Cloud - Scale-in & Scale-out with Kafka Stream & GKE

Mois du Cloud - AI in the Cloud: using AWS SageMaker in real life

Mois du Cloud - GCP pour les data scientists

Lieu de l'évènement

Découvrir nos autres soirées

Data Lake Serverless

Voir les vidéos

Développer dans le cloud

Voir les vidéos

Le cloud en 2019

19/02/2019

Voir le programme