Data and Cloud Expertise - Expertise DATA (Data Engineering, Data Science, Architecture Big Data) et CLOUD (AWS, Azure, GCP)

Fort de plus de 20 ans d'expériences en architecture technique, DATA & CLOUD Expertise est spécialisé :

  • DATA (Data Science, Data Engineering) : sur toute la chaîne de traitement, de l'ingestion à l'exploitation (DataViz, Machine Learning), en passant par le stockage et le traitement à l'échelle (Big Data) ;
  • CLOUD (AWS, Azure, GCP) : des projets de migration vers le Cloud, à l'optimisation des coûts, en passant par l'architecture des solutions (natives/hybrides).

DATA & CLOUD Expertise vous apporte son savoir-faire dans le cadre de ses missions, et notamment :


Portfolio

Datalake dans le Cloud AWS  Data Engineering  Cloud

AWS S3, Step Function, Lambda, CloudFormation, Athena, Glue, SNS, CloudWatch, Oracle

Structuration du Datalake sur le Cloud AWS, fédérant et centralisant diverses datasources SOITEC (MES, SCADA, SCP, ERP, etc.), et premiers use-cases d'analyse des rendements (Athena, SAS JMP), et des détracteurs dans la consommation d'eau (Redshift, PowerBI).

Datalake dans le Cloud AWS

Détection de défauts  Data Science 

Deep Learning (Tensorflow, tf.data)

Classification d'images pour une détection automatique de défauts rares et/ou peu marqués.

Détection de défauts

Détection de défauts  Data Science

Traitement d'images (Convolution, Sobel, Open/Close)

Analyse d'images de contrastes variés, afin d'évaluer automatiquement le nombre de picots de diverses catégories.

Détection de défauts

Développement d'un FW de ML-Ops pour le Cloud AWS  Data Engineering  Cloud

MLFlow, Docker, AWS (ECS, Fargate, CloudFormation)

Socle technique serverless pour les applications de Data Science, compatible avec ML-Flow, et visant à accélérer les déploiements, homogénéiser les architectures, et imposer des standards d'industrialisation (supervision, sécurité, etc.), tout en réduisant les coûts Build/Run.

Développement d'un FW de ML-Ops pour le Cloud AWS

Détection de bulles  Data Science

Traitement d'images (Canny), approche statistique & Clustering (DBSCAN)

Automatisation de la détection de bulles sur des plaques afin de limiter les inspections manuelles.

Détection de bulles

Classification de plaques  Data Science

Machine Learning (RandomForest), Deep Learning (CNN)

Transcription de cartographies de défauts en "features" servant d'entrée à des algorithmes de classification supervisés.

Classification de plaques

Analyse de contentions  Data Science

Seaborn, Plotly

Accompagnement des métiers dans leurs analyses, via des travaux d'extraction et de visualisation de la data.

Analyse de contentions

Détection de rayures  Data Science

Traitement d'images & Clustering (DBSCAN)

Détection de fines rayures sur des prises de vues obliques en lumière naturelle de plaques.

Détection de rayures

Smart Sampling  Data Engineering  Cloud

Oracle, AWS Step Function, Lambda, CloudFormation, SNS, CloudWatch

Architecture et industrialisation d'un prototype de Sampling intelligent des plaques dans une solution mixte on-premise / Cloud AWS.

Smart Sampling

Validation du polissage  Data Science

Deep Learning, Machine Learning, Clustering, Traitement d'image

Étude de l'automatisation de la mesure du polissage des plaques. Diverses méthodes de traitement d'images (Sobel, Open/Close, Kernel, etc.) et de Deep Learning (CNN) pour extraire l'information de la limite de polissage des images, servant à alimenter des algorithmes de Machine Learning, supervisés (classification du polissage) ou non (sélection de mesures).

Validation du polissage

Analyse de similarités sur une base partitionnée  Data Science

Databricks, Spark-ML, TF-IDF, Distance cosinus

Utilisation de Spark-ML pour traiter des données à l'échelle (ex. : TF-IDF, calcul de similarité pour des systèmes de recommandation, etc.).

Analyse de similarités sur une base partitionnée

Reconnaissance d'images via des chaînes de Markov  Data Science

Réseaux bayésiens - Chaînes de Markov cachées

Établissement d'une matrice de probabilités de transitions, puis inférence basée sur le calcul des vraisemblances de séquences d’observation.

Reconnaissance d'images via des chaînes de Markov

Streaming Big Data  Data Engineering

Kafka, Zookeeper, Spark Streaming, Oracle

Refonte architecturale, conception et développement, d'une solution historique vers une solution Big Data pour assurer le passage à l'échelle (gestion de plusieurs milliers d'événements par seconde) et la résilience.

Streaming Big Data

Identification de locuteurs  Data Science

Spectrogramme, MFCC (Librosa), Clustering

À partir d'une bande son, reconnaissance des différents locuteurs au fil du temps. Extraction d'informations depuis un signal audio, alimentant un algorithme d'apprentissage non-supervisé.

Identification de locuteurs

Analyse d'articles Web  Data Science

NLP (Spacy)

Extraction automtisée de qualificatifs/catégories des articles de la base Wikipedia.

Analyse d'articles Web

Reporting web  Data Engineering  Cloud

Kafka, Spring Boot, Cassandra, Cloud AWS Serverless

Migration et fiabilisation d'une application vers une solution Cloud AWS Serverless pour réduire ses coûts.

Reporting web

Migration & Partitionnement Oracle  Data Engineering

Oracle RAC Exadata

Partitionnement et montée de version du SGBD Oracle (10 To de données et tables de 40 milliards d'enregistrements) vers un cluster Oracle RAC Exadata.

Migration et Partitionnement Oracle

Supervision Applicative  Data ScienceData Engineering

Timeseries, Statistiques, Java

Supervision applicative d'un SCADA basée sur une analyse statistique de l'activité de l'application.

Supervision Applicative

BIM - Building Information Modeling  Data Engineering  Cloud

Autodesk API Viewer, Spring Boot, AWS RDS PostgreSQL

Démonstrateur pour un salon de l'interfaçage d'une solution de BIM avec des outils de GMAO.

BIM - Building Information Modeling

Audit de performance et contentions du SGBD Oracle  Data Engineering

Oracle RAC, .Net C#, Quartz, ELK

Analyse de divers composants applicatifs (Database Oracle, code C#, ordonnanceur Quartz), et mise en avant de contentions dans l'utilisation d'Oracle.

Audit de performance et contentions du SGBD Oracle


Certifications

Cloud
AWS Certified Solutions Architect – Professional AWS Certified DevOps Engineer – Professional Microsoft Certified: Azure Fundamentals Google Cloud Platform - Associate Cloud Engineer

Data
AWS Certified Machine Learning – Specialty AWS Certified Big Data – Specialty Databricks Certified Associate Developer for Apache Spark 3.0 Google Cloud Platform - Professional Data Engineer Microsoft Certified: Azure Data Engineer Associate Microsoft Certified: Azure Data Scientist Associate Data Science – Analyse et gestion de grandes masses de données

Divers
Oracle Certified Professional, Java SE 8 Programmer Professional Scrum Master The Open Group Certified: TOGAF 9 Foundation


Compétences

Thématique Domaine Principales technologies
Data
Science

Data Science
Apprentissage & Inférence Machine/Deep Learning (SK-Learn, TensorFlow), Timeseries (ARIMA), Bayésien (pyAgrum)
Extraction d'informations Traitement d'images (OpenCV, SK-Image), NLP (Spacy, NLTK), Scraping (Beautiful Soup)
Data Viz Frameworks Python (Matplotlib, Seaborn, Altair, Plotly) et Web (D3.js), Tableau, PowerBI
Data
Engineering

Data Engineering
DevOps & MLOps CI/CD (GIT, Gitlab, Jenkins, Sonar, Nexus), IaC (CloudFormation), Docker, MLFlow, DVC
Ingestion & Processing Kafla, Databricks Spark, Stack Hadoop (Zookeeper, Airflow, Hive, ...), Beam, Talend ETL
Stockage SQL OLTP (Oracle, Postgresql), OLAP (Oracle, Redshift, Synapse, BigQuery, Snowflake)
Stockage NOSQL Colonne (Cassandra, HBase), Document (MongoDB), Graphe (Neo4J), Clef/valeur (Redis)
Développement Nombreux langages (Python, Java, .Net C#, C++, SQL, PL/SQL), Tests (xUnit, TDD), Patterns
Monitoring CloudWatch Logs / LogsInsight, ELK & OpenSearch, TIG (Telegraf, InfluxDB, Grafana)
Cloud
Cloud
Amazon Web Services Lambda, Step Functions, Glue, Kinesis, EMR, S3, DynamoDB, Athena, Fargate, Sagemaker
Microsoft Azure Data Factory, Event Hubs, Synapse, Stream Analytics, Azure Databricks, ML Studio
Management Google Cloud Platform Cloud SQL, Cloud Spanner, Firestore, Bigtable, BigQuery, Dataflow, Dataproc, Composer
Management équipe/projet Management RH, Gestion de projets (budgets, KPI, etc.), Méthodes agiles (Scrum, Kanban)
     



DATA & CLOUD Expertise



Contact

Email/Téléphone de contact




Mentions légales

En vertu de l'article 6 de la loi n° 2004-575 du 21 juin 2004 pour la confiance dans l'économie numérique, il est précisé aux utilisateurs l'identité des différents intervenants dans le cadre de sa réalisation et de son suivi :

  • Le propriétaire et/ou éditeur du site de DATA & CLOUD Expertise est la société WOPIKA :
    • Société par Actions Simplifiée Unipersonnelle, au capital de 2000€
    • Siège social : 37 chemin du vieux chêne, CS 50040, 38242 Meylan
    • SIREN : 810319517 (RCS de Grenoble)
    • TVA : FR 44947688685
  • Le site hébergé en France par AWS (P.O. Box 81226, Seattle, WA 98108-1226).

WOPIKA est une marque déposée. A ce titre, toute reproduction totale ou partielle, représentation, imbrication, diffusion et rediffusion de la marque ou d'un logo effectuée sans l'autorisation expresse de son propriétaire est donc prohibée au sens du Code de la propriété intellectuelle. Tout contrevenant encourt les sanctions prévues aux articles L. 713-2 et suivants du Code de la propriété intellectuelle.

L'éditeur dégage toute responsabilité quant aux changements ou mises à jour éventuels des sites vers lesquels un lien a été établi, et ne saurait être tenu pour responsable de l'accès par les utilisateurs via les liens hypertextes mis en place dans le cadre du site internet en direction d'autres ressources présentes sur le réseau.

Ce présent site n'utilise aucun cookie ni technologie de traçage.