MLOps - kurs 80 000 gnid. från Otus, utbildning 5 månader, datum 30 november 2023.
Miscellanea / / November 30, 2023
Du kommer att bemästra alla nödvändiga maskininlärningsfärdigheter för strömmande data och distribuerade miljöer. Programmet innehåller nödvändig kunskap från områdena Data Science och Data Engineering, vilket gör att du kan bearbeta big data och skriva distribuerade algoritmer i Spark.
Du kommer att öva varje modul genom att göra läxor. I slutet av utbildningen kommer du att ha ett slutprojekt som låter dig sammanfatta all kunskap du har förvärvat och lägga till din portfolio. Det kan göras som en del av arbetsuppgifter på din datauppsättning eller vara ett lärande projekt baserat på data från OTUS.
Vem är den här kursen för?
För maskininlärningsspecialister eller mjukvaruingenjörer som vill lära sig att arbeta med big data. Typiskt finns sådana uppgifter i stora IT-företag med en storskalig digital produkt.
För datavetare som vill stärka sin kompetens med ingenjörskunskaper. Tack vare kursen kommer du att kunna bearbeta data och självständigt visa resultatet av ML-lösningar i produktion.
För att lära dig behöver du grundläggande datavetenskapliga färdigheter. Vi föreslår att du tittar på Map of Data Science-kurserna på OTUS för att ta reda på vilken utbildningsnivå som krävs.
Du kommer att lära dig:
- Använd standardverktyg för ML-pipeline i en distribuerad miljö;
- Utveckla dina egna block för ML pipelines;
- Anpassa ML-algoritmer till distribuerade miljöer och big data-verktyg;
- Använd Spark, SparkML, Spark Streaming;
- Utveckla algoritmer för förberedelse av strömmande data för maskininlärning;
- Säkerställa kvalitetskontroll i alla stadier av övergången av ML-lösningar till industriell drift.
Efterfrågan på specialister
De färdigheter du kommer att behärska är så tillämpade och lovande som möjligt. Allt fler digitala produkter dyker upp på marknaden, vars utveckling kräver arbete med big data och strömbehandling. Redan nu kan specialister med en sådan kompetenspool och viss arbetslivserfarenhet kvalificera sig för en lön på 270 tusen. rubel En annan trend - automatisering av utbildnings- och valideringsprocesser, tvärtom, devalverar på något sätt arbetet hos en klassisk dataforskare. Allt går mot den punkt där även en icke-specialist kan göra en passformsförutsägelse. Därför är de som har åtminstone ytliga ingenjörskunskaper redan på en premie.
Kursens funktioner
Mycket övning i att arbeta med data
Brett utbud av kompetens från distribuerad ML och strömdatabearbetning till produktionsutdata
Aktuella verktyg och teknologier: Scala, Spark, Python, Docker
Livekommunikation med experter via webbseminarier och Slack chat
4
kursEngagerad i utvecklingen av ett Data Science-team som tillhandahåller funktionalitet baserad på maskininlärning för företagets produkter och tjänster. Som dataforskare deltog han i utvecklingen av Kaspersky MLAD och MDR AI Analyst. I...
Engagerad i utvecklingen av ett Data Science-team som tillhandahåller funktionalitet baserad på maskininlärning för företagets produkter och tjänster. Som dataforskare deltog han i utvecklingen av Kaspersky MLAD och MDR AI Analyst. Som C++-utvecklare deltog han i skapandet av MaxPatrol SIEM. Han har undervisat i datorer i många år. vetenskapliga discipliner vid MSTU GA. Författare till en serie rapporter om ML, C++, DS projektledning och utveckling lag. Medlem av PC-konferensen C++ Ryssland. Programansvarig
8
kurser20+ års erfarenhet av anpassade utvecklingsprojekt inom IT. Dussintals framgångsrika projekt, inklusive de under statliga kontrakt. Erfarenhet av utveckling och implementering av affärssystem, open source-lösningar, support för högbelastningsapplikationer. Lärare i kurser i...
20+ års erfarenhet av anpassade utvecklingsprojekt inom IT. Dussintals framgångsrika projekt, inklusive de under statliga kontrakt. Erfarenhet av utveckling och implementering av affärssystem, open source-lösningar, support för högbelastningsapplikationer. Lärare i kurser i Linux, Kuber, MLOps, DataOps, SolutionArchitect, IaC, SRE, samt mentor för HighLoad-kursen
1
välSpecialist på att arbeta med big data och maskininlärning. I 8 år arbetade han på Odnoklassniki.ru. Ledde OK Data Lab-teamet (ett laboratorium för forskare inom området big data och maskin...
Specialist på att arbeta med big data och maskininlärning. I 8 år arbetade han på Odnoklassniki.ru. Ledde OK Data Lab-teamet (ett laboratorium för forskare inom området big data och machine learning). Big data-analys i Odnoklassniki har blivit en unik chans att kombinera teoretisk utbildning och vetenskaplig grund med utveckling av riktiga, efterfrågade produkter. Sedan 2019 har han arbetat på Sberbank som verkställande direktör. Fungerar som ledare för klustret för att utveckla en plattform för rekommendationssystem inom masspersonaliseringsdivisionen. Han tog examen från St. Petersburg State University 2004, där han disputerade i formella logiska metoder 2007. Jag arbetade med outsourcing i nästan 9 år utan att tappa kontakten med universitetet och den vetenskapliga miljön.
Grundläggande introduktion till kursstart
-Ämne 1. Gradient nedstigning och linjära modeller
-Ämne 2.Översikt över grundläggande maskininlärningsmetoder och mått
-Ämne 3. Utveckling av metoder för att arbeta med data
-Ämne 4.Grunderna i programmering i Scala
Teknologisk grund för distribuerad databehandling
-Ämne 5. Distribuerade filsystem
-Ämne 6. Resursförvaltare i distribuerade system
-Ämne 7. Utveckling av massivt parallella och distribuerade datorramverk
-Ämne 8. Apache Spark 1 Grunderna
-Ämne 9. Apache Spark 2 Grunderna
Distribuerad ML Basics
-Ämne 10. Överföring av ML-algoritmer till en distribuerad miljö
-Ämne 11.ML i Apache Spark
-Ämne 12. Utveckla dina egna block för SparkML
-Ämne 13.Optimering av hyperparametrar och AutoML
Strömbearbetning
-Ämne 14. Strömdatabehandling
-Ämne 15. Tredje parts bibliotek för användning med Spark
-Tema 16.Spark Streaming
-Ämne 17. Strukturerad och kontinuerlig streaming i Spark
-Ämne 18.Alternativa ramverk för streaming
Målsättning och resultatanalys
-Ämne 19. Fastställande av ML-projektets mål och preliminär analys
-Ämne 20. Långsiktiga ML-mål med exemplet med uppgiften att minska churn
-Ämne 21.A/B-testning
-Ämne 22. Ytterligare ämnen
Utmatning av ML-resultat till produktion
-Ämne 23. Tillvägagångssätt för att få ML-lösningar i produktion
-Ämne 24.Versionering, reproducerbarhet och övervakning
-Ämne 25.Onlineservering av modeller
-Ämne 26. Mönster för asynkron streaming ML och ETL
-Ämne 27. Om du behöver Python
ML i Python i produktion
-Ämne 28. Produktionskod i Python. Kod för organisation och förpackning
-Ämne 29.REST-arkitektur: Flask API
-Ämne 30.Docker: Struktur, tillämpning, utplacering
-Ämne 31.Kubernetes, containerorkestrering
-Theme 32.MLOPS-verktyg för Kubernetes: KubeFlow, Seldon Core. Funktioner av driften av heterogena system i branschen.
-Tema 33.Amazon Sagemaker
-Ämne 34.AWS ML-tjänst
Avancerade ämnen
-Ämne 35. Neurala nätverk
-Ämne 36. Distribuerat lärande och slutledning av neurala nätverk
-Ämne 37.Gradientförstärkning på träd
-Ämne 38. Förstärkningsinlärning
Projektarbete
-Ämne 39. Val av ämne och organisation av projektarbetet
-Ämne 40. Samråd om projekt och läxor
-Ämne 41.Skydd av designarbete