Big Data och Data Science: gå till nästa nivå - gratis kurs från Stepik, utbildning 11 lektioner, Datum 28 november 2023.
Miscellanea / / November 29, 2023
Om du redan kan lite om Data Science och vill fortsätta lära dig, fylla i luckor och få mer övning, är den här kursen för dig. Som en del av programmet kommer du att fördjupa dig i området Data Science - bekanta sig med med MapReduce-arkitekturen och Apache Hadoop-ekosystemet, förstå designen av Apache Spark och Apache Parquet och behärska grunderna i neurala nätverk och deras arkitekturer. Du får också lära dig hur du gör affärsanalyser med Power BI och vilka mjuka färdigheter en projektledare behöver.
Syftet med kursen är att uppmärksamma dig på Big Data och Data Science, därför är allt kursmaterial i informationssyfte utan att dyka ner i alla krångligheter. Om du är intresserad av en djupdykning, använd då extra modulmaterial.
Kursen består av fem moduler som hjälper dig att systematiskt växa inom datavetenskap och i tid träna den förvärvade teorin i praktiken:
1. Dyk in i datavetenskap.
Kom ihåg vilka processer dataanalys innebär. Lär dig grunderna om hur långtidslagring fungerar. Du kommer att arbeta med SQL med hjälp av Oracle DBMS som exempel och skapa din första databas. Bekanta dig med MapReduce-arkitekturen och Apache Hadoop-ekosystemet.
2. Verktyg för databearbetning, analys och datavisualisering.
Lär dig vad Power BI är och vilka problem som kan lösas med dess hjälp. Lär dig att skaffa, modellera, analysera data och bygga visualiseringar.
3. Verktyg för att arbeta med big data.
Du kommer att förstå hur Apache Spark, ett verktyg för att arbeta med big data, fungerar. Lär dig Apache Parquets datalagringsformat och dess funktioner. Titta också på exempel på att arbeta med Pyspark i Jupyter-anteckningsboken.
4. Maskininlärningssystem.
Du får lära dig vad p-värde är, varför nödvändiga statistiska kriterier behövs och vilka uppgifter de hjälper till med. Lär dig begreppet neurala nätverk, deras egenskaper och grundläggande arkitekturer. Du kommer också att förstå hur man utvecklar ett slankt och pragmatiskt förhållningssätt till att använda big data.
5. Soft Skills och projektledning.
Lär dig principerna och teknikerna för projektledning. Tänk på hur livscykeln för ett projekt som hanteras i det agila paradigmet fungerar. Du kommer också att lära dig vilka viktiga mjuka färdigheter en expert behöver för att utveckla ledarskap och projektledningsförmåga.
Vem är den här kursen för?
Kursen vänder sig till alla som har grundläggande kunskaper i Data Science och vill studera området vidare. Kursen lämpar sig även för specialister inom IT och närliggande områden som är intresserade av användningen av maskininlärning inom företag och utexaminerade från kursen "Big Data and Data Science: start the dive from scratch" som vill fortsätta sin utbildning.
Initiala krav
För att göra kursen tydlig och användbar måste du ha avancerad datorvana och grundläggande kunskaper i programmering och SQL. Du kan få dem i den tidigare kursen i vårt projekt - "Big Data and Data Science: starta ditt dyk från början."
3
kursData Scientist, ML/DL-forskare, lärare
Erfarenhet av analys - 5 år. Arbetade som Data Scientist på PJSC Megafon. Genomför kurser i Skillbox, Netology, Yandex. Workshop och andra utbildningsprojekt. Talare på Big Data Days 2021-konferensen.
Data Scientist frilansare, lärare och ML/DL-forskare, kursförfattare. Han arbetade som forskare inom området "Decision Theory" i militärtjänst. Efteråt samarbetade han med stora och små företag. Ex-DataScientist PJSC Megafon.
1
välVi bidrar till utvecklingen av skolbarn och elever från ryska regioner och utvecklingsstäder grannländer överför vi till dem erfarenhet och expertis från storstadsuniversitet, företag och stora internationella IT-hubbar
Den ryska skolan för programmering, förkortad som RSP, verkar inom området utbildning för barn och vuxna inom IT- och utvecklingssfärerna mjuka färdigheter i formaten träningsläger, cirkelrörelser, mästarklasser, webbseminarier, workshops, onlinekurser och konferenser. Vår utbildningsverksamhet bygger på intensitet och djup fördjupning i ämnet, överföring av erfarenheter från seniorer och erfarna till nybörjare, mentorskap och volontärarbete. Vi tjänar idéerna om tillgänglig praktisk utbildning och fostrar en ny generation av personal för landets digitala ekonomi. Vårt uppdrag är att hjälpa unga människor att bli ledare för tekniska förändringar.
Bekantskap
1. Hälsningar
Dyka
1. Introduktion till datavetenskap
2. Dyk in i SQL
3. Big Data. Introduktion till MapReduce. Introduktion till Hadoop ekosystem
Verktyg för databehandling, analys och datavisualisering
1. Analysera data i Power BI
Big Data-verktyg
1. Apache Spark ramverk
Maskininlärningssystem
1. Statistik för nybörjare
2. Maskininlärning i företag
3. Grundläggande om neurala nätverk
Soft Skills och projektledning
1. Dataprojektledning
Komplettering
1. Kurssammanfattning och resultat