Bearbetning och analys av big data - gratis kurs från Open Education, utbildning 2 veckor, ca 36 timmar per vecka, Datum 29 november 2023.
Miscellanea / / November 30, 2023
Ph.D. Befattning: Docent, fakulteten för styrsystem och robotik, docent, Higher School of Digital Culture, ITMO University
Kandidat för fysikaliska och matematiska vetenskaper Befattning: Docent, Higher School of Digital Culture, ITMO University
Ph.D. Befattning: Docent, Higher School of Digital Culture, ITMO University
Modul 1 Ämne 1.1 Introduktion till datavetenskap Diskuterar typer och källor till data, principer separera och kombinera data, typer av vågar, metoder för datarensning och fyllning av luckor, kontroll intervall. Ämne 1.2 Databearbetningsverktyg Diskuterar primära databearbetningsverktyg, såsom kalkylblad (Google-kalkylblad och Excel), täcker frågorna om sortering och filtrering av data, metoder för aggregering och analys av tabelldata (pivottabeller) Ämne 1.3 Visualisering data Uppgifterna och metoderna för datavisualisering i olika verktyg (Google-kalkylblad och Excel), presentationsformer av kvantitativa och kvalitativa data. Kognitiv datavisualisering övervägs. Ämne 1.4 Analys och transformation av data Metoder för utjämning och normalisering av data, frågor om datatransformation beaktas. Typerna av beskrivande statistik och metoder för deras beräkning beskrivs i detalj. Ämne 1.5 Arbeta med tidsserier Principerna för att arbeta med tidsserier och metoder för deras analys beaktas. Särskild uppmärksamhet ägnas åt tekniker för att jämna ut tidsserier, bestämma trender och säsongsbetonade komponenter i tidsserier.
Modul 2 Big Data Storage Ämne 2.1. Databashanteringssystem Informationssystemens arkitektur och huvudfunktionerna i databashanteringssystem beaktas. Ämne 2.2. Designa strukturerad data Grundkoncepten för den relationella (tabellformiga) modellen beaktas data, designa data i en relationsmodell, regler för att skapa tabeller och definiera integritetsbegränsningar. Ämne 2.3. SQL - frågor till data och databasobjekt Principerna för att konstruera frågor till data i SQL-språket beaktas, inklusive projektion, sortering, inställning av urvalsvillkor, sammanfogning av flera tabeller, uppsättningsteoretiska operationer, kapslade förfrågningar. Föreläsningen diskuterar även databasobjekt - vyer, procedurer/funktioner, triggers. Konceptet med index är givet, vilket kan förbättra effektiviteten vid exekvering av ett antal frågor. Ämne 2.4. NoSQL-lagring De grundläggande begreppen och egenskaperna hos NoSQL-system, olika typer och klassificeringar av NoSQL-system beaktas: nyckel-värde, dokument, kolumn och graf. Principer för att bygga frågor till data i NoSQL-lagringar. Ämne 2.5. MongoDB - arbeta med dokumentlagring Diskuterar att organisera data och bygga frågor i MongoDB. Exempel på byggnadsfrågor i MongoDB-demodatabasen finns.