Generaliserade linjära modeller - kurs 3600 rub. från Öppen utbildning, utbildning 3 veckor, ca 6 timmar per vecka, Datum 29 november 2023.
Miscellanea / / December 01, 2023
Ett av villkoren för tillämpligheten av konventionella linjära modeller är oberoendet av observationer från varandra, på grundval av vilken modellen väljs. Men i praktiken finns det ofta situationer där materialinsamlingens utformning är sådan att ett brott mot detta villkor är oundvikligt. Föreställ dig att du bestämt dig för att bygga en modell som beskriver förhållandet mellan idrottsprestationer och IQ-testresultat bland elever. För att lösa detta problem gjorde du många prover på flera institutioner. Är det möjligt att kombinera sådana data till en analys, byggd enligt det traditionella schemat? Självklart inte. Studenter vid varje universitet kan likna varandra på något sätt. Även karaktären av sambandet mellan de storheter som studeras kan vara något annorlunda. Denna typ av data, där det finns intragruppskorrelationer, bör analyseras med hjälp av linjära blandade modeller. Vi kommer att visa att vissa prediktorer bör ingå i modellen som så kallade ”slumpfaktorer”. Du kommer att lära dig att slumpmässiga faktorer kan vara hierarkiskt underordnade. Vi kommer att diskutera hur sådana blandade modeller kan byggas för beroende variabler som följer olika typer av distributioner. Dessutom kommer vi att visa att den slumpmässiga delen av modellen kan vara ännu mer komplex – den kan ha en komponent som modellerar variansens beteende som svar på påverkan av en kovariat. I slutet av kursen hittar du ett projekt där du kan träna på att bygga blandade modeller genom att välja en av flera datamängder. Baserat på analysen av dessa data kan du skapa en rapport i traditionen av reproducerbar forskning.
Docent, Institutionen för ryggradslösa djurs zoologi, Biologiska fakulteten, St. Petersburg State University, Ph.D.
Vetenskapliga intressen: struktur och dynamik hos marina bentossamhällen, rumsliga skalor, succession, interspecifik och intraspecifik biotiska interaktioner, tillväxt och fortplantning av marina ryggradslösa djur, demografisk struktur hos populationer, mikroevolution, biostatistik.
Kursen består av 4 moduler:
1) Introduktion till generaliserade linjära modeller
Generaliserade linjära modeller (GLM) låter dig modellera beteendet hos kvantiteter som inte följer en normalfördelning. För att göra dina första steg i GLM-världen enklare kommer vi att analysera deras struktur med hjälp av exemplet GLM för normalfördelade kvantiteter - på så sätt kan du dra paralleller med enkla linjära modeller. Du kommer att lära dig vad en länkfunktion är, hur maximal sannolikhet fungerar och hur man testar GLM-hypoteser med Wald-tester och sannolikhetsförhållandetester.
2) Modellvalsproblem
I denna modul kommer vi att prata om metodologiska frågor som är förknippade med att bygga modeller. En modell är en förenklad representation av verkligheten och att välja mellan olika konkurrerande metoder för sådan förenkling är en frekvent uppgift för analytikern. I den här modulen får du lära dig att jämföra modeller med hjälp av informationskriterier. Vi kommer att diskutera de viktigaste alternativen för analysen vid val av modeller och prata om de svårigheter som uppstår i samband med den dolda mångfalden av modeller. Slutligen kommer vi att lära dig att känna igen huvudtyperna av missbruk av modellval (datafiske, p-hacking).
3) Generaliserade linjära modeller för att räkna data
I denna modul kommer vi att diskutera grundläggande metoder för att modellera räknebara storheter. Först kommer vi att diskutera varför konventionella linjära modeller inte är lämpliga för att räkna data. Egenskaperna för räknebara distributioner hjälper dig att förstå skillnaderna mellan typerna av GLM för räknebara data och funktionerna i deras diagnostik. Du kommer att se länkfunktionen på jobbet när du visualiserar GLM-förutsägelser på länkfunktionsskalan och på svarsvariabelskalan.
4) Generaliserade linjära modeller med binär respons
Ibland finns det ett behov av att simulera om någon händelse har inträffat eller inte, oavsett om fotbollslag eller förlorat, oavsett om patienten återhämtat sig efter behandling eller inte, om klienten begått köp eller inte. Konventionella linjära modeller är inte lämpliga för att modellera sådana binära data (händelser med två utfall), men detta kan enkelt göras med hjälp av generaliserade linjära modeller. I den här modulen kommer du att lära dig att modellera sannolikheterna för händelser som inträffar genom att representera dem som odds. Vi kommer att titta på hur logit link-funktionen fungerar och hur GLM-koefficienter tolkas när den används. Slutligen kommer du att kunna träna på att analysera generaliserade linjära modeller med olika fördelningar genom att genomföra ett dataanalysprojekt. Resultaten av denna analys kommer att behöva presenteras som en rapport i html-format, skriven med rmarkdown/knitr.
• Lär dig vilka färdigheter som behövs för att komma igång inom analys och datavetenskap • Lär dig använda Excel, SQL, Power BI, Google Data Studio för att arbeta med data och skriv din första kod i Python• Få en steg-för-steg-guide och lär dig hur du går in i datavetenskapsområdet och väljer en roll i Data Science
4,4
1 490 ₽