Linjär regression - kurs 4900 rub. från Öppen utbildning, utbildning 5 veckor, ca 2 timmar per vecka, Datum 29 november 2023.
Miscellanea / / November 29, 2023
Om korrelationsanalys gör det möjligt att kvantifiera styrkan och riktningen av sambandet mellan två storheter, så ger konstruktionen av regressionsmodeller större möjligheter. Med hjälp av regressionsanalys är det möjligt att kvantitativt beskriva beteendet hos de studerade storheterna beroende på prediktorvariabler och få förutsägelser på nya data. Du kommer att lära dig hur man bygger enkla och flera linjära modeller med R-språket. Varje metod har sina begränsningar, så vi hjälper dig att förstå i vilka situationer linjär regression kan och kan inte användas, och vi kommer att lära dig metoder för att diagnostisera valda modeller. En särskild plats i kursen ges till regressionsanalysens djupgående anatomi: du kommer att bemästra operationer med matriser som är grunden för linjär regression för att kunna förstå mer komplexa varianter av linjär modeller.
Om du ställs inför behovet av att söka och beskriva sambanden mellan vissa fenomen som kan mätas kvantitativt, då är denna kurs ett bra tillfälle att förstå hur enkel och multipel linjär regression fungerar, lära sig om dessas möjligheter och begränsningar metoder.
Kursen är utformad för dig som redan är bekant med de grundläggande teknikerna för dataanalys med R-språket och med skapandet av enkla .html-dokument med rmarkdown och knitr.
Vetenskapliga intressen: struktur och dynamik hos marina bentossamhällen, rumsliga skalor, succession, interspecifik och intraspecifik biotiska interaktioner, tillväxt och fortplantning av marina ryggradslösa djur, demografisk struktur hos populationer, mikroevolution, biostatistik.
Kursen består av 5 moduler:
1. Korrelationsanalys. Enkel linjär regression
Vi kommer att inleda vårt samtal om metoder för att numeriskt beskriva samband mellan kvantitativa storheter med kovarians och korrelationskoefficienter, vilket gör att vi kan uppskatta sambandets styrka och riktning. Då får du lära dig vilken ytterligare information om samband som kan erhållas genom att konstruera en linjär modell av sambandet mellan storheter. Du lär dig att tolka regressionskoefficienter och lära dig när och hur linjära modeller kan användas för att göra förutsägelser om nya data. I slutet av denna modul kommer du att lära dig hur du anpassar en linjär modellekvation och plottar den med ett konfidensområde.
2. Testa signifikans och validitet av linjära modeller
Att bygga en linjär modell och skriva ner dess ekvation är bara början på analysen. I den här modulen kommer du att lära dig hur man beskriver resultaten av regressionsanalys: hur man testar den statistiska signifikansen för den övergripande modellen eller dess koefficienter, och bedömer kvaliteten på passningen. Linjära modeller (eller snarare de statistiska tester som används för dem), som vilken metod som helst, har sina begränsningar. Du kommer att lära dig vad dessa begränsningar är och var de kommer ifrån. De grafiska diagnostiska metoderna som vi kommer att använda är universella för olika linjära modeller - mer övning hjälper dig att fatta beslut säkrare. När du förstår allt detta kan du skriva ett komplett skript i R för att passa, diagnostisera och presentera resultaten av en enkel linjär regression.
3. En kort introduktion till linjär algebras värld
I den här modulen kommer vi att dyka in i hjärtat av linjära modeller. För att göra detta måste du lära dig eller komma ihåg grunderna i linjär algebra. Vi kommer att diskutera de olika typerna av matriser, hur man skapar dem i R och grundläggande operationer med dem. Vi kommer att behöva allt detta för att förstå hur linjär regression fungerar från insidan. Du får lära dig vad en modellmatris är, lära dig att skriva en linjär regressionsekvation i form av matriser och hitta dess koefficienter. Du kommer med dina egna ögon att se hattmatrisen, som gör att du kan få predikterade värden, och du kommer till och med att kunna beräkna den manuellt. Slutligen kommer du att lära dig att beräkna restvariansen, varians-kovariansmatrisen, och använda allt detta för att bygga en regressionskonfidenszon. Då kommer denna kunskap att hjälpa dig att förstå strukturen av mer komplexa modeller: med diskreta prediktorer, med olika distributioner av residualer, med en annan struktur av variation-kovariansmatrisen.
4. Multipel linjär regression
Oftast är sambanden mellan storheter mer komplexa än vad som kan beskrivas med enkel linjär regression. Multipel linjär regression används för att beskriva hur en svarsvariabel beror på flera prediktorer. Med uppkomsten av flera prediktorer i modellen har linjär regression ett nytt villkor för tillämpbarhet - kravet på frånvaro av multikollinearitet. I den här modulen lär du dig att identifiera och undvika multikollinearitet. Slutligen finns det ofta fler variabler i flera modeller än vad som kan avbildas på ett plan, Det är därför vi kommer att lära dig enkla tekniker som hjälper dig att skapa informativ grafik även i detta fall.
5. Jämförelse av linjära modeller
Flera linjära modeller är som en konstruktionsuppsättning: mer komplexa modeller kan tas isär och förenklas. Du kommer att lära dig hur kapslade modelljämförelser med det partiella F-testet används för att testa signifikansen hos enskilda prediktorer eller grupper av prediktorer. Mer komplexa modeller beskriver bättre originaldata, men överdriven komplikation är farlig, eftersom sådana modeller börjar göra dåliga förutsägelser om nya data. Genom att använda partiella F-tester kan du förenkla modeller genom att gradvis eliminera icke-signifikanta prediktorer. Förenklade modeller är lättare att använda för att tolka och presentera resultat. Allt du har lärt dig hittills om linjär regression kan tillämpas genom att slutföra ett dataanalysprojekt där du behöver korrekt bygga en optimal multipellinjär modell och presentera dess resultat i en rapport skriven med hjälp av rmarkdown och stickr.