Maskininlärning i praktiken - kurs 41 500 rub. från IBS Training Center, träning 24 timmar, Datum 26 november 2023.
Miscellanea / / December 02, 2023
Kursen är uppbyggd kring flera praktiska fall innehållande tabeller med initialdata.
För varje fall går vi igenom hela livscykeln för ett maskininlärningsprojekt:
forskning, rengöring och beredning av data,
välja en träningsmetod som är lämplig för uppgiften (linjär regression för regression, slumpmässig skog för klassificering, K-medel och DBSCAN för klustring),
träning med den valda metoden,
resultatutvärdering,
modelloptimering,
presentation av resultatet för kunden.
Under diskussionsdelen av kursen diskuterar vi praktiska problem för studenter som kan lösas med de metoder som diskuterats.
Ämnen som behandlas:
1. Genomgång av uppgiften (teori – 1 timme)
Vilka problem löses bra med maskininlärning, och vilka problem försöker de lösa?
Vad händer om du istället för en Data Scientist anställer en icke-specialist inom området (bara en utvecklare/analytiker/manager) med förväntningen att de lär sig under processen.
2. Förberedelser, städning, dataforskning (teori – 1 timme, praktik – 1 timme)
Hur man förstår källans affärsdata (och i allmänhet upptäcker alla beställningar i den).
Bearbetningssekvens.
Vad kan och bör delegeras till domänanalytiker, och vad görs bäst av Data Scientist själv.
Prioriteringar för att lösa ett specifikt problem.
3. Klassificerare och regressorer (teori – 2 timmar, praktik – 2 timmar)
Praktiskt avsnitt - välformaliserade uppgifter med förberedda data.
Skillnad mellan uppgifter (binär/icke-binär/probabilistisk klassificering, regression), omfördelning av uppgifter mellan klasser.
Exempel på klassificering av praktiska problem.
4. Clustering (teori – 1 timme, praktik – 2 timmar)
Var och hur man genomför klustring: dataforskning, kontroll av problemformuleringen, kontroll av resultaten.
Vilka fall kan reduceras till klustring.
5. Modellutvärdering (teori – 1 timme, praktik – 1 timme)
Affärsmått och tekniska mått.
Mått för klassificering och regressionsproblem, felmatris.
Interna och externa mätvärden för klustringskvalitet.
Korsvalidering.
Bedömer omskolning.
6. Optimering (teori – 5 timmar, praktik – 3 timmar)
Vad gör en modell bättre än en annan: parametrar, funktioner, ensembler.
Inställningshantering.
Övning för val av funktioner.
Genomgång av verktyg för att hitta de bästa parametrarna, funktionerna och metoderna.
7. Diagram, rapporter, arbete med liveuppgifter (teori – 2 timmar, praktik – 2 timmar)
Hur man tydligt förklarar vad som händer: för dig själv, för teamet, för kunden.
Vackrare svar på meningslösa frågor.
Hur man presenterar tre terabyte resultat på en bild.
Halvautomatiska tester, vilka processkontrollpunkter som verkligen behövs.
Från levande uppgifter till en fullständig FoU-process ("FoU i praktiken") - analys och analys av uppgifter från publiken.