Gépi tanulás a gyakorlatban - tanfolyam 41 500 dörzsölje. az IBS Oktatóközpontból, 24 órás képzés, Időpont: 2023. november 26.
Vegyes Cikkek / / December 02, 2023
A kurzus több gyakorlati eset köré épül fel, amelyek kiindulási adatokat tartalmazó táblázatokat tartalmaznak.
Minden esetben egy gépi tanulási projekt teljes életciklusán megyünk keresztül:
adatok kutatása, tisztítása és előkészítése,
a feladatnak megfelelő képzési módszer kiválasztása (regresszióhoz lineáris regresszió, osztályozáshoz véletlenszerű erdő, klaszterezéshez K-közép és DBSCAN),
képzés a választott módszerrel,
eredmény értékelése,
modell optimalizálás,
az eredmény bemutatása az ügyfélnek.
A tantárgy vitarésze során megbeszéljük a hallgatók előtt álló gyakorlati problémákat, amelyek a tárgyalt módszerekkel megoldhatók.
Lefedett témakörök:
1. A feladat áttekintése (elmélet – 1 óra)
Milyen problémákat old meg jól a gépi tanulás, és milyen problémákat próbálnak megoldani?
Mi történik, ha egy Data Scientist helyett egy, a területen nem szakértőt (csak egy fejlesztőt/elemzőt/menedzsert) alkalmaz, azzal az elvárással, hogy közben tanulni fog.
2. Előkészítés, takarítás, adatkutatás (elmélet – 1 óra, gyakorlat – 1 óra)
Hogyan lehet megérteni a forrás üzleti adatokat (és általában észlelni minden sorrendet bennük).
A feldolgozás sorrendje.
Mit lehet és kell delegálni a tartományelemzőkre, és mit tehet a legjobban maga a Data Scientist.
Egy adott probléma megoldásának prioritásai.
3. Osztályozók és regresszorok (elmélet – 2 óra, gyakorlat – 2 óra)
Gyakorlati rész - jól formalizált feladatok előkészített adatokkal.
Feladatok közötti különbség (bináris/nem bináris/valószínűségi osztályozás, regresszió), a feladatok osztályok közötti újraelosztása.
Példák a gyakorlati problémák osztályozására.
4. Klaszterezés (elmélet – 1 óra, gyakorlat – 2 óra)
Hol és hogyan kell klaszterezést végezni: adatkutatás, problémafelvetés ellenőrzése, eredmények ellenőrzése.
Milyen esetek redukálhatók klaszterezésre.
5. Modell értékelés (elmélet – 1 óra, gyakorlat – 1 óra)
Üzleti és műszaki mérőszámok.
Metrikák osztályozási és regressziós problémákhoz, hibamátrix.
A klaszterezés minőségének belső és külső mérőszámai.
Keresztellenőrzés.
Az átképzés értékelése.
6. Optimalizálás (elmélet – 5 óra, gyakorlat – 3 óra)
Mitől jobb az egyik modell a másiknál: paraméterek, jellemzők, együttesek.
Beállítások kezelése.
Funkcióválasztási gyakorlat.
A legjobb paraméterek, jellemzők és módszerek megtalálására szolgáló eszközök áttekintése.
7. Grafikonok, jelentések, élő feladatokkal való munka (elmélet – 2 óra, gyakorlat – 2 óra)
Hogyan magyarázd el egyértelműen, mi történik: önmagadnak, a csapatnak, az ügyfélnek.
Szebbnél szebb válaszok értelmetlen kérdésekre.
Hogyan lehet három terabájtnyi eredményt bemutatni egy dián.
Félautomata tesztek, mely folyamatvezérlő pontokra van igazán szükség.
Az élő feladatoktól a teljes K+F folyamatig („K+F a gyakorlatban”) – a közönségtől származó feladatok elemzése és elemzése.