MLOps - árfolyam 80 000 dörzsölje. Otustól, képzés 5 hónap, dátum 2023. november 30.
Vegyes Cikkek / / November 30, 2023
Elsajátítja az adatok streameléséhez és az elosztott környezetekhez szükséges gépi tanulási készségeket. A program tartalmazza a szükséges ismereteket az adattudomány és az adatmérnökség területéről, amely lehetővé teszi a nagy adatok feldolgozását és az elosztott algoritmusok írását a Sparkban.
Minden modult házi feladat kitöltésével fog gyakorolni. A képzés végén lesz egy záró projekted, amely lehetővé teszi az összes megszerzett tudás összefoglalását és portfóliójának kiegészítését. Elvégezhető az adatkészleten végzett munkafeladatok részeként, vagy egy tanulási projekt is lehet az OTUS által szolgáltatott adatok alapján.
Kinek szól ez a tanfolyam?
Gépi tanulással foglalkozó szakembereknek vagy szoftvermérnököknek, akik szeretnének megtanulni, hogyan kell kezelni a nagy adathalmazokat. Jellemzően nagy informatikai cégeknél vannak ilyen feladatok nagyméretű digitális termékkel.
Adattudósoknak, akik mérnöki készségekkel szeretnék megerősíteni képességeiket. A tanfolyamnak köszönhetően képes lesz az adatok feldolgozására és az ML megoldások eredményeinek önálló megjelenítésére a termelésben.
A tanuláshoz alapvető adattudományi készségekre lesz szüksége. Javasoljuk, hogy tekintse meg az OTUS Map of Data Science kurzusait, hogy megtudja a szükséges képzési szintet.
Tanulni fogsz:
- Szabványos ML pipeline eszközök használata elosztott környezetben;
- Saját blokkok fejlesztése ML csővezetékekhez;
- Az ML algoritmusok adaptálása elosztott környezetekhez és big data eszközökhöz;
- Spark, SparkML, Spark Streaming használata;
- Algoritmusok kidolgozása adatfolyam-előkészítéshez a gépi tanuláshoz;
- Minőségellenőrzés biztosítása az ML-megoldások ipari üzembe lépésének minden szakaszában.
Szakemberek iránti kereslet
Azok a készségek, amelyeket el fog sajátítani, a lehető leghasznosabbak és ígéretesek. Egyre több digitális termék jelenik meg a piacon, amelyek fejlesztéséhez big data és stream feldolgozással kell dolgozni. Már most 270 ezres fizetésre jogosultak az ilyen szaktudással és némi munkatapasztalattal rendelkező szakemberek. rubel Egy másik tendencia - a képzési és érvényesítési folyamatok automatizálása, éppen ellenkezőleg, valamilyen módon leértékeli a klasszikus Data Scientist munkáját. Minden afelé halad, hogy még egy nem szakember is meg tudjon jósolni. Ezért azok, akik legalább felületes mérnöki ismeretekkel rendelkeznek, már prémiumban vannak.
A tanfolyam jellemzői
Sok gyakorlat az adatokkal való munka során
Szakértelem széles skálája az elosztott ML és adatfolyam-feldolgozástól a termelési kimenetig
Jelenlegi eszközök és technológiák: Scala, Spark, Python, Docker
Élő kommunikáció szakértőkkel webináriumokon és Slack chaten
4
tanfolyamRészt vesz egy Data Science csapat fejlesztésében, amely gépi tanuláson alapuló funkcionalitást biztosít a vállalat termékeihez és szolgáltatásaihoz. Adattudósként részt vett a Kaspersky MLAD és az MDR AI Analyst fejlesztésében. BAN BEN...
Részt vesz egy Data Science csapat fejlesztésében, amely gépi tanuláson alapuló funkcionalitást biztosít a vállalat termékeihez és szolgáltatásaihoz. Adattudósként részt vett a Kaspersky MLAD és az MDR AI Analyst fejlesztésében. C++ fejlesztőként részt vett a MaxPatrol SIEM létrehozásában, évek óta tanít számítógépet. tudományos tudományok az MSTU GA-n. Az ML, C++, DS projektmenedzsmentről és -fejlesztésről szóló jelentéssorozat szerzője csapatok. A C++ Russia PC konferencia tagja. Program menedzser
8
tanfolyamok20+ év tapasztalat egyedi fejlesztési projektekben IT területen. Több tucat sikeres projekt, beleértve azokat is, amelyek állami szerződések alá tartoznak. ERP rendszerek, nyílt forráskódú megoldások fejlesztésében és bevezetésében szerzett tapasztalat, nagy terhelésű alkalmazások támogatása. Tanfolyamok tanára a...
20+ év tapasztalat egyedi fejlesztési projektekben IT területen. Több tucat sikeres projekt, beleértve azokat is, amelyek állami szerződések alá tartoznak. ERP rendszerek, nyílt forráskódú megoldások fejlesztésében és bevezetésében szerzett tapasztalat, nagy terhelésű alkalmazások támogatása. Linux, Kuber, MLOps, DataOps, SolutionArchitect, IaC, SRE tanfolyamok tanára, valamint a HighLoad kurzus mentora
1
jólBig data és gépi tanulás specialistája. 8 évig az Odnoklassniki.ru-nál dolgozott. Irányította az OK Data Lab csapatát (laboratórium a big data és gépi...
Big data és gépi tanulás specialistája. 8 évig az Odnoklassniki.ru-nál dolgozott. Irányította az OK Data Lab csapatát (a big data és a gépi tanulás területén dolgozó kutatók laboratóriuma). Az Odnoklassnikiben végzett nagy adatelemzés egyedülálló lehetőséggé vált az elméleti képzés és a tudományos alapozás összekapcsolására valódi, keresett termékek fejlesztésével. 2019 óta a Sberbanknál dolgozik ügyvezető igazgatóként. A tömeges személyre szabási divízióban az ajánlási rendszerek platformjának fejlesztéséért felelős klaszter vezetőjeként működik. 2004-ben szerzett diplomát a Szentpétervári Állami Egyetemen, ahol 2007-ben védte meg PhD fokozatát formális logikai módszerekből. Közel 9 évig dolgoztam outsourcingban anélkül, hogy elveszítettem volna a kapcsolatot az egyetemmel és a tudományos környezettel.
Alapvető bevezetés a tanfolyam megkezdéséhez
-Téma 1. Gradiens süllyedés és lineáris modellek
-2. témakör. Az alapvető gépi tanulási módszerek és mérőszámok áttekintése
- 3. téma. Az adatokkal való munka megközelítéseinek fejlődése
-4. témakör. A Scala programozási alapjai
Az elosztott adatfeldolgozás technológiai alapjai
-5. témakör. Elosztott fájlrendszerek
-6. témakör. Erőforrás menedzserek elosztott rendszerekben
- 7. témakör. Masszívan párhuzamos és elosztott számítási keretrendszerek fejlődése
- 8. téma. Apache Spark 1 alapok
- 9. téma. Apache Spark 2 alapjai
Elosztott ML alapok
-10. témakör. ML algoritmusok átvitele elosztott környezetbe
-Topic 11.ML az Apache Sparkban
- 12. témakör. Saját blokkok fejlesztése a SparkML-hez
- 13. témakör. A hiperparaméterek és az AutoML optimalizálása
Stream feldolgozás
-Téma 14. Stream adatfeldolgozás
- 15. témakör. Harmadik féltől származó könyvtárak a Sparkkal való használatra
-16. téma. Spark Streaming
-17. téma. Strukturált és folyamatos streamelés a Sparkban
-18. témakör. Alternatív streaming keretrendszerek
Célkitűzés és eredmények elemzése
-19. témakör Az ML projekt céljának meghatározása és előzetes elemzés
-20. témakör. Hosszú távú ML célok a lemorzsolódás csökkentésének feladatának példáján
-21.A/B témakör tesztelése
-22. téma.További témák
Az ML eredmények kiadása a termelésbe
-23. témakör. Az ML megoldások termelésbe hozásának megközelítései
- 24. téma.Verziózás, reprodukálhatóság és monitorozás
-Téma 25. Modellek online kiszolgálása
-26. témakör. Minták az aszinkron ML és ETL adatfolyamokhoz
-27. téma. Ha Pythonra van szüksége
ML Pythonban élesben
-28. témakör. Gyártási kód Pythonban. Szervező és csomagolási kód
-Topic 29.REST architektúra: Flask API
-Téma 30.Docker: Felépítés, alkalmazás, telepítés
-Téma 31.Kubernetes, konténer hangszerelés
-32. téma. MLOPS eszközök Kuberneteshez: KubeFlow, Seldon Core. A heterogén rendszerek működésének jellemzői az iparban.
-33. téma. Amazon Sagemaker
-Téma 34.AWS ML szolgáltatás
Haladó témák
-35. témakör. Neurális hálózatok
-36. témakör. Neurális hálózatok elosztott tanulása és következtetése
- 37. téma: Gradiens növelése fákon
-Téma 38. Megerősítő tanulás
Projekt munka
-39. témakör Témaválasztás és projektmunka szervezése
-Téma 40. Konzultáció projektekről és házi feladatokról
-41. témakör. Tervezési munka védelme