KTU alumnas, „SEB Global Services“ Duomenų techninis vadovas K. Daugėla: duomenų mokslininkai „karaliauja“ verslo pasaulyje
Šiandien duomenys kaupiami, apdorojami ir naudojami priimant sprendimus bene visose verslo ir pramonės srityse – tai tapo neatsiejama mūsų kasdienybės dalimi. Su KTU Matematikos ir gamtos mokslų fakulteto (MGMF) absolventu – dabar jau „SEB Global Services“ Duomenų techniniu vadovu Kęstučiu Daugėla – kalbamės apie MGMF ir verslo sanglaudą ugdant duomenų mokslininkus ir duomenų inžinierius.
– Kęstuti, ne paslaptis, kad duomenys ir duomenų mokslo/inžinerijos sprendimai yra būtini beveik bet kokiam verslui. Viešajam sektoriui taip pat. Kodėl tai taip svarbu? Kodėl duomenys dabar vadinami vertingiausia XXI amžiaus žaliava?
– Visų pirma, remdamiesi turimais duomenimis, bet kokia organizacija gali įvertinti, kaip jai sekasi – tiek rinkoje, tiek vidiniuose procesuose. Priklausomai nuo šių metrikų, organizacija gali priimti vienokius ar kitokius duomenimis grįstus sprendimus. Tačiau tai tik pradžia – šiuo metu beveik visų sėkmingiausių įmonių žaliava yra duomenys – tiek „Google“, tiek „Facebook“, o ką jau bekalbėti apie „Uber“, „Bolt“, „Airbnb“, „Netflix“ ar kitas kompanijas.
Vartotojai taip pat yra įpratę prie to, kad jų mėgstamos aplikacijos „žino“, ką jiems „patarti“ – kur geriau keliauti, kokį maistą užsisakyti, kokią prekę pirkti. Šalia vartotojo patogumo, iš didžiulio kiekio surinktų duomenų, yra daromi atradimai medicinos, fundamentalių mokslų ar sociologijos srityse. Informacija apie vartotojus turi didelę vertę, tačiau įmonės turi elgtis etiškai ir vartotojų sąskaita. Dėl šių priežasčių vis daugiau kalbama ir apie etišką dirbtinį intelektą (DI).
– Karščiausia amžiaus profesija dažnai tituluojama duomenų mokslininko profesija – ji jau ne vienus metus karaliauja įvairių darbų reitingų viršūnėse, kalbama, kad specialistų paklausa auga ir toliau augs. Tiesa? Kokios tendencijos šiuo metu vyrauja Lietuvoje? O pasaulyje?
– Duomenų mokslininkai, kaip specialistai, iš tiesų „karaliauja“ verslo pasaulyje, bet įmonėms labai svarbu turėti ne tik gerus duomenų mokslininkus (matematikus, modeliavimo specialistus), bet ir gerus duomenų inžinierius, kurie turi padėti pamatą visai duomenų ekosistemai.
Kad ir koks geras duomenų mokslininkas bebūtų, jis nesugebės efektyviai dirbti be tinkamai paruoštos infrastruktūros. O jeigu ir sugebės, tai reikš, jog didelę savo laiko dalį, bent jau pradžioje, praleis infrastruktūriniams darbams.
Dėl šios priežasties dažnai yra išskiriamos bent dvi duomenų mokslininkų kryptys – tie, kurie užsiima modeliavimu ir tie, kurie prižiūri „logistikos“ reikalus – duomenų srautus ir mašininio mokymosi algoritmų integravimą į juos, jų optimizavimus greitiems ir teisingiems skaičiavimams. Dar galima išskirti ir trečią duomenų mokslininkų sritį – tai tie, kurie tiesiogiai daro įtaką verslo sprendimų priėmimui, remdamiesi duomenų analize, dažnai – ad-hoc.
– Kaip manote, kokie yra pagrindiniai įgūdžiai, būtini sėkmingam duomenų mokslininkui/duomenų inžinieriui? Ar lengva rasti naują komandos narį? Ar turite iš ko rinktis?
– Nors gali skambėti ir banaliai, tačiau vienas iš pagrindinių kriterijų, pagal kuriuos renkamės komandos narius (šiuo atveju kalbu daugiau apie duomenų inžinierius) – noras mokytis ir aistra šiai profesijai.
Teko pergyventi ne vieną paradigmos pasikeitimą – iš pradžių atrodė, kad „duomenų ežero“ koncepcija išgelbės pasaulį, tačiau dabar ryškiai dominuoja debesijos kompiuterijos tendencijos „data mesh“ kontekste. Žinoma, nereikėtų pamiršti ir „streaming‘o“ bei reliacinių duomenų bazių technologijų. Pagrindiniai principai dažnai išlieka, tačiau atsižvelgiant į basikeičiantį technologijų paveikslą, būtinas darbuotojų imlumas naujoms technologijoms.
Naujo komandos nario paieška yra nelengva – nepaisant to, kokias žinias žmogus turi, būtina, jog jis taip pat mokėtų dirbti komandoje bei tinkamai komunikuoti. Pasirinkimo lyg ir yra, ypač iš KTU, tačiau jauniems specialistams šiek tiek trūksta praktinių įgūdžių. Todėl labiausiai vertinami tie būsimieji specialistai, kurie jau yra dalyvavę projektinėje veikloje ir turi sukaupę tam tiktų praktinių įgūdžių.
– Aukštosios mokyklos stengiasi reaguoti į rinkos pokyčius, yra viena iš duomenų mokslo ekosistemos svarbių dalių. Ar jos daro pakankamai? Štai KTU MGMF prieš dvejus metus startavo nauja bakalauro programa „Duomenų mokslas ir inžinerija“. Taikomosios matematikos absolventai taip pat turi išskirtinių kompetencijų darbui su duomenimis. Ką manote apie šias fakulteto pastangas užpildyti specialistų trūkumą?
– Šias pastangas vertinu labai teigiamai. Svarbiausia suprasti, jog studijų tobulinimas, ypač šioje srityje, yra tęstinis procesas – reikia atsižvelgti ne tik į rinkos poreikius, bet ir į mokslinių tyrimų tendencijas, tuo pat metu neatsisakant pamatinių dalykų – matematikos, algoritmų.
Tai nėra trivialus uždavinys ir netgi čia reikia spręsti savotišką matematinės optimizacijos problemą – norime maksimizuoti būsimojo specialisto gebėjimus besikeičiančioje infrastruktūroje turint laiko (šiuo atveju – ketverius metus) ir aktualumo apribojimus. Dėl to ypač vertinu tai, jog šios studijos pradedamos jau bakalauro laikotarpiu – studentai turi daugiau laiko įgauti tinkamus pamatus ir pamatyti įvairius duomenų mokslo aspektus.
Tokiu atveju tolesnė specializacija yra kur kas lengvesnė – turint bazines duomenų mokslo ir inžinerijos žinias, galima rinktis praktiškai bet kurią sritį, netgi nebūtinai tiesiogiai susijusią su IT.
Asmeniškai man teko jau antrus metus dėstyti jūsų „Duomenų mokslo ir inžinerijos“ studijų pirmakursiams. Tiek iš savo, tiek iš kitų studentų patirčių galiu pasakyti, kad studentai dega noru įgyti praktinių žinių ir labai vertina jūsų fakulteto iniciatyvas kviesti dėstytojus iš verslo. Studentai pamato, kokios yra jų besimokomų dalykų pritaikymo galimybės versle ir kaip tinkamai atskleidžiamas tokių tarpdisciplininių specialybių, kaip ši, grožis.
– Studijuoti taikomąją matematiką, duomenų mokslą ar duomenų analitiką nėra lengva. Panašu, kad jaunimas bijo rinktis „kietesnes“ studijas? Ką galėtumėte patarti tiems, kuriuos žavi duomenų analitika, bet nedrįsta pasukti sunkesniu keliu? Visgi, ir pats esate baigęs matematikos studijas?
– Didžiausia klaida yra rinktis tai, kas populiaru šiandien arba stoti į studijas vien dėl potencialiai nemažo būsimo darbo užmokesčio. Svarbiausia, kaip ir anksčiau minėjau, – aistra būsimai profesijai. Todėl būsimiems studentams siūlyčiau ne tik pasidomėti, ką jie studijuos, bet ir išbandyti tai praktiškai; ypač tai aktualu renkantis magistro studijas.
Nesiūlau rinktis ir to, ką būtų lengviau studijuoti – rinkdamiesi studijas visada galvokite apie tai, ką norėtumėte veikti po ketverių ar šešerių metų, kokioje srityje save matytumėte.
Niekada neapsiriksite pasirinkę fundamentaliuosius ar taikomuosius mokslus (pvz., matematiką, duomenų inžinerijos technologijas, duomenų analitiką), nes visuomet išlieka galimybė tiek kardinaliai, tiek nežymiai pakeisti savo karjeros kryptį.
Pavyzdžiui, aš esu baigęs taikomosios matematikos studijas, tačiau dirbu duomenų inžinerijos srityje. Neseniai pradėjau studijuoti ir doktorantūros programoje, nes mano tikslas – pagilinti savo žinias plačiau būtent IT srityje.
Iš savo patirties galiu pasakyti, kad tiek matematikai, tiek duomenų analitikai, duomenų mokslininkai ar duomenų inžinieriai darbo rinkoje yra vertinami puikiai – jie puikiai adaptuojasi prie besikeičiančios verslo aplinkos ir yra imlūs naujovėms.
– O jei žvelgtume globaliai – visos tos pribloškiančios DI technologijos, kasmet sugeneruojami eksabaitai ir terabaitai duomenų. Ar išdrįstumėte nuspėti, kas mūsų laukia ateityje?
– Visų pirma – dar didesnis duomenų mokslo prieinamumas ir informacijos skaitmenizavimas. Jei seniau tam tikrų profesijų darbuotojai galėdavo išsisukti vien su naršykle, el. paštu ir „PowerPoint“ skaidrių pateiktimis, tai dabar dažnai kalba krypsta apie švieslentes, įvairias metrikas ir net mašininio mokymosi algoritmus.
Šių laikų technologijos leidžia rašyti programinį kodą ir neturint programavimo žinių – užtenka tik surašyti instrukcijas dirbtiniam intelektui. Tokiu pat principu galima „gaminti“ ir mašinino mokymosi modelius, sukurti fizinę serverių infrastruktūrą, naudojant tik grafinę vartotojo sąsają ar deklaratyvias išraiškas kode debesijoje bei galybė kitų pavyzdžių.
Po truputį viskas pereina į aukštesnį abstrakcijos lygį, kas patogu žmonėms, kuriems reikalingas sprendimas „čia“ ir „dabar“, tačiau tai padidina sistemos kompleksiškumą.
Todėl nepaisant didesnio kitų sričių dalyvių įsitraukimo į duomenų mokslą, stipriai išlieka ir rimtų profesionalų poreikis darbo rinkoje, jau nekalbant apie mokslinius tyrimus ar pačios programinės įrangos kūrimą.
– Ar sugebėsime su tuo susitvarkyti? Ir ką reikėtų daryti, kad pavyktų?
Tol, kol universitetuose yra dėstomi tikslieji mokslai – tikrai susitvarkysime. Duomenų mokslas ir duomenų analizė yra be galo įdomios sritys, o tai ir vilioja jaunuosius specialistus, kurie nori iššūkių darbe.