Մի օր տվյալների գիտնականի կյանքում

BrainStation-ի Data Scientist կարիերայի ուղեցույցը կարող է օգնել ձեզ առաջին քայլերն անել տվյալների գիտության ոլորտում շահութաբեր կարիերայի ուղղությամբ: Շարունակեք կարդալ այն մասին, թե ինչպես են տվյալների գիտնականներն իրենց օրերն անցկացնում աշխատավայրում:

Դարձեք տվյալների գիտնական

Խոսեք ուսուցման խորհրդատուի հետ՝ ավելին իմանալու համար, թե ինչպես կարող են մեր արշավները և դասընթացները օգնել ձեզ դառնալ տվյալների գիտնական:



Սեղմելով Ներկայացնել, դուք ընդունում եք մեր Պայմանները .



Ներկայացնել

Չհաջողվեց ներկայացնել: Թարմացնե՞լ էջը և նորից փորձել:

Իմացեք ավելին մեր Data Science Bootcamp-ի մասին

Շնորհակալություն!

Շուտով կապի մեջ կլինենք։



Դիտեք Data Science Bootcamp էջը

Մի օր տվյալների գիտնականի կյանքում

Brainstation-ի Digital Skills Survey-ում ուսումնասիրված բոլոր առարկաներից տվյալների գիտությունը կարող է ներառել կիրառությունների ամենալայն շրջանակը: Բայց չնայած տվյալների գիտությունը գոյություն ունի տասնամյակներ շարունակ, այն միայն վերջերս է լիարժեք ծաղկել: Քանի որ տվյալների հասանելիությունն ընդլայնվել է, ընկերությունները հասկացել են, թե որքան կարևոր կարող է լինել տվյալների գիտությունը, ասում է Բրիանա Բրաունելը, Pure Strategy-ի հիմնադիր և գործադիր տնօրեն և տվյալների գիտնական 13 տարի: Այժմ յուրաքանչյուր ընկերություն պետք է մասնակի կենտրոնանա տեխնոլոգիայի վրա: Հենց այս շաբաթ, օրինակ, McDonald’s-ը վճարել է մոտ 300 միլիոն ԱՄՆ դոլար՝ սեփական մեծ տվյալների ֆիրման ձեռք բերելու համար:

Հետևաբար, զարմանալի չէ, որ տվյալների գիտնականների մրցակցությունը աներևակայելի բարձր է: Ընդամենը երկու տարվա ընթացքում ակնկալվում է, որ պահանջարկը կաճի 28 տոկոսով, ինչը համարժեք է շուրջ 2,7 միլիոն նոր աշխատատեղի: Սա ավելի շատ բացեր է, քան նոր շրջանավարտները կկարողանան լրացնել, ինչը նշանակում է, որ այլ ոլորտների տեխնոլոգիական աշխատողները պետք է զարգացնեն իրենց հմտությունները և անցում կատարեն տվյալների՝ այս պահանջը բավարարելու համար:

Փաստորեն, մեր հարցումը ցույց է տալիս, որ դա արդեն տեղի է ունենում: Տվյալների հինգ մասնագետներից մոտավորապես չորսն իրենց կարիերան սկսել են այլ բան անելով, և տվյալների բոլոր գիտնականների 65 տոկոսը հինգ տարի կամ ավելի քիչ աշխատել է ոլորտում: Նոր մտքերի այս հսկայական հոսքը երկակի ազդեցություն ունի, ասում է Բրաունելը; Մի կողմից, շատ նոր գաղափարներ են գալիս, ասում է նա: Երբ ես նայում եմ տվյալների գիտության համայնքից դուրս եկող որոշ բովանդակության, ես զարմանում եմ, թե որքան նորարարություն կա: Շրջապատը, սակայն, անիվը նորից հորինելու միտում է:



Տվյալների գիտնականների մեծ պահանջարկը մեծ է, եթե դուք այդպիսին եք (կամ մտածում եք այդպիսին դառնալու մասին), բայց գործատուների համար հավաքագրումը կարող է սարսափելի մարտահրավեր լինել: Այստեղ վերապատրաստումը ակնհայտ լուծում է. կարող է ավելի ծախսարդյունավետ լինել տվյալների գիտության ոլորտում ներկայիս աշխատողի վերապատրաստումը, քան նորը փնտրելը:

Բայց նույնիսկ եթե դուք նախատեսում եք վարձել տվյալների գիտության նոր թիմ, ձեր կազմակերպությունը, որպես ամբողջություն, կարող է կարիք ունենալ զարգացնել իր տվյալների գրագիտությունը, զգուշացնում է Բրաունելը: «Յուրաքանչյուր ոք ցանկանում է աշխատել մի բանի վրա, որն ազդում է իրենց աշխատավայրի վրա, ինչը մարդկանց կյանքն ավելի լավ է դարձնում», - ասում է նա: Եթե ​​ձեր ընկերության մշակույթն այնպիսին չէ, որ [ձեր տվյալների գիտնականները] կարող են ազդեցություն ունենալ, աշխատանքի ընդունելը գրեթե անհնար է: Ղեկավարությունը պետք է կարողանա ոչ միայն հաղորդակցվել պոտենցիալ վարձու աշխատողներին, թե ինչպես նրանք կկարողանան նպաստել, այլ նաև ըմբռնելու իրենց տվյալների գիտության թիմի կողմից ի վերջո առաջ քաշած առաջարկները:

Ցավոք, Բրաունելը ասում է, որ անհարմար մեծամասնությունն այն ընկերություններն են, որոնք չեն հասկացել ամեն ինչ: Մեր հարցումը հաստատում է դա. հարցվածների մեծ մասը (52 տոկոս) իրենց կազմակերպություններում տվյալների գրագիտության մակարդակը բնութագրել են որպես հիմնական, իսկ հաջորդ ամենատարածված պատասխանը միջանկյալն է (31 տոկոս): Սա ենթադրում է, որ տվյալների գիտության վերաբերյալ որոշ հիմնարար դասընթացներ կարող են օգտակար լինել ընկերությունների մեծամասնության համար, հատկապես ղեկավարության ոլորտում:



Տվյալների գրագիտության և հաղորդակցության բարելավման անհրաժեշտությունը մեծանում է տվյալների գիտության թիմերի մեծ մասի կառուցվածքով. ): Այս սերտ թիմերը չեն կարող իրեն թույլ տալ մեկուսացված լինել: Անհատները, ովքեր աշխատում են ավելի մեծ ընկերություններում, սովորաբար փոքր տվյալների գիտության խմբում են, իսկ նրանց հաճախորդները ներքին են՝ կազմակերպության այլ մասեր, բացատրում է Բրաունելը, ուստի այն թիմ է, որը պետք է գործի կազմակերպության տարբեր ոլորտներում:

Ի՞նչ է կոնկրետ տվյալների գիտությունը:

Բրաունելը ասում է, որ ընդհանուր ընկալումը (որ տվյալների գիտնականները ճզմում են թվերը) այնքան էլ հեռու չէ նշագծից: Կան բազմաթիվ տվյալների հավաքածուներ, որոնք պետք է իրենցից բացահայտեն պատկերացումներ, և դա ներառում է բազմաթիվ քայլեր, ինչպիսիք են մոդելի կառուցումը և տվյալների մաքրումը, և նույնիսկ պարզապես որոշել, թե ինչ տվյալներ են ձեզ անհրաժեշտ: Այնուամենայնիվ, ի վերջո, այս ջանքերը նպատակաուղղված են. դրա հիմքում դուք պետք է ինչ-որ բան անեք տվյալների հետ:

Այդ դեպքում տվյալները միշտ չէ, որ թվեր են: Թեև հարցվածների մեծամասնությունը (73 տոկոս) նշել է, որ աշխատում է թվային տվյալների հետ, 61 տոկոսն ասել է, որ աշխատում է նաև տեքստի հետ, 44 տոկոսը՝ կառուցվածքային տվյալների, 13 տոկոսը՝ պատկերների և 12 տոկոսը՝ գրաֆիկայի հետ (իսկ փոքր փոքրամասնությունները նույնիսկ աշխատում են վիդեո և աուդիո: — համապատասխանաբար 6 տոկոս և 4 տոկոս): Այս հարցման արդյունքները հուշում են, թե ինչպես է տվյալների գիտությունը ընդլայնվում ֆինանսական աղյուսակներից դուրս՝ մարդկանց ներգրավելով այնպիսի նախագծերի համար, ինչպիսիք են հաճախորդների գոհունակությունը առավելագույնի հասցնելը կամ սոցիալական մեդիայի հրշեջ խողովակից արժեքավոր պատկերացումներ քաղելը:

Արդյունքում, տվյալների գիտության ոլորտում հսկայական բազմազանություն կա, ասում է Բրաունելը: Յուրաքանչյուր արդյունաբերություն ունի իր սեփական կարծիքը, թե ինչ տեսակի տվյալների վրա են աշխատում տվյալների գիտնականները, արդյունքների տեսակները, որոնք նրանք ակնկալում են, և ինչպես են դրանք համապատասխանում իրենց ընկերության ղեկավարության կառուցվածքին: Ամեն դեպքում, սակայն, նպատակն է օգտագործել տվյալները՝ օգնելու ընկերությանը ավելի լավ որոշումներ կայացնել: Դա կարող է լինել ապրանքները ավելի լավը դարձնելը, շուկան հասկանալը, որտեղ նրանք ցանկանում են մտնել, ավելի շատ հաճախորդներ պահելը, նրանց աշխատուժի օգտագործումը, հասկանալը, թե ինչպես կարելի է լավ վարձել, բոլոր տեսակի տարբեր բաներ:

Տվյալների գիտության աշխատատեղեր

Տեխնոլոգիայի որոշ ոլորտներում ընդհանուր մասնագետ դառնալը կարող է լինել ձեր լավագույն քայլը, և դա այդպես չէ տվյալների գիտության դեպքում: Գործատուները սովորաբար փնտրում են իրենց ոլորտում մասնագիտացված հմտություններ: Քանի որ տվյալների գիտությունը շատ տարբեր ձևերով է, մեր հարցումն ավելի խորն է ուսումնասիրել՝ ուսումնասիրելով աշխատանքի հինգ հիմնական կատեգորիաները՝ տվյալների վերլուծաբան, հետազոտող, բիզնես վերլուծաբան, տվյալների և վերլուծության մենեջեր և համապատասխան տվյալների գիտնական:

Այս բոլոր աշխատատեղերի վերնագրերում տվյալների վեճը և մաքրումը խլում են մարդու ժամանակի մեծ մասը, բայց ի՞նչ նպատակով: Ամենից հաճախ նպատակը գոյություն ունեցող պլատֆորմի, արտադրանքի կամ համակարգի օպտիմալացումն է (45 տոկոս), կամ մշակել նորերը (42 տոկոս): Ավելի խորանալով, մենք պարզեցինք, որ գոյություն ունեցող լուծումների օպտիմալացումը հակված է բիզնես վերլուծաբաններին և տվյալների վերլուծաբաններին, մինչդեռ նոր լուծումների մշակումն ավելի հաճախ բաժին է ընկնում տվյալների գիտնականներին և հետազոտողներին:

Տվյալների գիտնականների կողմից օգտագործվող տեխնիկաները նույնպես տարբերվում են մասնագիտացումներից: Գծային ռեգրեսիան տարածված գործիք էր բոլոր կատեգորիաներում, որին վկայակոչել է հարցվածների 54 տոկոսը, բայց մի քանի անակնկալ եղավ, երբ մենք նայեցինք մարդկանց կողմից օգտագործվող ծրագրերին:

Excel-ը, որը տվյալների հավաքածուի մանիպուլյացիայի աշխատանքային խումբն է, գործնականում ամենուր է, որը վկայակոչել է բոլոր հարցվածների 81 տոկոսը, և ամենահայտնի գործիքը բոլոր կատեգորիաներում, բացառությամբ տվյալների գիտնականների (որոնք ամենից հաճախ ապավինում են Python-ին, ինչպես նաև նշել են ավելի մեծ գործիքակազմ, քան մյուս կատեգորիաները: ): Ի՞նչն է դարձնում Excel-ն այդքան անխուսափելի, նույնիսկ 2019 թվականին:

Այն, ինչ ես սիրում եմ Excel-ում, այն է, թե ինչպես է այն թույլ տալիս տեսնել տվյալները և ստանալ դրանց ինտուիտիվ զգացողություն, բացատրեց Բրաունելը: Մենք նաև օգտագործում ենք շատ Python, և այդ դեպքում, երբ դուք վերլուծություն եք անում տվյալների ֆայլի վրա, այն թաքնված է. եթե դուք հատուկ չեք ծրագրավորել ձեր կոդի մի մասը՝ ձեր վերլուծվող չմշակված տվյալների որոշակի վիզուալիզացիայի համար, դուք դա չեք տեսնում: Մինչդեռ Excel-ի դեպքում այն ​​հենց ձեր առջև է: Դա շատ առավելություններ ունի։ Երբեմն դուք կարող եք նկատել տվյալների ֆայլի հետ կապված խնդիրներ: Ես չեմ տեսնում, որ Excel-ը երբևէ անհետանում է վերլուծությունից:

Ասված է, որ դեռևս կա ոլորտում օգտագործվող այլ ծրագրերի երկար ցուցակ, ինչը զարմանալի չէ, հաշվի առնելով դրա բազմազանությունը: SQL-ը (43 տոկոս) և Python-ը (26 տոկոս) առաջատար են իրենց ժողովրդականությամբ, որտեղ Tableau-ն (23 տոկոս), R-ն (16 տոկոս), Jupyter Notebook-ները (14 տոկոս) և մի քանի ուրիշներ, զգալի թվեր են հավաքում, էլ չասած հսկայական թվերի մասին: Հարցվածների 32 տոկոսը, ովքեր մեջբերել են այլ գործիքներ, նույնիսկ հաշվի առնելով այս արդեն երկար ցուցակը:

Ո՞րն է տվյալների գիտության ապագան:

Ի վերջո, մենք հարցրինք, թե ինչ միտումներ կձևավորեն թվային լանդշաֆտը առաջիկա հինգից 10 տարիների ընթացքում: Մեքենայական ուսուցումը և արհեստական ​​ինտելեկտը, որոնք երկուսն էլ կիրառություն ունեն տվյալների գիտության մեջ, ճնշող մեծամասնությամբ այն զարգացումներն էին, որոնց հարցվածներն ակնկալում են, որ ամենամեծ ազդեցությունը կունենան՝ համապատասխանաբար 80 և 79 տոկոս: Սա չնայած այն հանգամանքին, որ նրանց մեկ քառորդից պակասը (23 տոկոս) ներկայումս աշխատում է AI-ի հետ:

Արհեստական ​​ինտելեկտը կարող է բացարձակապես փոխակերպել տվյալների գիտությունը, հաստատում է Բրաունելը, որի ընկերությունը զարգացնում է AI արտադրանքները։ Դա իսկապես չվերահսկվող ուսուցման մեթոդների փառքն է: Մենք միայն այնքան ժամանակ ունենք այս տվյալների հավաքածուները դիտելու համար, և հատկապես մեծերի դեպքում, շատ դժվար է ամեն ինչ անել: AI գործիքները կարող են օգնել բացահայտել մի բան, որը գուցե չէիք մտածի փնտրել: Մեզ մոտ դա հաստատ տեղի է ունեցել:

Այլ միտումներ Տվյալների գիտնականները ակնկալում են, որ մոտ ապագայում գերիշխեն՝ իրերի ինտերնետը (51 տոկոս), բլոկչեյնը (50 տոկոս) և էլեկտրոնային առևտուրը (36 տոկոս), ընդլայնված իրականությունը և վիրտուալ իրականությունը (38 տոկոս և 27 տոկոս), և նույնիսկ ձայնային- հիմնված փորձառություններ (25 տոկոս)՝ բոլոր նշանակալից ցուցադրությունները և բոլոր ոլորտները, որտեղ տվյալների գիտությունը կարող է լավ օգտագործվել: