Подаци су осетљива тема и ви ћете, наравно, много тога бити у близини као научник података. Ево неколико правила којих се увек треба придржавати.
Подаци су изузетно драгоцени, а њихово коришћење је лако једна од најбољих пракси за већину организација данас. Али познавање индустријских стандарда у вези са овим је неопходно да научници података не греше са подацима док људи сазнају више о њиховој вредности.
Као такви, научници података морају прихватити безбедне и етичке праксе и усвојити стандардизоване. Уместо разматрања колико су само подаци вредни, мудро је преиспитати методе добијања и обраде података за било коју сврху. Дакле, ево девет кодекса понашања које сваки научник података треба да поштује.
1. Придржавајте се прописа
Научници података морају познавати прописе о заштити података који важе за одређене послове. У супротном, можете несвесно прекршити закон и изложити себе и друге ризику. Дакле, ово знање је кључно за осигурање етичког рада и спречавање нежељене штете.
Као такав, проверите релевантне законе пре него што се упустите у било коју активност. Штавише, немојте само поштовати прописе да бисте следили правила; такође тражити дубље разумевање њих. Да бисте правилно поштовали прописе, морате знати зашто су постављени и од чега штите.
Неколико важних закона о приватности су Општа уредба ЕУ о заштити података (ГДПР) и Калифорнијског закона о приватности потрошача (ЦЦПА). Други укључују ХИИПА, ДПА, ПИПЕДА, ЛГПД и многе прописе специфичне за индустрију.
2. Поштујте приватност
Адресе, е-маилови и ИД-ови су идентификатори који не би требало да буду јавни јер представљају стварни ризик за људе. Стога се побрините да ове детаље учините што приватнијим.
Ако буду изложене, жртве би могле да претрпе крађу идентитета или преваре. Такође би могли бити уцењени од стране људи који прете да ће објавити њихове поверљиве информације. Штавише, професионалци могу да претрпе штету репутацији и узнемиравање на мрежи када се њихове личне преференције објаве. Ово може утицати на њихове односе, могућности за каријеру и друштвени положај.
Дакле, имајући то на уму, истражите и изаберите ефикасне начине за побољшање сигурни онлајн идентитети и деидентификовати податке. На пример, можете заменити знакове, уклонити директне идентификаторе или генерализовати. Овим ћете штитити осетљиве податке од сајбер криминалаца, а истовремено помажете организацијама са вашим налазима.
3. Елиминишите пристрасност
Научници података ослањају се на статистику да би били што објективнији. Ипак, упркос овим напорима, пристрасност и даље постоји јер је идеја да су већи подаци тачнији једна од уобичајени митови науке о подацима.
Постоји нешто истине у томе, али нажалост, велики подаци понекад садрже непотребне или лажне елементе и статистике. Дакле, уместо да се фокусирате само на бројке, уверите се да су ваши подаци чисти и репрезентативни.
Чишћење или филтрирање података пре употребе су одличне методе борбе против пристрасности. На пример, можете проверити грешке или користити стратификовано узорковање да бисте обезбедили репрезентативне податке.
4. Не измишљајте и не измишљајте резултате
Измишљање је облик злоупотребе података и преваре у истраживању која укључује измишљање налаза и њихово пријављивање као истинито.
На пример, научник података може извести да је утврђено да лек нема нежељене ефекте за већину припадника одређене старосне групе. Ови налази би били измишљени да није било почетних медицинских експеримената и прикупљених података који би их подржали.
Измишљање има озбиљне и негативне последице за научнике података и оне који се ослањају на њихов рад. То може уништити ваш кредибилитет, укаљати репутацију ваше организације, нашкодити јавности или вас изложити правним ризицима.
5. Немојте фалсифицирати или манипулисати доказима
Фалсификовање је манипулација стварношћу, прикупљени подаци како би одговарали плану. Док фабрикатори праве резултате од непостојећих података да поткрепе своје тврдње, фалсификатори раде на оповргавању стварних и постојећих података из личних разлога. Да би то постигли, они могу да мењају истраживачку опрему, мењају или у потпуности изостављају податке.
Фалсификовање може нанети штету јавности давањем лажних информација које утичу на доношење одлука у различитим секторима. На пример, фалсификована студија о лековима могла би да изложи људе непотребним ризицима, неефикасним третманима или штетним нуспојавама. То такође може проузроковати губитак новца, времена или материјала који су се могли користити у друге сврхе.
Измишљање и фалсификовање су бескрупулозне радње са штетним последицама и бројним санкцијама. То може укључивати новчане казне, опозив акредитива, губитак финансирања истраживања или затварање.
6. Прикажи транспарентност
Транспарентност за научнике података значи бити искрен у погледу метода које се примењују за прикупљање, анализу и представљање података. Научници података треба да буду отворени и спремни да поделе своју праксу са другим научницима података и учесницима у студији.
Штавише, морате добити сагласност учесника у студији јер објављивање резултата без информисане сагласности може на различите начине умањити поштовање или нанети штету учесницима. Они могу нарушити њихово достојанство, приватност и аутономију или их изложити штетним, непотребним ризицима који проистичу из студије.
Транспарентност гради поверење код оних који се ослањају на ваше податке за увид. Такође обезбеђује квалитет података омогућавајући другима да прегледају ваше резултате.
Поред тога, отвореност међу научницима података промовише сарадњу и учење. Можете помоћи у подстицању иновација тако што ћете поделити свој процес и комуницирати најбоље методе визуелизације података и технике науке о подацима вршњацима док уче од њих.
7. Прикупљајте податке безбедно
Научници података морају да потврде безбедност метода које се користе за прикупљање, анализу и складиштење података. Овим се спречавају потенцијалне повреде података које могу утицати на научнике и учеснике студије.
Прекршаји података угрожавају личну безбедност, подривају поверење јавности и разоткривају организациону некомпетентност што доводи до запањујућих финансијских губитака за компанију. Ови губици могу бити тужбе жртава кршења података, мањег броја клијената и још много тога.
У светлу овога, морате спровести истраживање да бисте пронашли најефикаснија решења за безбедност података и примени их. На пример, можете да обезбедите везе помоћу ТЛС/ССЛ енкрипције или да користите ротирајуће прокси сервере. Такође, можете применити мере контроле приступа и креирати резервне копије у случају напада. Када пронађете решења, не заборавите да их поделите са другима како бисте осигурали максималну безбедност.
8. Користите алгоритме одговорно
Алгоритми нису само алати за анализу података. Они снажно утичу на животе, понашања и могућности људи. Међутим, иако помажу у решавању проблема и стварању иновативних предвиђања, они су такође несавршени.
Ако нису пажљиво дизајнирани, тестирани или примењени, алгоритми имају друштвене и етичке утицаје који могу да нашкоде одређеним групама људи. Они такође уводе пристрасност ако су обучени за податке који одражавају постојеће предрасуде и могу бити непредвидиви. Стога научници података морају да их дизајнирају и користе одговорно.
Увек бирајте одговарајуће алгоритме, тестирајте њихов учинак и објасните како функционишу. Такође, уверите се да идентификујете потенцијалне изворе пристрасности и примените механизме који ажурирају или исправљају где је то потребно.
9. Размотрите дугорочне импликације вашег рада
Ваш рад као научник података значајно ће утицати на многе аспекте друштва. Дакле, увек размислите како ваши модели утичу на људе.
На пример, покушајте да се запитате да ли ваш рад може да продужи предрасуде и неједнакост или да угрози приватност у будућности. Затим, адекватно се позабавите овим проблемима.
Имајте на уму да је поглед оријентисан на будућност важнији од било које корективне методе, а размишљање о данима који су пред нама је један од најефикаснијих начина за доношење етички исправних одлука.
Морате бити етични као научник података
Као научник података, добијате моћ која долази са пропорционалном одговорношћу. Ваше вештине су ретке, тако да седите на челу организационог доношења одлука.
Ваше одлуке утичу на све, од пословних планова компаније до система кривичног правосуђа. Дакле, не би требало да их чините олако. Увек будите поштени, етички и педантни у свом раду како бисте заштитили људе од постојећих етичких дилема у вашој индустрији и другим технолошким областима.