Пандас библиотека чини науку о подацима заснованој на питхон-у једноставном вожњом. То је популарна Питхон библиотека за читање, спајање, сортирање, чишћење података и још много тога. Иако је пандас једноставан за коришћење и примену на скуповима података, има много функција за манипулацију подацима које треба научити.

Можда користите панде, али постоји велика шанса да их недовољно користите за решавање проблема у вези са подацима. Ево наше листе вредних функција панда које манипулишу подацима које сваки научник података треба да зна.

Инсталирајте панде у своје виртуелно окружење

Пре него што наставимо, уверите се да сте инсталирали панде у своје виртуелно окружење користећи пип:

пип инсталл пандас

Након што га инсталирате, увезите панде на врху ваше скрипте, и хајде да наставимо.

1. панде. Оквир података

Користите панде. Оквир података() да бисте креирали ДатаФраме у пандама. Постоје два начина за коришћење ове функције.

Можете формирати ДатаФраме колону тако што ћете проследити речник у панде. Оквир података() функција. Овде је сваки кључ колона, док су вредности редови:

увоз панде
ДатаФраме = панде. ДатаФраме({"А": [1, 3, 4], "Б": [5, 9, 12]})
штампа (ДатаФраме)

Други метод је формирање ДатаФраме-а преко редова. Али овде ћете одвојити вредности (ставке реда) од колона. Број података у свакој листи (подаци из реда) такође мора да се подудара са бројем колона.

увоз панде
ДатаФраме = панде. ДатаФраме([[1, 4, 5], [7, 19, 13]], колоне= ["Ј", "К", "Л"])
штампа (ДатаФраме)

2. Читање из и писање у Екцел или ЦСВ у пандама

Можете читати или писати у Екцел или ЦСВ датотеке помоћу панда.

Читање Екцел или ЦСВ датотека

Да бисте прочитали Екцел датотеку:

#Замените екампле.клск путањом ваше Екцел датотеке
ДатаФраме = ДатаФраме.реад_екцел("екампле.клск")

Ево како да прочитате ЦСВ датотеку:

#Замените екампле.цсв путањом ваше ЦСВ датотеке
ДатаФраме = ДатаФраме.реад_цсв("екампле.цсв")

Писање у Екцел или ЦСВ

Писање у Екцел или ЦСВ је добро позната операција панда. И згодно је за чување новоизрачунатих табела у засебне листове са подацима.

Да бисте писали у Екцел лист:

ДатаФраме.то_екцел("фулл_патх_оф_тхе_дестинатион_фолдер/филенаме.клск")

Ако желите да пишете у ЦСВ:

ДатаФраме.то_цсв("фулл_патх_оф_тхе_дестинатион_фолдер/филенаме.цсв")

Такође можете да израчунате централне тенденције сваке колоне у ДатаФраме-у користећи пандас.

Ево како да добијете средњу вредност сваке колоне:

ДатаФраме.меан()

За вредност медијане или режима, замените значити() са медијана() или режим().

4. ДатаФраме.трансформ

панде ДатаФраме.трансформ() мења вредности ДатаФраме-а. Прихвата функцију као аргумент.

На пример, код испод множи сваку вредност у ДатаФраме-у са три користећи Пајтонова ламбда функција:

ДатаФраме = ДатаФраме.трансформ (ламбда и: и*3)
штампа (ДатаФраме)

5. ДатаФраме.иснулл

Ова функција враћа Булову вредност и означава све редове који садрже нулте вредности као Истина:

ДатаФраме.иснулл()

Резултат горњег кода може бити тежак за читање за веће скупове података. Дакле, можете користити иснулл().сум() функција уместо тога. Ово враћа резиме свих вредности које недостају за сваку колону:

ДатаФраме.иснулл().сум()

6. Датафраме.инфо

Тхе инфо() функција је ан есенцијална операција панда. Уместо тога враћа резиме вредности које недостају за сваку колону:

ДатаФраме.инфо()

7. ДатаФраме.десцрибе

Тхе описати() функција вам даје збирну статистику ДатаФраме-а:

ДатаФраме.десцрибе()

8. ДатаФраме.реплаце

Помоћу ДатаФраме.реплаце() метода у пандама, можете заменити изабране редове другим вредностима.

На пример, да замените неважеће редове са Нан:

# Уверите се да сте пип инсталл нумпи да би ово функционисало
импорт нумпи
увоз панде
# Додавање инплаце кључне речи и подешавање на Тачно чини промене трајним:
ДатаФраме.реплаце([инвалид_1, инвалид_2], нумпи.нан, инплаце=Тачно)
штампа (ДатаФраме)

9. ДатаФраме.филлна

Ова функција вам омогућава да попуните празне редове одређеном вредношћу. Можете попунити све Нан редови у скупу података са средњом вредношћу, на пример:

ДатаФраме.филлна (дф.меан(), инплаце = Тачно)
штампа (ДатаФраме)

Такође можете бити специфични за колону:

ДатаФраме['цолумн_наме'].филлна (дф[цолумн_наме].меан(), инплаце = Труе)
штампа (ДатаФраме)

10. ДатаФраме.дропна

Тхе дропна() метода уклања све редове који садрже нулл вредности:

ДатаФраме.дропна (инплаце = Труе)
штампа (ДатаФраме)

11. ДатаФраме.инсерт

Можете користити панде' инсерт() функцију за додавање нове колоне у ДатаФраме. Прихвата три кључне речи, назив колоне, списак њених података и њен локација, што је индекс колоне.

Ево како то функционише:

ДатаФраме.инсерт (колона = 'Ц', вредност = [3, 4, 6, 7], лоц=0)
штампа (ДатаФраме)

Горњи код умеће нову колону у индекс нулте колоне (постаје прва колона).

12. ДатаФраме.лоц

Можете користити лоц да пронађе елементе у одређеном индексу. Да бисте видели све ставке у трећем реду, на пример:

ДатаФраме.лоц[2]

13. ДатаФраме.поп

Ова функција вам омогућава да уклоните одређену колону из пандас ДатаФраме-а.

Прихвата ан предмет кључну реч, враћа искачућу колону и одваја је од остатка ДатаФраме-а:

ДатаФраме.поп (итем= 'цолумн_наме')
штампа (ДатаФраме)

14. ДатаФраме.мак, мин

Добијање максималних и минималних вредности помоћу панди је лако:

ДатаФраме.мин()

Горњи код враћа минималну вредност за сваку колону. Да бисте добили максимум, замените мин са мак.

15. ДатаФраме.јоин

Тхе придружити() функција пандас вам омогућава да спојите оквире података са различитим именима колона. Можете користити леви, десни, унутрашњи или спољашњи спој. Да бисте се лево придружили ДатаФраме-у са још два:

#Лево спојите дуже колоне са краћим
невДатаФраме = дф1.јоин([дф_схортер2, дф_схортер3], хов='лефт')
штампа (невДатаФраме)

Да бисте спојили ДатаФраме са сличним именима колона, можете их разликовати укључивањем суфикса са леве или десне стране. Урадите то тако што ћете укључити лсуфикс или рсуфикс кључна реч:

невДатаФраме = дф1.јоин([дф2, рсуффик='_', хов='оутер') 
штампа (невДатаФраме)

16. ДатаФраме.цомбине

Тхе комбинуј() функција је згодна за спајање два оквира података која садрже слична имена колона на основу постављених критеријума. Прихвата а функција кључна реч.

На пример, да спојите два оквира података са сличним именима колона само на основу максималних вредности:

невДатаФраме = дф.цомбине (дф2, нумпи.минимум)
штампа (невДатаФраме)

Белешка: Такође можете дефинисати прилагођену функцију избора и уметнути нумпи.минимум.

17. ДатаФраме.астипе

Тхе астипе() функција мења тип података одређене колоне или оквира података.

Да бисте променили све вредности у ДатаФраме-у у стринг, на пример:

ДатаФраме.астипе (стр)

18. ДатаФраме.сум

Тхе сума() функција у пандас враћа збир вредности у свакој колони:

ДатаФраме.сум()

Такође можете пронаћи кумулативни збир свих ставки које користите цумсум():

ДатаФраме.цумсум()

19. ДатаФраме.дроп

панде кап() функција брише одређене редове или колоне у ДатаФраме-у. Морате да наведете имена колона или индекс реда и осу да бисте их користили.

Да бисте уклонили одређене колоне, на пример:

дф.дроп (колоне=['колона1', 'колона2'], ос=0)

Да бисте испустили редове на индексима 1, 3 и 4, на пример:

дф.дроп([1, 3, 4], акис=0)

20. ДатаФраме.цорр

Желите да пронађете корелацију између колона са целим бројем или колона са покретним бројем? панде вам могу помоћи да то постигнете користећи цорр() функција:

ДатаФраме.цорр()

Горњи код враћа нови ДатаФраме који садржи корелациони низ између свих колона са целим бројем или колонама са покретним бројем.

21. ДатаФраме.адд

Тхе додати() функција вам омогућава да свакој вредности у ДатаФраме-у додате одређени број. Ради тако што се понавља кроз ДатаФраме и оперише са сваком ставком.

Повезан:Како користити Фор петље у Питхон-у

Да бисте додали 20 свакој од вредности у одређеној колони која садржи целе бројеве или плутајуће, на пример:

ДатаФраме['интергер_цолумн'].адд (20)

22. ДатаФраме.суб

Као и функција сабирања, такође можете одузети број од сваке вредности у ДатаФраме-у или одређеној колони:

ДатаФраме['интергер_цолумн'].суб (10)

23. ДатаФраме.мул

Ово је верзија множења функције сабирања панди:

ДатаФраме['интергер_цолумн'].мул (20)

24. ДатаФраме.див

Слично томе, можете поделити сваку тачку података у колони или ДатаФраме-у одређеним бројем:

ДатаФраме['интергер_цолумн'].див (20)

25. ДатаФраме.стд

Помоћу стд() функција, пандас вам такође омогућава да израчунате стандардну девијацију за сваку колону у ДатаФраме-у. Ради тако што се понавља кроз сваку колону у скупу података и израчунава стандардну девијацију за сваку од њих:

ДатаФраме.стд()

26. ДатаФраме.сорт_валуес

Такође можете сортирати вредности узлазно или опадајуће на основу одређене колоне. Да бисте сортирали ДатаФраме у опадајућем редоследу, на пример:

невДатаФраме = ДатаФраме.сорт_валуес (према = "цолмун_наме", опадајуће = Тачно)

27. ДатаФраме.мелт

Тхе топити () функција у пандас окреће колоне у ДатаФраме-у на појединачне редове. То је као излагање анатомије ДатаФраме-а. Тако да вам омогућава да експлицитно видите вредност додељену свакој колони.

невДатаФраме = ДатаФраме.мелт()

28. ДатаФраме.цоунт

Ова функција враћа укупан број ставки у свакој колони:

ДатаФраме.цоунт()

29. ДатаФраме.куери

панде упит() омогућава вам да позовете ставке користећи њихов индексни број. Да бисте добили ставке у трећем реду, на пример:

ДатаФраме.куери('4') # Позовите упит на четвртом индексу

30. ДатаФраме.вхере

Тхе где() функција је пандас упит који прихвата услов за добијање одређених вредности у колони. На пример, да добијете све узрасте мање од 30 година од ан Старост колона:

ДатаФраме.вхере (ДатаФраме['Аге'] < 30)

Горњи код даје ДатаФраме који садржи све узрасте мање од 30 година, али додељује Нан на редове који не испуњавају услов.

Рукујте подацима као професионалац са пандама

пандас је ризница функција и метода за руковање малим и великим скуповима података са Питхон-ом. Библиотека је такође корисна за чишћење, валидацију и припрему података за анализу или машинско учење.

Одвајање времена да га савладате дефинитивно олакшава ваш живот као научника података, и итекако је вредно труда. Зато слободно покупите све функције којима можете да рукујете.

20 Питхон функција које би требало да знате

Питхон стандардна библиотека садржи многе функције које ће вам помоћи у програмским задацима. Сазнајте о најкориснијим и креирајте робуснији код.

Реад Нект

ОбјавиТвеетЕмаил
Повезане теме
  • Програмирање
  • Питхон
  • Програмирање
  • база података
О аутору
Идову Омисола (Објављено 123 чланака)

Идову је страствен за све паметне технологије и продуктивност. У слободно време игра се са кодирањем и прелази на шаховску таблу када му је досадно, али такође воли да се с времена на време одвоји од рутине. Његова страст да људима покаже пут око модерне технологије мотивише га да пише више.

Више од Идову Омисола

Претплатите се на наш билтен

Придружите се нашем билтену за техничке савете, рецензије, бесплатне е-књиге и ексклузивне понуде!

Кликните овде да бисте се претплатили