Велика средства података су неуредна, посебно када их морате извући са веб локација, сервера или других извора података.
Апликације засноване на корисничком интерфејсу као што је МС Екцел су добре за рад са једноставним скуповима података, али могу имати проблема када подаци постану већи. Ово је добар разлог да пређете на Питхон да бисте обављали сложеније операције засноване на подацима.
Питхонова библиотека треће стране, Пандас, у великој мери помаже вам да брзо сортирате постојеће скупове података. Ако желите да сортирате своје податке у Питхон-у, овај чланак разматра неколико начина за постизање овог задатка.
Предуслови за коришћење Питхон-а за сортирање података
Пре него што сортирате своје податке у Питхон-у, морате да водите рачуна о неколико предуслова:
- Преузмите Питхон ИДЕ. Можете користити а ИДЕ компатибилан са Питхон-ом, као што су Јупитер Нотебоок, ПиЦхарм и Спидер, између осталих. Сваки од њих је компатибилан са свим верзијама Питхон-а.
- Инсталирајте панде. Требаће вам пакет панде који можете инсталирајте користећи ПИП или ваш жељени метод.
- Пример скупа података. Преузмите а узорак скупа података да увежбају наведене шифре. Алтернативно, можете користити ове процедуре за своје ексклузивне податке.
Увоз Пандас библиотеке у Питхон
Пандас је Питхон библиотека треће стране коју можете да користите за руковање Екцел, ЦСВ и другим форматима података.
Да бисте радили са примером Екцел датотеке, почните са увозом библиотеке панда. Након тога, користићете процедура увоза за читање Екцел података у Питхон.
Да бисте увезли библиотеку
увоз панде као пд
Направите нови оквир података да бисте учитали Екцел податке
филе = "Пример - Суперсторе.клс"
дф = пд.реад_екцел (фајл)
дф.глава()
Где:
- дф је ДатаФраме објекат који чува увезене податке.
- пд је псеудоним за Пандас библиотеку.
- реад_екцел је метод за читање Екцел датотеке у Питхон-у.
- фајл је путања до Екцел датотеке.
- глава је метод који враћа првих пет редова из ДатаФраме-а.
Када ваш програм учита податке, можете користити многе доступне методе ДатаФраме да бисте их сортирали на различите начине.
1. Сортирање по једној колони у оквиру података
Пошто ће ваши подаци имати много редова и колона, често ћете желети да сортирате податке на основу одређене колоне или колона.
Питхон подразумевано сортира податке у растућем редоследу. Ако желите да промените редослед сортирања, морате то експлицитно навести у свом коду.
Сортирај по једној колони (узлазни редослед)
дф.сорт_валуес (по = "идентификација купца")
Сортирај по једној колони (опадајући редослед)
Подесите узлазни параметар за Фалсе да сортирате колону у опадајућем редоследу.
дф.сорт_валуес (по = "идентификација купца", растуће=Нетачно)
Где:
- дф је ДатаФраме објекат који садржи податке.
- сорт_валуес је метод за сортирање према вредностима података.
- од стране је параметар за дефинисање назива колоне.
- узлазни је параметар за дефинисање редоследа сортирања.
2. Сортирање више колона у оквиру података
Ако ваши захтеви то захтевају, такође можете сортирати своје оквире података на основу више колона одједном. У таквом сценарију, морате дефинисати референце колона на листи.
Сортирај по више колона узлазно
дф.сорт_валуес (по = ["идентификација купца", "Цити"])
Сортирај према више колона у опадању
Користите функцију узлазно = Нетачно да сортирате своје колоне у опадајућем редоследу. Запамтите, потребно је да наведете имена колона унутар листе да бисте их сортирали истовремено.
дф.сорт_валуес (по = ["идентификација купца", "Цити"], растуће = Нетачно)
Сортирање по више колона у различитим редоследима сортирања
Са основама сортирања, шта се дешава када желите да сортирате једну колону у опадајућем редоследу, а другу у растућем? Морате мало да прилагодите свој код да бисте укључили ове захтеве.
На пример, да бисте сортирали Регион и Цити колоне у опадајућем и растућем редоследу, респективно:
дф.сорт_валуес (по = ["Регион", "Цити"], растући = [Нетачно, Тачно])
Објашњење овог кода је једноставно; дефинишете име ДатаФраме-а и проследите сорт_валуес функција заједно са именима колона на листи. Требало би да користите Боолеан вредности да одредите редослед сортирања.
Позивање функције на овај начин значи да ће Питхон прво сортирати по колони ДатаФраме Регион у опадајућем редоследу. Затим ће се редови са идентичним Регионом даље сортирати по колони Град, у растућем редоследу.
3. Како сортирати колоне у оквиру података по индексу
Променљива индекса је подразумевана вредност додељена сваком реду унутар Питхон Датафраме-а. Можете дефинисати вредности индекса или дозволити да Питхон сам постави вредност индекса.
Да бисте сортирали податке по вредности индекса, можете користити сорт_индек функција. Ова функција се сортира на основу индекса, а не на основу било које вредности садржане у оригиналном скупу података.
дф.сорт_индек()
Као и код сорт_валуес, можете проследити а узлазни параметар за одређивање смера сортирања. На пример, пренесите вредност од Фалсе да сортирате податке у опадајућем редоследу:
дф.сорт_индек (узлазно = Фалсе)
4. Сортирање колона у оквиру података уместо редова
Уместо сортирања редова у ДатаФраме-у, можете сортирати његове колоне. То можете учинити тако што ћете позвати методу сорт_индек и проследити му осовина параметар са вредношћу од 1:
дф.сорт_индек (акис=1)
Овај корак сортира ДатаФраме, према његовим колонама, у растућем редоследу. Да бисте сортирали колоне ДатаФраме-а у опадајућем редоследу, можете одредити редослед сортирања у кораку сортирања.
дф.сорт_индек (акис=1, растући = Фалсе)
5. Измена оквира података док га сортирате
Две методе сортирања функционишу тако што враћају копију оригиналних података, у новом сортираном стању. Да бисте уштедели простор за складиштење или једноставно да бисте написали сажетији код, уместо тога можете да измените оригиналне ДатаФраме податке. Сваки метод прихвата ан на месту боолеан параметар који модификује податке уместо да враћа измењену копију.
дф.сорт_валуес (по = ["идентификација купца", "Цити"], растући = Нетачно, на месту = Тачно)
Учење сортирања података у Питхон-у
Питхон реплицира многе од уграђених функција Екцел-а са неколико линија кода. Од процедура сортирања до креирања сложених заокретних табела на вашим подацима, дајте им име и то можете да урадите у Питхон-у.
Ако сте још увек нови у Питхон-у и научите конопце, ови кораци ће релативно лако побољшати ваше вештине кодирања.