Заокретне табеле су и даље међу најцењенијим и најчешће коришћеним алатима у оквиру МС Екцел-а. Било да сте аналитичар података, инжењер података или једноставно обичан корисник, велике су шансе да већ имате слабу тачку за МС Екцел.
Без обзира на то, постоји све већи обим за реплицирање алата и услужних програма МС Екцел-а, посебно у Питхон-у. Да ли сте знали да можете да креирате опсежне заокретне табеле у Питхон-овим ДатаФрамес-овима са неколико редова самог кода?
Да то је тачно; ако сте заинтригирани, ево како то можете да урадите.
Предуслови за креирање изведених табела
Као и сваки други програмски језик, чак и за Питхон треба да испуните неколико предуслова пре него што почнете да радите кодирање.
Да бисте добили највише оптимизовано искуство док правите своју прву стожерну табелу у Питхон-у, ево шта ће вам требати:
- Питхон ИДЕ: Већина Питхон кодова има интегрисано развојно окружење (ИДЕ) унапред инсталирано на свом систему. Има их неколико Питхон компатибилни ИДЕ-ови на тржишту, укључујући Јупитер Нотебоок, Спидер, ПиЦхарм и многе друге.
- Примјера података: За илустрацију, ево примера скупа података на којем можете да радите. Алтернативно, слободно подесите ове кодове директно на вашим подацима уживо.
Веза са узорком података:Сампле Суперсторе
Увоз основних библиотека
Пошто Питхон ради на концепту библиотека трећих страна, потребно је да увезете Панде библиотека за креирање стожера.
Панде можете користити за увезите Екцел датотеку у Питхон и чувати податке у ДатаФраме-у. Да бисте увезли Панде, користите увоз командује на следећи начин:
увоз панде као пд
Како направити пивотове у Питхон-у
Пошто је библиотека сада доступна, потребно је да увезете Екцел датотеку у Питхон, који је основа за креирање и тестирање пивотова у Питхон-у. Сачувајте увезене податке у ДатаФраме са следећим кодом:
# Креирајте нови ДатаФраме
# замените својом путањом овде
пут = "Ц://Усерс//усер/ОнеДриве//Десктоп//"
# можете дефинисати име датотеке овде
филе = "Пример - Суперсторе.клс"
дф = пд.реад_екцел (путања + датотека)
дф.глава()
Где:
- дф: Име променљиве за чување података ДатаФраме-а
- пд: Алиас за Пандас библиотеку
- реад_екцел(): Пандас функција за читање Екцел датотеке у Питхон
- пут: Локација на којој се чува Екцел датотека (Сампле Суперсторе)
- фајл: Име датотеке за увоз
- глава(): Приказује првих пет редова ДатаФраме-а, подразумевано
Горњи код увози Екцел датотеку у Питхон и чува податке у ДатаФраме-у. Коначно, глава функција приказује првих пет редова података.
Ова функција је згодна да осигура да су подаци исправно увезени у Питхон.
Која поља заокретне табеле постоје у Питхон-у?
Као и његов пандан у Екцел-у, пивот табела има сличан скуп поља у Питхон-у. Ево неколико поља о којима треба да знате:
- Подаци: Поље података се односи на податке ускладиштене у Питхон ДатаФраме-у
- вредности: Колумнарски подаци који се користе у оквиру стожера
- Индекс: Колона(е) индекса за груписање података
- Колоне: Колоне помажу у агрегирању постојећих података у оквиру ДатаФраме-а
Сврха иза коришћења функције индекса
Пошто је функција индекса примарни елемент заокретне табеле, она враћа основни изглед података. Другим речима, можете груписати своје податке са индекс функција.
Претпоставимо да желите да видите неке агрегиране вредности за производе наведене у оквиру Сегмент колона. Можете израчунати унапред дефинисани агрегат (средњу вредност) у Питхон-у тако што ћете дефинисати назначене колоне као вредност индекса.
дф.пивот_табле (индекс = "Сегмент")
Где:
- дф:ДатаФраме који садржи податке
- ротациона табела: Функција заокретне табеле у Питхон-у
- индекс: Уграђена функција за дефинисање колоне као индекса
- Сегмент: Колона која се користи као вредност индекса
Питхон-ова имена променљивих су осетљива на велика и мала слова, тако да избегавајте прелазак са унапред дефинисаних имена променљивих наведених у овом водичу.
Како користити вредности са више индекса
Када желите да користите више колона индекса, можете дефинисати називе колона у а листа у оквиру функције индекса. Све што треба да урадите је да наведете имена колона унутар скупа угласте заграде ([ ]), како је приказано испод:
дф.пивот_табле (индекс = ["Категорија", "Подкатегорија"])
Функција пивот увлачи колону индекса у излазу. Питхон приказује значити свих нумеричких вредности према свакој вредности индекса.
Научите да ограничите вредности у излазу
Пошто Питхон подразумевано бира све нумеричке колоне, можете ограничити вредности да бисте подесили резултате приказане у коначном излазу. Користити вредности функција за дефинисање колона које желите да видите.
дф.пивот_табле (индекс = ["Регион", "Категорија", "Подкатегорија"], вредности = "Продаја")
У коначном излазу, постојаће три колоне индекса, а средње вредности за колону Продаја поређане су са сваким елементом.
Дефинисање агрегатних функција у изведеној табели
Шта се дешава када не желите да израчунате средње вредности подразумевано? Стожерна табела има много других функционалности, које се протежу даље од израчунавања једноставне средње вредности.
Ево како написати код:
дф.пивот_табле (индекс = ["Категорија"], вредности = "Продаја", аггфунц = [сума, мак, мин, лен])
Где:
- збир: Израчунава збир вредности
- мак: Израчунава максималну вредност
- мин: Израчунава максималну вредност
- лен: Израчунава број вредности
Такође можете дефинисати сваку од ових функција у посебним редовима кода.
Како додати укупне збројеве у изведену табелу
Ниједан материјал података није потпун без укупних зброја. Да бисте израчунали и приказали укупне збројеве по колони података, користите маргине и маргинс_наме функција.
дф.пивот_табле (индекс = ["Категорија"], вредности = "Продаја", аггфунц = [сум, мак, мин, лен], маргинс=Тачно, маргинс_наме='Гранд Тоталс')
Где:
- маргине: Функција за израчунавање укупног износа
- маргинс_наме: Наведите назив категорије у колони индекса (на пример, укупни збројеви)
Измените и користите завршни код
Ево коначног сажетка кода:
увоз панде као пд
# замените својом путањом овде
пут = "Ц://Усерс//усер/ОнеДриве//Десктоп//"
# можете дефинисати име датотеке овде
филе = "Пример - Суперсторе.клс"
дф = пд.реад_екцел (путања + датотека)
дф.пивот_табле (индекс = ["Регион", "Категорија", "Подкатегорија"], вредности = "Продаја",
аггфунц = [сума, мак, мин, лен],
маргине=Истинито,
маргинс_наме='Гранд Тоталс')
Креирање изведених табела у Питхон-у
Када користите изведене табеле, опције су једноставно бескрајне. Питхон вам омогућава да лако рукујете огромним низовима података без бриге о неподударностима података и заостајању система.
Пошто функције Питхон-а нису ограничене само на сажимање података у пивотове, можете комбиновати више Екцел радних књига и листова, док обављате низ повезаних функција са Питхоном.
Са Питхон-ом, увек је нешто ново на видику.