Ако користите Питхон, чак и за најједноставније задатке, вероватно сте свесни важности његових библиотека независних произвођача. Пандас библиотека, са својом одличном подршком за ДатаФрамес, једна је таква библиотека.
Можете да увезете више типова датотека у Питхон ДатаФрамес и креирате различите верзије за складиштење различитих скупова података. Када увезете своје податке користећи ДатаФрамес, можете их спојити да бисте извршили детаљну анализу.
Бављење основама
Пре него што почнете са спајањем, морате да имате ДатаФраме за спајање. За потребе развоја, можете креирати неке лажне податке са којима ћете експериментисати.
Направите оквире података у Питхон-у
Као први корак, увезите Пандас библиотеку у своју Питхон датотеку. Пандас је библиотека треће стране која рукује оквирима података у Питхон-у. Можете користити увоз изјаву да користите библиотеку, на следећи начин:
увоз панде као пд
Можете да доделите псеудоним имену библиотеке да бисте скратили референце кода.
Морате да направите речнике, које можете претворити у ДатаФраме. За најбоље резултате направите две променљиве речника—
дицт1 и дицт2—за чување одређених информација:дицт1 = {"ИД корисник": ["001", "002", "003", "004", "005"],
"ФНаме": ["Јохн", "Брад", "Рон", "Роалд", "Цхрис"],
"ЛНаме": ["Харлеи", "Цохен", "Дахл", "Харингтон", "Керр-Хислоп"]}
дицт2 = {"ИД корисник": ["001", "002", "003", "004"], "Старост": [15, 28, 34, 24]}
Запамтите, морате да имате заједнички елемент у обе вредности речника, да бисте деловали као примарни кључ за касније комбиновање ваших оквира података.
Претворите своје речнике у оквире података
Да бисте претворили вредности из речника у оквире података, можете користити следећи метод:
дф1 = пд. ДатаФраме (дицт1)
дф2 = пд. ДатаФраме (дицт2)
Неки ИДЕ вам омогућавају да проверите вредности у оквиру ДатаФраме позивањем на функцију ДатаФраме и притиском на Рун/Екецуте. Има их много ИДЕ-ови компатибилни са Питхон-ом, тако да можете изабрати онај који вам је најлакши за учење.
Када будете задовољни садржајем својих оквира података, можете прећи на корак спајања.
Комбиновање оквира са функцијом спајања
Функција спајања је прва Питхон функција коју можете користити за комбиновање два оквира података. Ова функција узима следеће подразумеване аргументе:
пд.мерге (ДатаФраме1, ДатаФраме2, хов= типофспојити)
Где:
- пд је псеудоним за Пандас библиотеку.
- спојити је функција која спаја ДатаФрамес.
- ДатаФраме1 и ДатаФраме2 су два оквира података за спајање.
- како дефинише тип спајања.
Доступни су неки додатни опциони аргументи које можете користити када имате сложену структуру података.
Можете користити различите вредности за параметар како да дефинишете тип спајања које треба да се изврши. Ове врсте спајања ће вам бити познате ако сте користио СКЛ за спајање табела базе података.
Лево спајање
Леви тип спајања чува вредности првог ДатаФраме-а нетакнутим и повлачи одговарајуће вредности из другог ДатаФраме-а.
Десно спајање
Прави тип спајања чува вредности другог ДатаФраме-а нетакнутим и повлачи одговарајуће вредности из првог ДатаФраме-а.
Иннер Мерге
Унутрашњи тип спајања задржава одговарајуће вредности из оба оквира података и уклања вредности које се не подударају.
Оутер Мерге
Спољни тип спајања задржава све подударне и неподударне вредности и консолидује ДатаФраме заједно.
Како користити Цонцат функцију
Тхе цонцат функција је флексибилна опција у поређењу са неким другим Питхоновим функцијама спајања. Са функцијом цонцат, можете комбиновати ДатаФраме вертикално и хоризонтално.
Међутим, недостатак коришћења ове функције је што подразумевано одбацује све неподударне вредности. Као и неке друге повезане функције, ова функција има неколико аргумената, од којих је само неколико од суштинског значаја за успешну конкатенацију.
цонцат (оквири података, акис=0, јоин='спољашњи'/’унутрашњи’)
Где:
- цонцат је функција која спаја ДатаФрамес.
- оквири података је секвенца оквира података за спајање.
- осовина представља правац спајања, 0 је хоризонтално, 1 је вертикално.
- придружити специфицира спољашњи или унутрашњи спој.
Користећи горња два оквира података, можете испробати цонцат функцију на следећи начин:
# дефинише оквире података у формату листе
дф_мергед_цонцат = пд.цонцат([дф1, дф2])
# штампа резултате функције Цонцат
принт(дф_мергед_цонцат)
Одсуство аргумената осовине и спајања у горњем коду комбинује два скупа података. Добијени излаз има све уносе, без обзира на статус подударања.
Слично, можете користити додатне аргументе да контролишете правац и излаз функције цонцат.
Да бисте контролисали излаз са свим одговарајућим уносима:
# Повезивање свих одговарајућих вредности између два оквира података на основу њихових колона
дф_мергед_цонцат = пд.цонцат([дф1, дф2], акис=1, јоин = 'унутрашњи')
принт(дф_мергед_цонцат)
Резултат садржи све вредности које се подударају само између два оквира података.
Спајање оквира података са Питхон-ом
ДатаФрамес су саставни део Питхон-а, с обзиром на њихову флексибилност и функционалност. С обзиром на њихову вишеструку употребу, можете их широко користити за обављање разних задатака са највећом лакоћом.
Ако још увек учите о Питхон ДатаФрамес-у, покушајте да увезете неке Екцел датотеке, а затим их комбинујте са различитим приступима.