Искористите ПандасАИ Питхон библиотеку да бисте искористили моћ вештачке интелигенције и великих језичких модела за обављање задатака анализе података.

Пандас је најдоминантнија библиотека за манипулисање скуповима података и оквирима података. Ово је већ дуго норма. Али са напретком у вештачкој интелигенцији, развијена је нова библиотека отвореног кода под називом ПандасАИ која Пандама додаје генеративне АИ могућности.

ПандасАИ не замењује Панде. Уместо тога, даје своје генеративне АИ способности. На овај начин можете извршити анализу података ћаскањем са ПандасАИ-ом. Затим апстрахује оно што се дешава у позадини и даје вам резултат вашег упита.

Инсталирање ПандасАИ

ПандасАИ је доступан преко ПиПИ (Питхон Пацкаге Индек). Креирајте ново виртуелно окружење ако користите локални ИДЕ. Онда користите менаџер пакета пип да га инсталирате.

пип инсталл пандасаи

Можда ћете наићи на грешку сукоба зависности сличну оној приказаној испод ако користите Гоогле Цолаб.

Немојте враћати верзију ИПитхон-а на старију верзију. Само поново покрените време извођења и поново покрените блок кода. Ово ће решити проблем.

instagram viewer

Комплетан изворни код је доступан у а ГитХуб спремиште.

Разумевање скупа података узорка

Пример скупа података којим ћете манипулисати са ПандасАИ-ом је скуп података о ценама станова у Калифорнији из Каггле-а. Овај скуп података садржи информације о становању са пописа становништва у Калифорнији из 1990. године. Има десет колона које пружају статистику о овим кућама. Картица са подацима која ће вам помоћи да сазнате више о овом скупу података је доступна на Каггле. Испод је првих пет редова скупа података.

Свака колона представља једну статистику куће.

Повезивање ПандасАИ-а са моделом великог језика

Да бисте повезали ПандасАИ са а велики језички модел (ЛЛМ) попут ОпенАИ-а, потребан вам је приступ његовом АПИ кључу. Да бисте га добили, пређите на ОпенАИ платформа. Затим се пријавите на свој налог. Изаберите АПИ на страници са опцијама која се појављује следеће.

Након тога, кликните на свој профил и изаберите Погледајте АПИ кључеве опција. Следећи клик на страници која се појави Креирајте нови тајни кључ дугме. На крају, дајте назив свом АПИ кључу.

ОпенАИ ће генерисати ваш АПИ кључ. Копирајте га како ће вам требати док повезујете ПандасАИ са ОпенАИ. Уверите се да чувате тајну кључа јер свако ко има приступ њему може да позива ОпенАИ у ваше име. ОпенАИ ће затим наплатити ваш налог за позиве.

Сада када имате АПИ кључ, направите нову Питхон скрипту и налепите код испод. Нећете морати да мењате овај код јер ћете већину времена градити на њему.

увоз панде као пд
из пандасаи увоз ПандасАИ

# Замените својим скупом података или оквиром података
дф = пд.реад_цсв("/цонтент/хоусинг.цсв")

# Инстанцирајте ЛЛМ
из пандасаи.ллм.опенаи увоз ОпенАИ
ллм = ОпенАИ(апи_токен="ваш АПИ токен")

пандас_аи = ПандасАИ(ллм)

Горњи код увози и ПандасАИ и Пандас. Затим чита скуп података. Коначно, инстанцира ОпенАИ ЛЛМ.

Сада сте спремни да разговарате са својим подацима.

Обављање једноставних задатака користећи ПандасАИ

Да бисте поставили упит за своје податке, проследите оквир података и свој упит инстанци ПандасАИ класе. Почните тако што ћете одштампати првих пет редова вашег скупа података.

пандас_аи (дф, промпт=„Који су првих пет редова скупа података?“)

Излаз горњег упита је следећи:

Овај излаз је идентичан оном из претходног прегледа скупа података. Ово показује да ПандасАИ даје исправне резултате и да је поуздан.

Затим проверите број колона присутних у вашем скупу података.

пандас_аи (дф, промпт=„Колико колона има у скупу података? ')

Враћа 10 што је тачан број колона у скупу података Цалифорниа Хоусинг.

Провера да ли недостају вредности у скупу података.

пандас_аи (дф, промпт=„Да ли постоје вредности које недостају у скупу података?“)

ПандасАИ враћа да је тотал_бедроомс колона има 207 недостајућих вредности, што је опет тачно.

Постоји много једноставних задатака које можете постићи користећи ПандасАИ, нисте ограничени на оне изнад.

Извођење сложених упита користећи ПандасАИ

ПандасАИ не подржава само једноставне задатке. Можете га користити и за обављање сложених упита на скупу података. На пример, у скупу података о становању, ако желите да одредите број кућа које се налазе на острво, имају вредност већу од 100.000 долара и имају више од 10 соба које можете користити испод.

пандас_аи (дф, промпт= "Колико кућа има вредност већу од 100000,"
" су на острву и укупан број спаваћих соба је више од 10?")

Тачан излаз је пет. Ово је исти резултат који ПандасАИ даје.

Сложеним упитима аналитичару података може бити потребно неко време да напише и отклони грешке. Горњи упит захтева само два реда природног језика да би се извршио исти задатак. Само треба да имате на уму шта тачно желите да постигнете, а ПандасАИ ће се побринути за остало.

Цртање графикона користећи ПандасАИ

Графикони су витални део сваког процеса анализе података. Помаже аналитичарима података да визуализују податке на начин прилагођен људима. ПандасАИ такође има функцију цртања графикона. Само треба да прођете оквир података и инструкције.

Почните тако што ћете направити хистограм за сваку колону у скупу података. Ово ће вам помоћи да визуализујете дистрибуцију варијабли.

пандас_аи (дф, промпт= „Нацртајте хистограм за сваку колону у скупу података“)

Излаз је следећи:

ПандасАИ је успео да нацрта хистограм свих колона без потребе да проследи њихова имена у одзивнику.

ПандасАИ такође може да црта графиконе без да му експлицитно кажете који графикон да користи. На пример, можда ћете желети да сазнате корелацију података у скупу података о становању. Да бисте то постигли, можете проследити упит на следећи начин:

пандас_аи (дф, промпт= „Зацртајте корелацију у скупу података“)

ПандасАИ исцртава матрицу корелације као што је приказано у наставку:

Библиотека бира топлотну мапу и црта матрицу корелације.

Прослеђивање више оквира података ПандасАИ инстанци

Рад са више оквира података може бити тежак. Посебно за особу која је нова у анализи података. ПандасАИ премошћује овај јаз јер све што треба да урадите је да прођете оба оквира података и почнете да користите упите за манипулацију подацима.

Направите два оквира података користећи Пандас.

запослени_подаци = {
'Број запосленог': [1, 2, 3, 4, 5],
'име': ['Јован', 'Ема', 'Лиам', 'Оливиа', 'Вилијам'],
'Одељење': ['ХР', 'Продаја', 'ТО', 'Маркетинг', 'финансије']
}

подаци_ о платама = {
'Број запосленог': [1, 2, 3, 4, 5],
'Плата': [5000, 6000, 4500, 7000, 5500]
}

запослени_дф = пд. ДатаФраме (емплоиеес_дата)
плате_дф = пд. ДатаФраме (салариес_дата)

ПандасАИ-ју можете поставити питање које сеже у оба оквира података. Морате само да проследите оба оквира података ПандасАИ инстанци.

пандас_аи([емплоиеес_дф, салариес_дф], „Који запослени има највећу плату?)

Враћа се Оливиа што је опет тачан одговор.

Извођење анализе података никада није било лакше, ПандасАИ вам омогућава да разговарате са својим подацима и анализирате их са лакоћом.

Разумевање технологије која покреће ПандасАИ

ПандасАИ поједностављује процес анализе података и на тај начин штеди много времена аналитичарима података. Али апстрахује оно што се дешава у позадини. Морате да се упознате са генеративном вештачком интелигенцијом да бисте имали преглед како ПандасАИ функционише испод хаубе. Ово ће вам такође помоћи да будете у току са најновијим иновацијама у домену генеративне вештачке интелигенције.