Интернет Мовие Датабасе (ИМДб) је највећа онлајн база података која садржи информације везане за филмове, телевизијске серије, кућне видео записе, видео игре и стримовање садржаја. База података на мрежи садржи милионе тачних записа које можете користити за анализу података.
Цинемагоер (раније познат као ИМДбПИ) је Питхон библиотека за управљање и преузимање података ИМДб филмске базе података. Можете приступити подацима о филмовима, људима и компанијама, који се могу даље користити за анализу.
Инсталирање потребних библиотека
Потребно је да инсталирате биоскоп Питхон библиотека за приступ ИМДб база података. Покрените следећу команду у командној линији да бисте инсталирали библиотеку:
пип инсталирај биоскоп
Морате имати пип инсталиран на вашем систему да инсталирате екстерне Питхон библиотеке.
Код који се користи у овом пројекту доступан је у а ГитХуб спремиште и бесплатан је за коришћење под МИТ лиценцом.
Екстраховање ИМДб података помоћу Питхон-а
Морате да увезете библиотеку биоскопа пре него што је употребите у свом коду.
из имдб увоз Цинемагоер
иа = Биоскоп ()
Горњи код увози библиотеку биоскопа и креира инстанцу класе цинемагоер.
Сеарцхинг Мовиес
Можете претраживати филмове са датим (или сличним) насловом користећи сеарцх_мовие() методом. На пример, ако желите да тражите филмове са насловом „рок“, потребно је да покренете следећи код:
из имдб увоз Цинемагоер
# Креирање инстанце класе Цинемагоер
иа = Биоскоп ()
# Претраживање филмова који имају рок у имену
филмови = иа.сеарцх_мовие('роцк')
принт(филмови[0])
Ово би требало да одштампа први филм који пронађе, на пример:
Можете добити филм по његовом ИМДб ИД-у. Затим можете издвојити додатне информације као што су имена режисера и жанрови. Морате да проћи кроз листу да добијете појединачне информације.
из имдб увоз Цинемагоер
# Креирање инстанце класе Цинемагоер
иа = Биоскоп ()# Преузимање филма преко ИМДб ИД-а
филм = иа.гет_мовие('0468569')
принт(филм)# Штампање имена режисера филма
штампа ('Директори:')за режисера у филму['директори']:
штампа (директор['име'])# штампање жанрова филма
штампа ('Жанрови:')
за жанр у филму['жанрови']:
принт(жанр)
У излазу би требало да видите назив датог филма, његовог редитеља (и) и жанр (ове):
Трагање за особом
Можете тражити људе користећи особа за претрагу() методом. На пример, ако желите да тражите „Хеатх“, потребно је да покренете следећи код:
из имдб увоз Цинемагоер
# Креирање инстанце класе Цинемагоер
иа = Биоскоп ()
# Тражимо људе који имају Хеатх у свом имену
особе = иа.сеарцх_персон('Пустара')
принт(особа[0])
Видећете име прве одговарајуће особе коју претрага пронађе:
Сеарцхинг Цомпаниес
Можете тражити компаније користећи компанија за претрагу() методом. На пример, ако желите да тражите „Универсал“, потребно је да покренете следећи код:
из имдб увоз Цинемагоер
# Креирање инстанце класе Цинемагоер
иа = Биоскоп ()
# Тражење компанија које у називу имају Универсал
компаније = иа.сеарцх_цомпани('универзалан')
принт(компаније)
Добићете листу свих компанија које имају Универсал у свом имену.
Такође можете да преузмете податке о особи и компанији користећи њен ИД.
из имдб увоз Цинемагоер
# Креирање инстанце класе Цинемагоер
иа = Биоскоп ()# Добијање података о личности путем ИД-а
особа = иа.гет_персон('0005132')
штампа (особа ['име'])
штампа (особа ['Датум рођења'])
# Добијање података о компанији по ИД-у
компанија = иа.гет_цомпани('0005073')
штампа (компанија['име'])
Излаз ће показати детаље о особи и назив компаније:
Проналажење најбољих и најнижих филмова
Можете да преузмете податке за првих 250 и најнижих 100 филмова помоћу гет_топ250_мовиес() и гет_боттом100_мовиес() методе, односно:
из имдб увоз Цинемагоер
# Креирање инстанце класе Цинемагоер
иа = Биоскоп ()# Проналажење 250 најбољих филмова
топ = иа.гет_топ250_мовиес()
принт(врх[0])
# Проналажење доњих 100 филмова
дно = иа.гет_боттом100_мовиес()
принт(дно[0])
Као одговор, видећете име најбољег филма и име најгорег:
Библиотека биоскопа такође нуди неке друге методе као што су гет_топ250_тв(), гет_популар100_мовиес(), и гет_топ250_индиан_мовиес().
Анализа података је евалуација података помоћу аналитичких или статистичких алата за издвајање информација. Популарност анализе података расте сваким даном. Сада га користе предузећа, маркетиншке компаније и спортски тимови. Комплетан процес анализе података укључује дефинисање циљева, постављање питања, прикупљање података, прочишћавање података, анализу података и закључивање резултата.
Можете добити скупове података за своје пројекте користећи Питхон библиотеке као што је Цинемагоер или преко онлајн платформи као што је Каггле. Поред потпуних језика као што су Питхон и Р, можете користити и друге алате као што су Мицрософт Екцел, Таблеау и Стата за анализу података.