Реклама
Када су у питању онлајн базе података и информације које се могу наћи унутар онога што је опште познато као „невидљива мрежа 12 најбољих претраживача за истраживање невидљивог вебаГоогле или Бинг не могу да траже све. Да бисте истражили невидљиви веб, потребно је да користите ове посебне претраживаче. Опширније “, нисам ваш типичан корисник. Наравно, проводим мало превише свог времена прегледавајући онлајн базе података на местима као што су Национални архив и ЦИА ФОИА читајући просторију, али морам да кажем да ме ништа више не узбуђује него када пронађем табелу засновану на ХТМЛ-у испуњену обимовима наизглед сложених и неповезаних података.
Чињеница је да су табеле са подацима златни рудник важних истина. Податке често прикупљају армије сакупљача података са чизмама на земљи. Имате људе са америчког пописа који путују по целој земљи ради информација о домаћинству и породици. Имате непрофитне еколошке групе које прикупљају све врсте занимљивих информација о животној средини, загађењу, глобалном загревању и још много тога. А ако се бавите паранормалним или уфологијом, постоје и стално ажуриране табеле са информацијама о виђењима чудних објеката на небу изнад нас.
Иронично, помислили бисте да би било која влада на свету била заинтересована да зна какву врсту стране летелице се примећују на небу изнад било које земље, али очигледно не – барем не у САД. У сваком случају. У Америци, колекција необичних виђења заната пребачена је у тимове аматерских хобиста који хрле на нова виђења НЛО-а попут мољаца у пламену. Моје интересовање за ова виђења заправо не потиче од фасцинације ванземаљцима или занатима са других планета, већ из научне фасцинације обрасцима - где и зашто више људи види ствари на небу, и да ли та виђења могу да одражавају нешто веома стварно и много приземније на.
Да бих истражио количине података које су прикупили тимови љубитеља НЛО-а, заправо сам развио начин за увоз великих ХТМЛ табела податке у Гоогле табелу, а затим манипулишите и анализирајте те податке да бисте издвојили и открили значајне и важне информације. У овом чланку намеравам да вам покажем како да урадите исто.
Важни ХТМЛ подаци у Гоогле табелу
У овом примеру ћу вам показати како да увезете све податке који могу бити ускладиштени у табели на било којој веб локацији на Интернету, у вашу Гоогле табелу. Размислите о огромној количини података који су данас доступни на Интернету у облику ХТМЛ табела. Сама Википедија има податке у табелама за теме попут глобално загревање, Биро за попис становништва САД има тоне скупови података о популацији, а мало гуглања ће вам донети много више од тога.
У мом примеру, почињем са базом података у Националном центру за извештавање о НЛО која заправо изгледа као да би то могла бити база података дубоког веба у стилу упита, али ако приметите Структурирање УРЛ-а, то је заправо полу-сложен систем извештавања заснован на вебу који се састоји од статичних веб страница и статичних ХТМЛ табела – управо оно што желимо када тражимо податке за увоз.
НУФорц.орг је једна од оних организација која служи као један од највећих центара за извештавање о виђењима НЛО-а. Није једини, али је довољно велик да пронађе нове скупове података са тренутним опажањима за сваки месец. Ви бирате да видите податке сортиране по критеријумима као што су Држава или Датум, а сваки од њих је обезбеђен у облику статичне странице. Ако сортирате по датуму, а затим кликнете на најновији датум, видећете да табела која је тамо наведена представља статичну веб страницу која има назив према формату датума.
Дакле, сада имамо образац да редовно издвајамо најновије информације о виђењима из ове базе података засноване на ХТМЛ-у. Све што треба да урадите је да увезете прву табелу, користите најновији унос (најгорњи) да идентификујете најновије ажурирање, а затим користите датум тог објављивања да бисте направили УРЛ везу где је најновија табела ХТМЛ података постоји. За ово ће једноставно бити потребно неколико инстанци функције ИмпортХТМЛ, а затим и неколико креативних употреба функција за манипулацију текстом. Када завршите, имаћете једну од најбољих, самоажурирајућих табела за извештавање. Хајде да почнемо.
Увоз табела и манипулација подацима
Први корак је, наравно, креирање нове табеле.
Дакле, како увозите ХТМЛ табеле? Све што вам треба је УРЛ на коме је табела ускладиштена и број табеле на страници – обично је прва наведена 1, друга 2 и тако даље. Пошто знам УРЛ те прве табеле са наведеним датумима и бројем виђења, могуће је увести тако што ћете откуцати следећу функцију у ћелију А1.
=импортхтмл(“ http://www.nuforc.org/webreports/ndxpost.html?”&H2,”table”,1)
Х2 држи функцију „=сат (сада())“, тако да ће се табела ажурирати сваког сата. Ово је вероватно екстремно за податке који се ово ретко ажурирају, тако да бих се вероватно могао извући да то радим свакодневно. У сваком случају, горња функција ИмпортХТМЛ доноси табелу као што је приказано испод.
Мораћете мало да манипулишете подацима на овој страници пре него што можете да саставите УРЛ за другу табелу са свим виђењима НЛО-а. Али само напред и креирајте други лист у радној свесци.
Пре него што покушате да направите тај други лист, време је да издвојите датум објаве из ове прве табеле, како бисте направили везу до друге табеле. Проблем је у томе што се датум уноси као формат датума, а не као низ. Дакле, прво морате да користите функцију ТЕКСТ да бисте конвертовали датум објављивања извештаја у стринг:
=текст (А2,”мм/дд/ии”)
У следећој ћелији са десне стране, потребно је да користите функцију СПЛИТ са граничником „/“ да бисте поделили датум на месец, дан и годину.
=подела (Д2,”/”)
Изгледа добро! Међутим, сваки број треба да буде постављен на две цифре. Ово радите у ћелијама одмах испод њих помоћу команде ТЕКСТ поново.
=текст (Е2,”00″)
Формат „00“ (то су нуле) намеће две цифре или „0“ као чувар места.
Сада сте спремни да поново изградите цео УРЛ у најновију ХТМЛ табелу нових виђења. То можете учинити коришћењем функције ЦОНЦАТЕНАТЕ и спајањем свих битова информација које сте управо извукли из прве табеле.
=удружити(“ http://www.nuforc.org/webreports/ndxp”,G3,E3,F3,”.html”)
Сада, на новом листу који сте креирали изнад (празан лист), урадићете нову функцију „импортхтмл“, али овог пута за прву Параметар УРЛ везе, тако да ћете се вратити на прву табелу и кликнути на ћелију са УРЛ везом коју сте управо креирали.
Други параметар је „табела“, а последњи „1“ (јер је табела посматрања прва и једина на страници). Притисните ентер, и сада сте управо увезли целокупну количину виђења која су објављена тог одређеног датума.
Дакле, вероватно мислите да је ово лепа новина и све - мислим, на крају крајева, оно што сте урадили је извучено постојеће информације из табеле на Интернету и пренели их у другу табелу, иако приватну у вашим Гоогле документима рачун. Да, тако је. Међутим, сада када се налази на вашем приватном налогу Гоогле докумената, на дохват су вам алатке и функције за бољу анализу тих података и почетак откривања невероватних веза.
Коришћење обртних извештаја за анализу увезених података
Недавно сам написао чланак о употреби Заокружени извештаји у Гоогле табели Постаните експертски аналитичар података преко ноћи користећи Гоогле алате за извештаје прорачунских табелаДа ли сте знали да је један од најбољих алата за анализу података заправо Гоогле табела? Разлог за то није само зато што може да уради скоро све што можда желите... Опширније да извршите све врсте кул анализе података. Па, можете да урадите исте невероватне акробације анализе података на подацима које сте увезли са Интернета – дајући вам могућност да откријете занимљиве везе које вероватно нико други раније није открио ти.
На пример, из коначне табеле опажања, могао бих да одлучим да користим централни извештај да погледам број различити јединствени облици пријављени у свакој држави, у поређењу са укупним бројем виђења у тој одређеној држави држава. Коначно, такође сам филтрирао све што помиње „ванземаљце“ у одељку за коментаре, да бих, надам се, избацио неке од више вингнут уноса.
Ово заправо открива неке прилично занимљиве ствари одмах, као што је чињеница да Калифорнија очигледно има највише број пријављених виђења било које друге државе, заједно са разликом пријављивања највећег броја облика пловила у земљи. То такође показује да су Масачусетс, Флорида и Илиноис велики нападачи и у одељењу за НЛО (барем према најновијим подацима).
Још једна занимљива ствар у вези са Гоогле табеларним подацима је широк спектар дијаграма који су вам доступни, укључујући гео-мапу која вам омогућава поставите „вруће тачке“ података у графичком формату који се заиста истиче и чини те везе унутар података прилично очигледан.
Ако размислите о томе, ово је заиста само врх леденог брега. Ако сада можете да увезете податке из табела података на било којој страници на Интернету, само размислите о могућностима. Добијте најновије берзанске бројеве или најновијих 10 најбољих књига и аутора на листи бестселера Њујорк Тајмса, или најпродаваније аутомобиле на свету. Постоје ХТМЛ табеле на скоро сваку тему коју можете замислити, а у многим случајевима те табеле се често ажурирају.
ИмпортХтмл вам даје могућност да своју Гоогле табелу повежете са Интернетом и напајате податке који тамо постоје. То може постати ваше лично средиште информација које можете користити за манипулацију и масирање у формат са којим заправо можете радити. То је само још једна веома згодна ствар коју треба да волите у Гоогле табели.
Да ли сте икада увезли податке у своје табеле? Које сте занимљивости открили у тим подацима? Како сте користили податке? Поделите своја искуства и идеје у одељку за коментаре испод!
Заслуге за слике: Бусинесс Грапх
Рајан је дипломирао електротехнику. Радио је 13 година у области аутоматизације, 5 година у ИТ-у, а сада је инжењер апликација. Бивши главни уредник МакеУсеОф-а, говорио је на националним конференцијама о визуелизацији података и био је представљен на националној телевизији и радију.