Thursday, October 16, 2014

Што е тоа "Big Data"? Пост.01

Постот е прв дел од мојот семинарски труд за политичката академија "Friedrich Ebert": " Алтернативни Методи за Мерење на Јавното Мислење"



Терминот “Big Data” во последните неколку години го сретнуваме насекаде, меѓутоа неговото значење не е конкретно дефинирано, а со тоа и употребата на терминот често е арбитрарна. Користењето на терминот може да се поврза со два фундаментални концепти, едниот е во контекст на тоа дека обемот на податоците е преголем т.е. преголем за да биде обработен на еден компјутер, така што ‘big data’ се користи во контекст на тоа дека податоците кои се субјект на понатамошна обработка за да се добијат некакви резултати се преголеми во смисла на тоа колку меморија зафаќаат. Пример за ова е Гугл или Фејсбук кои чуваат детални податоци за стотици милиони нивни корисници. Инфраструктурата за зачувување на податоците и особено за нивно прикажување во краток временски интервал е многу комплексна, како и различна од она што се користело во минатото. Така, техничките инжињери создадоа нови методи за сочувување и прикажување на податоците соодветни со модерното време.




Вториот контекст во кој се користи изразот ‘big data’ е во смисла на обемот на податоци кои ги генерираат нашите хардверски и софтверски уреди. За разлика од контекстот на тоа дека податоците не ги собира во меморијата на еден компјутер, вториот контекст е во смисла на тоа дека едноставно луѓето генерираат многу повеќе податоци отколку во минатото. Доста познато истражување на гигантската компанија IBM доаѓа до наодот дека 90% од податоците генерирани во целата историја на чоештвото се генерирани во последниве 2 години. И растот на обемот на податоци кои чоештвото ги генерира не се успорува, туку напротив се повеќе расте (експоненцијално). Така, може да се каже дека терминот ‘big data’ се користи во два контексти, првиот за тежината на самите податоци и вториот за количината на податоци кои ги генерираат техничките уреди.







Фигура 01. Извор - Forbes.com



Фигура 02




По периодот на адаптација, во кој се промени системот за да се приспособи кон новите потреби, следуваше периодот на бројни дебати и истражувања околу тоа што се може да се направи со волку податоци. Најчесто мотивот за ваквите дебати е од профитабилен карактер, односно, компаниите водени од желба за профит ги истражуваат новите можности. Меѓутоа, како што подоцна ќе објаснам подетално, исто така и владите не заостанаа кога станува збор користење на овие податоци. Случајот со Американската агенција НСА (Национална Сигурносна Агенција) и Едвард Сноуден е повеќе од познат. По одвивањето на овие бројни адаптации, би рекол дека може да се каже дека влеговме во некоја трета фаза од процесот, каде новогенерираните податоци веќе се обработуваат и ова се случува насекаде: во бизнис сферите, во научните истражувања, мерење на јавното мислење, работата на владите итн. Во овој труд јас ќе се задржам на методите, кога станува збор за користењето на ‘big data’, за мерење на јавното мислење и за научни цели.

No comments:

Post a Comment