Big Data: Det store forsvar

Det var smart engang, men nu hagler kritikken ned over Big Data-bevægelsen. Indvendingerne er mange, fra det er tom buzz til ond Big Brother-teknologi. Her er de centrale argumenter, når andre ser de store problemer i de store muligheder med de store mængder af data.

The Big What?
The Big What?

Kritikken: Det er en tom trend – ren buzz

Dit svar: Historien med stort H er Big Data med stort B

Historien og samfundet halser altid efter den teknologiske udvikling, som altid skaber historie, fordi den er historiens drivkraft. Lige nu digitaliseres produkter, processer og distribution i dybden. Den digitale genskabelse og genopfindelse af alt fra musik til dating ændrer dramatisk vores hverdag og virkelighed, og datadrevne ekspertsystemer og maskinlæring vil overtage flere og flere opgaver inden for administration, medicin og jura.

Nye digitale forretninger fra Spotify til Tinder opstår og forandrer hele industrier og værdikæder. Og nøgleordet er datafikation – altså at alt og alting bliver til data. Input og output er store mængder data. Big Data er derfor ikke blot et smart buzzword. Begrebet beskriver en afgørende historisk teknologisk udvikling, og derfor gør Big Data en forskel, som bliver historisk. Big Data er fusionen mellem industrialiseringen og internettet i et nyt, altomfattende industrielt internet og er dermed en dyb samfundsforandrende trend, langt dybere end andre trends og tendenser.

Her kan den historiske udvikling ses som forskellige bølger. Big Data er den tredje og sidste bølge, og den er endnu større end industrialiseringen. Det er fusionen af industrialiseringen og internettet
Her kan den historiske udvikling ses som forskellige bølger. Big Data er den tredje og sidste bølge, og den er endnu større end industrialiseringen. Det er fusionen af industrialiseringen og internettet

Kritikken: Big Data er spild af penge, og værdien er uklar

Dit svar: Big Data har bevist sin værdi i praksis

Big Data er her allerede og er i funktion forretningsmæssigt. Verdensberømte datadrevne virksomheder som Google og Amazon skaber lige nu klogere søgeresultater, bedre bannersalg og mere bogsalg med analytisk brug af store mængder af data.

Samtidig bevæger man sig inden for markedsføring, e-handel og digital kommunikation hastigt mod et nyt datadrevent Big Data-paradigme. Det betyder bedre salg og udgiftsstyring. Amazon har øget sit mersalg og krydssalg markant ved hjælp af datadrevne anbefalinger.

Et illustrativt eksempel er den voksende og succesrige brug af den såkaldte datadrevne A/B-testing, hvor store mængder af data erstatter traditionelle kvalitative test-metoder. Det virker i praksis, og det gør en forretningsmæssig forskel lige nu og her. Ergo: Big Data har bevist sin return on investment i praksis. Derfor bliver dine konkurrenter mere og mere datadrevne. Når nu fremtidens konkurrencefordel er her, er spørgsmålet, om du tør vente.

NSA (National Security Agency) har været en dårlig reklame for Big Data
NSA (National Security Agency) har været en dårlig reklame for Big Data

Kritikken: Big Data er overvågning og krænkelse af privatlivet pr. definition.

Dit svar: Big Data er ikke nødvendigvis Big Brother

Overvågning er blevet et varmt emne i den offentlige debat. En række sager fra den amerikanske NSA-skandale til den seneste nyhed om Se og Hørs aflytninger har skabt vrede og frygt. Flere og flere er med rette blevet bekymret for, om digitaliseringen betyder mere overvågning og mindre privatliv.

I den følelsesladede debat er Big Data blevet til Big Brother og omvendt. Man tilskriver teknologien indbyggede negative kvaliteter, hvor brugsmulighedernes mangfoldighed reduceres til en enkelt mulighed for misbrug. Men total overvågning er ikke den nødvendige betingelse for Big Data, blot den tilstrækkelige.

Overvågning vil altid antage teknologiens nyeste former, lige fra middelalderborgens tårn over anden verdenskrigs radar til den aktuelle digitalisering. Alle værktøjer kan bruges som våben, men ingen værktøjer er kun et våben. Det viser udviklingen af atomteknologi til både våben og fredelig energikilde. Staten kan bruge Big Data til ulovlig overvågning, men det er blot en mulighed, som er afhængig af adgang, brug og ejerskab.

Datafikationen forandrer alting. Hvordan vi vil udnytte og forme disse forandringer er en løbende og potentielt åben politisk proces, som er parallel til og uafhængig af teknologien. Big Data kan derfor lige så godt bruges som et personligt og privat Big Data-værktøj til at blive hurtigere på ens løbetur eller sikre ens helbred ved at samle store mængder af personlige helbredsdata. Data kan kontrollere og overvåge, men det kan også bruges til selvovervågning og selvudvikling, som vi ser i selvmålingsbevægelsen. Big Data er derfor ikke nødvendigvis Big Brother, men kan ende som det, hvis vi ikke politisk tager stilling, og det er et fælles politisk ansvar.

Kritikken: Big Data er en farlig og uholdbar tro på, at statistiske metoder med tal og data kan erstatte alle andre former for erkendelse og metoder.

Dit svar: Big Data er ikke en ensidig erstatning, men et sundt supplement

Kritikerne af Big Data har med vilje tegnet et meget forsimplet og forkert billede af fænomenet. Når de fremstiller Big Data som en farlig erstatning for andre metoder, nævner de alle de traditionelle kritikpunkter af alle kvantitative metoder. Data er akausale, korrelationer er ikke kausaliteter, årsag-virkning er i virkeligheden virkning-årsag og så videre.

Jo flere variabler, jo flere falske korrelationer.
Jo flere variabler, jo flere falske korrelationer.

Samtidig har man fremhævet de mest ekstreme datafundamentalister som repræsentative for hele begrebet. Tilbage står et billede af Big Data som en fanatisk tro på tal og data og fuld erstatning for indsigt og mening. Intet kunne være mere forkert. Naturligvis kan data ikke tale af sig selv, og naturligvis kan data ikke erstatte alle teorier. Big Data hverken kan eller skal erstatte, men til gengæld støtte og kvalificere kvalitative undersøgelser. Det er ikke et enten-eller, men et både-og.

Substitutionen er et tomt postulat, og supplementet er sandheden og den værdifulde praksis. De kvantitative tal skal kvalificere den kvalitative betydning og omvendt. Når kritikerne fremhæver alle de traditionelle kritikpunkter mod kvantitative metoder, glemmer de den pointe, at svaghederne ved den kvalitative tilgang udlignes i kombinationen med de kvalitative metoder. Hvor den store – big – nye mulighed er, at enhver kan indsamle og analysere på baggrund af den samlede population af data. Men det er en ny mulighed, der føjer sig til alt det, vi kendte i forvejen,  ikke den absolutte erstatning for det. Hvis nogen siger noget andet, er det en stor løgn.

no-of-mentions-in-investor-presentations-and-conference-calls-change-2012-2013_chartbuilder-1
The Big Buzz plus 43 %??

Kritikken:  Big Data er gammel vin på nye flasker. Nyt navn, men blot samme klassiske kvantitative metoder, maskeret som noget nyt og spændende.

Dit svar: Big Data er fremtiden

Når noget nyt og afgørende opstår, vil alle være med på moden. De gamle vil prøve at være de nye for ikke at blive uaktuelle og glemt. Enhver, som arbejder med bare et enkelt excel-ark, er nu derfor Big Data-ekspert. Enhver datavisualisering kaldes en Big Data-analyse.

De gamle meningsmålingsinstitutter, Business Intelligence og mediebureauer med falsk varebetegnelse kalder sig Big Data, men sandheden er, at de blot arbejder på samme måde, som de altid har gjort. Det skaber et uklart billede, ikke mindst fordi begrebet i sin essens er uklart og relationelt. For hvad er stort, og hvad er stort nok til at blive kaldt Big Data? Lad os dog se bort fra dem, som sælger gammel kvantitativ vin på nye Big Data-flasker. De er nemlig slet ikke Big Data, for Big Data er noget nyt og andet end dem.

Big Data er det teknologiske gennembrud for prædikative metoder.
Big Data er det teknologiske gennembrud for prædikative metoder.

amazon(1)

New_York_City_is_using_big_data_to_predict_fires___The_Verge
Du ved det ikke endnu, men du kommer til at købe bogen. Det ved Amazon, som kan forudsige, hvilke bøger du vil købe i fremtiden. Det amerikanske supermarked Target ved, hvilke produkter du køber om en uge, og kommunen ved, hvor der vil opstå en brand eller kriminalitet i fremtiden

Altså …

Når man ellers har nok historisk data, er Big Data den store og nye mulighed for at forudsige en sandsynlig fremtid.  Resultatet er tilsynekomsten af den forudsigende stat og virksomhed drevet frem af de store mængder af data og ikke mindst af nye datakilder og sensorer i snart sagt alt, lige fra biler til mobiltelefoner. Naturligvis under den forudsætning, at virkeligheden er stabil og årsagsforholdet er relativt robust og enkelt. Altså for enkle og rutineprægede handlinger, som millioner af mennesker foretager igen og igen.

Man kan naturligvis ikke forudsige fremtidens helt store overraskelser og usandsynligheder, men man kan forudsige, hvordan en registrering af fortiden vil forme sig i fremtiden. Altså den sandsynlige fremtid, hvis fortid er lig nutid, og nutid er lig fremtid.

Vi står over for det store, altafgørende ontologiske og epistemologiske skift i Big Data, hvor vi bevæger os mod det aktuariske samfund og en ny tidsalder. Altså at alting får en sandsynlighed, og aktuarens forsikringsmatematiske blik på virkeligheden bliver alles blik på alting.

Et billede fra filmen Minority Report, som var Big Data før Big Data, og som handler om fremtidens mulighed for at forudsige forbrydelser, før de sker. For nogle gange må man forudsige fremtiden for at forhindre den
Et billede fra filmen Minority Report, som var Big Data før Big Data, og som handler om fremtidens mulighed for at forudsige forbrydelser, før de sker. For nogle gange må man forudsige fremtiden for at forhindre den

Kommentarer

kommentarer