Security op Big Data platform wordt onderschat

Een van de grootste uitdagingen is tegenwoordig de beveiliging en bescherming van gevoelige bedrijfsinformatie. In het tijdperk van Big Data verzamelen en analyseren we steeds meer informatie. Ook nemen steeds meer organisaties beslissingen op basis van deze grote hoeveelheden datasets uit verschillende bronnen. Daarom moet (in)zicht en veiligheid op dit proces zeer serieus genomen worden.

Daarnaast wordt er van steeds meer organisaties geëist om toegangscontrole en privacybeperkingen toe te passen op deze datasets. Men dient zich te conformeren aan wettelijke voorschriften zoals ISO 27001, HIPAA en andere privacywetgevingen. Organisaties die dit niet op orde hebben, kunnen geconfronteerd worden met rechtszaken, negatieve publiciteit en boetes.

Met de komst van Big Data wordt het tijd om onze denkwijze over security eens kritisch onder de loep te nemen en waar nodig aan te passen. Onze huidige traditionele beveiligingsmechanismen zijn meestal nog afgestemd op het veiligstellen van kleinschalige statische gegevens en de daarbij horende omgevingen. Daarnaast wordt technische kennis veelal ingehuurd om deze omgeving in te regelen. Goede logging voorkomt dat data en informatie in welke vorm dan ook ongeautoriseerd uw organisatie verlaat.

Binnen populaire Big Data platformen (zoals de Hadoop en NoSQL data-analytische omgevingen) worden beveiligings- en privacy-uitdagingen nog eens versterkt door de snelheid, het volume en de verscheidenheid die ermee gepaard gaan.

Hadoop is van oorsprong voor intern gebruik ontwikkeld. Zaken zoals authenticatie en data-encryptie waren niet of gebrekkig aanwezig. Kies een goede leverancier en implementatiepartner om u te begeleiden.

Veel Big Data infrastructuuromgevingen starten in een Hadoop lab-achtige omgeving, vaak opgezet door innovatieteams. Deze teams worden in het leven geroepen omdat het vaak lastig is om op voorhand te bepalen welke winst het de organisatie zal gaan opleveren. Het is een gegeven dat er op dit moment binnen organisaties druk wordt geëxperimenteerd met Big Data, Open Source en Data Analytics software en applicaties. De meeste producten zijn na registratie gratis te downloaden bij de Open Source leverancier en er mag naar wens mee geëxperimenteerd worden.

Het daadwerkelijke probleem zou zo maar kunnen ontstaan wanneer al uw verzamelde data komt te staan op één nieuw dataplatform. De vraag is of deze omgeving dan wel veilig genoeg is om te voorkomen dat kwaadwillenden zomaar toegang tot deze data hebben. Een data analist zou zomaar een paar GB aan datasets kunnen meenemen op een USB stick. Al is het enkel maar om er thuis aan verder te werken…

Big Data, wat was dit ook alweer?

Een groeiend aantal bedrijven maakt tegenwoordig gebruik van Big Data platformtechnologie voor het opslaan van honderden Terabytes of zelfs Petabytes aan gegevens. Denk aan webloganalyses, bezoek- en klikgedrag en inzicht over bedrijfscommunicatie op social media. De meeste organisaties willen tot verbeterde of nieuwe inzichten komen over hun klanten of businesstrends. Deze voortdurende toename van data en gedetailleerdheid van gegevens, wordt momenteel versneld door verrijking vanuit data analytics, social media, Internet of Things (IoT) en multimedia. Dit alles blijft er de komende jaren nog wel voor zorgen dat er een blijvende dan wel versnelde stroom van gestructureerde en ongestructureerde data beschikbaar komt.

Dit geheel noemen wij Big Data en wordt in grote lijnen gekenmerkt door drie eigenschappen:

  1. De gegevens zijn talrijk.
  2. De gegevens kunnen niet (gemakkelijk) worden onderverdeeld in reguliere relationele databases.
  3. De gegevens worden gegenereerd, opgeslagen en dienen snel te worden verwerkt en geanalyseerd.

Security op Big Data platform onderschat

Momenteel worden er steeds vaker datalekken gemeld waarbij veel gegevens en/of accountsdetails zijn buitgemaakt. Ook de Autoriteit Persoonsgegevens die in Nederland datalekken behandelt, ziet een enorme stijging van het aantal datalekken. Verrassend is wel dat het grootste percentage van de datalekken komt door menselijke fouten of het ontbreken van logging. Met name binnen overheidsinstanties, de zorg en aanverwante instanties. Denk bijvoorbeeld aan een simpele fout waarbij persoonsgegevens naar de verkeerde persoon worden gestuurd, of gegevens die via een USB stick meegenomen worden. Ook zijn er gevallen bekend waarbij hackers soms maandenlang hun gang konden gaan voordat zij werden opgemerkt.

Vanuit het oogpunt van Big Data en beveiliging, zijn er volgens mij twee uitdagingen:

  1. Het veiligstellen van informatie in uw organisatie.

  2. Het instellen van autorisatie, authenticatie van medewerkers en logging van klantgegevens.

Veiligstellen van informatie in uw organisatie

Het gebruik van Open Source Big Data applicaties en platformen zoals Hadoop zijn immens populair. De analytische kracht die verkregen kan worden tegen lage (initiële) kosten, behoeven geen verdere uitleg. Echter kan de beveiliging van de opgeslagen bedrijfskritische informatie nog wel eens te wensen over laten. Al jaren wordt hierover geschreven en zelfs recent onderzoek door Gartner toont aan dat slechts 5% van alle gebruikers dit risico juist inschat. Vanuit COMPAREX adviseren wij Hadoop platformen zoals MapR, Cloudera of Hortonworks waarin via subscriptions de omgeving beter beveiligd kan worden dan met de standaard opties. Het is uiteraard verstandig om deze vorm van beveiliging goed in te regelen.

Zaken om vooraf goed over na te denken zijn: logging, authenticatie, autorisatie, encryptie op bestandsniveau en netwerkniveau, auditing, policy en procedures. Denk bij de laatste aan abusievelijke of bewuste acties door medewerkers en sociale datasetkoppelingen. Onlangs is in de media uitgebreid aandacht geweest voor dit onderwerp.

Instellen van autorisatie, authenticatie van medewerkers en logging van klantgegevens

Wanneer al deze gestructureerde en ongestructureerde gegevens worden ingeladen in het nieuwe Big Data platform (meestal Hadoop) dan staan deze datasets open voor diegenen die aan dit nieuwe platform werken, of die toegang weten te verkrijgen. Een minimale vorm van autorisatie, authenticatie, policy, datamasking of inregelen van databeveiliging middels encryptie is aan te raden vanaf het begin van het project. Een goede oplossing is het inregelen van logmanagement via Splunk of Arcsight.

Big Data en Security: behoed u voor datalekken en risico's

Met de bovenstaande wetenschap, kunt u zich voorstellen dat een datalek in uw Big Data platform meer (gevoelige) gegevens kan bevatten dan al uw oude systemen bij elkaar. Wees u goed bewust van de gevolgen die door bijvoorbeeld diefstal of een datalek kunnen ontstaan. En denk dus niet te licht over security en het beveiligen van uw Big Data, test- en acceptatieomgeving(en).

Het is van groot belang dat toegang(pogingen) tot uw bedrijfsnetwerk en omgevingen in een zo vroeg mogelijk stadium worden opgemerkt (zie over dit onderwerp ook deze blog van collega Roël Bouman). Alleen wanneer u dit inzicht heeft, kunt u hierop actie ondernemen. Met name inzicht in onderdelen waarvan u het bestaan op dit moment niet weet, speelt vele organisaties parten. Slechtwillenden kunnen zo wel tot maanden of zelfs jaren (!) ongehinderd hun gang gaan met het verzamelen van gevoelige informatie vanuit uw netwerk. Omdat deze manier geen schade brengt aan uw omgeving - anders dan financiële risico’s - hebben veel organisaties niet in de gaten dat dit plaatsvindt.

Vinden van de juiste security tooling

Er zijn verschillende oplossingen die u kunnen helpen bij het verkrijgen van inzicht wat er binnen uw bedrijfsomgeving plaatsvindt. Denk daarbij niet alleen aan hack- of inlogpogingen van buitenaf, ook intern kunnen zich bedreigingen voordoen. Bijvoorbeeld door accounts van medewerkers die al lange tijd niet meer werkzaam zijn voor uw organisatie maar waarvan de volledige persoonsgegevens en toegangscodes nog wel in Active Directory (AD) staan. Heeft u bijvoorbeeld inzichtelijk hoe vaak uw werknemers werkmappen proberen te benaderen die niet voor hen bedoeld zijn? En wanneer dit op dagelijkse basis gebeurt, onderneemt u daar op dit moment actie tegen?

Softwareleveranciers die goede producten hebben om dit inzichtelijk te maken zijn: Elastic, Splunk en ArcSight.

Splunk, ArcSight (HPe) en Elastic (ELK)

Verkrijg binnen enkele dagen volledig inzicht wat er gebeurt binnen uw IT-omgeving. Met deze intelligente manier van monitoring verkrijgt u snel en gemakkelijk toegang tot al uw firewall, applicatie, AD en webserver logs. Deze softwarepakketten vinden patronen en herkennen zaken die verdacht zijn. Middels een geheel aan uw voorkeuren aan te passen dashboard verkrijgt u dit inzicht en kiest u de manier waarop u gealarmeerd wenst te worden.

Splunk dashboard

Realtime inzicht met Elastic ELK:

Elastic ELK reatime inzicht

Meer informatie?

Wilt u meer weten over dit onderwerp en advies hoe u de beveiliging van uw Big Data omgeving kunt verbeteren? Neem dan contact met mij op en ik ga graag het gesprek met u aan. U vindt mijn contactgegevens op deze pagina.

Neem contact op

Remco Toele

Remco Toele

Solution Advisor Big Data & Analytics

Deel deze pagina