Blog

Datacenter

Object Storage: niet de volgende file share

10 aug 2018

In mijn wekelijkse werkzaamheden spendeer ik veel tijd aan het lezen en beantwoorden van Europese aanbestedingen en marktconsultaties. Steeds vaker zie ik vragen over het principe Object Storage voorbij komen. Naast deze vragen komt Object Storage ook steeds vaker voor in de dagelijkse gesprekken met collega’s en klanten. Het valt mij echter op dat men niet lijkt te weten wat het precies is. Vaak wordt Object Storage afgeschilderd als ‘de volgende Windows file share’, maar dat is toch echt te kort door de bocht. Of beter gezegd: het is een foute omschrijving.

Pascal de Wild door Pascal de Wild

Object Storage klinkt voor veel mensen erg ingewikkeld, terwijl het al een lange tijd bestaat. Amazon S3 klinkt voor de meesten wel redelijk bekend, ondanks dat ze niet weten wat dit precies is. Overigens merk ik dat de algemene indruk is dat Amazon Object Storage heeft uitgevonden, maar dit is helaas niet waar. Het is op dit moment wel de grootste Object Storage-omgeving die bestaat, dat moge duidelijk zijn. Het ontstaan van Object Storage ligt veel verder in het verleden en eigenlijk is het principe zeer eenvoudig. Een ‘bestand’ (want dat vergelijkt makkelijker) bestaat uit twee delen: de feitelijke data en de metadata. En waar bij een normaal bestand de metadata bestaat uit de naam, is het bij een object mogelijk om hier diverse beschrijvingen aan te hangen. Hier kunnen eigenschappen gedefinieerd worden naar eigen keuze. Het maakt niet uit welke eigenschap je aan een object wilt hangen, alles is mogelijk.

Een stapel fotoalbums

Vergelijk het even met een fotoalbum. Of eigenlijk met hele stapels fotoalbums. In onze digitale fotoalbums zijn we gewend dat we mapjes hebben, met de vakantie van vorig jaar, de verbouwing van drie jaar geleden en uiteraard de foto’s van kinderen, huisdieren en auto’s. Maar als ik op mijn telefoon door mijn foto’s blader, kan ik ook kiezen voor alle foto’s die ik in Antwerpen genomen heb. Of bij een klant in Venlo. Ook kan ik kiezen voor de map met alle selfies die gemaakt zijn, of alle video’s. En om het compleet te maken, herkent mijn iPhone ook gezichten en sorteert ook die weer in mapjes. Dit is exact wat Object Storage is. De foto’s zijn de objecten, met een heel aantal eigenschappen per foto. Waar, wanneer, wat erop staat, hoe de foto genomen is en ga zo maar verder. Het verschil met een normaal bestand is dat zo’n foto in meerdere mapjes tegelijk zitten gesorteerd op kenmerk. Namelijk: een selfie, genomen in Antwerpen, in 2018, met mijn gezicht. Uiteraard is het opvragen van de foto’s door middel van de metadata ondergebracht in een losse applicatie.

Zakelijke Object Storage

Dus iedereen die dit blog leest heeft al ervaring met Object Storage, wellicht zonder dat we het doorhebben. Maar waar ik het in dit blog over wil hebben, is de zakelijke Object Storage. Deze manier van dataopslag wordt gebruikt voor de opslag van data die goed doorzoekbaar moet zijn. Vaak zie je dit terug bij mediabedrijven, maar ook in ziekenhuizen (denk aan röntgen foto’s en MRI’s), de politie en beveiligingsbedrijven (body cams bijvoorbeeld). Maar uiteraard wordt dit ook gebruikt voor ander soort data, bijvoorbeeld seismische data, radioanalyse en blauwdrukken. Eigenlijk alle mogelijke data, waarin gezocht moet worden op basis van de eigenschappen van de data. Doordat de metadata variabel wordt opgeslagen, is het eenvoudig en doelgericht doorzoeken van miljarden objecten te realiseren. Belangrijk is om de metadata goed te definiëren, maar dat wordt doorgaans verzorgd door de software die de Object Storage gebruikt. En dat is (voor mij) het primaire verschil tussen normale bestanden en Object Storage. Normale bestanden en mapjes worden gebruikt en doorzocht door mensen. Object Storage wordt gebruikt en doorzocht door software.

Geen Windows file share

Dat Object Storage wordt gebruikt en doorzocht door software toont aan dat Object Storage niet ‘de volgende Windows file share’ is, maar een totaal andere manier van dataopslag. Een van de mogelijke oplossingen is NetApp StorageGrid. Bij NetApp denkt nagenoeg iedereen aan de ONTAP-systemen. Dit zijn de Unified storageoplossingen, die alle soorten storageprotocollen aan kunnen. Dit klopt echter niet. De ONTAP-systemen kunnen de standaard datacenterprotocollen aan, maar vooralsnog geen Object Storage. StorageGrid is de oplossing die Object Storage voor zijn rekening neemt in het portfolio van NetApp. Uiteraard is StorageGrid S3 compatibel, enorm schaalbaar en enorm betrouwbaar. Omgevingen met meer dan 100 miljard objecten, 120 Petabyte capaciteit en 16 geografisch gescheiden locaties zijn mogelijk. Het is simpelweg niet mogelijk om dergelijke omgevingen te realiseren met de conventionele bestandsdelingen. Maar uiteraard is dit ook op een kleinere schaal mogelijk en wenselijk. Object Storage bestaat al sinds 1995, maar begint de laatste paar jaar echt aan terrein te winnen en dat is ook logisch in een wereld die steeds meer om data draait. De beschikbaarheid van data en vooral de doorzoekbaarheid van data is steeds belangrijker.

Object Storage is een van de mogelijke antwoorden op de steeds groter wordende honger naar data en analyse op die data. Voor mijn gevoel zal er in de aankomende tijd steeds meer vraag komen naar Object Storage en daarmee ook naar kennis hierover. Ik hoop dat ik met dit blog de lezer kan helpen met de eerste stap en ik zal in de nabije toekomst een volgende blog schrijven welke meer informatie geeft over de mogelijkheden die Object Storage biedt. Uiteraard hoor ik het graag als er in de tussentijd al vragen zijn.

Geïnteresseerd?

Pascal de Wild
Neem contact op met onze specialist Pascal de Wild

Pascal de Wild is Pre-Sales Consultant in het Telindus Datacenter team. Met meer dan 15 jaar ervaring in het ontwerpen, inrichten en onderhouden van diverse datacentra bij de grotere transport- en mediabedrijven is Pascal bij klanten een graag geziene gast. Door een gespreide kennis over networking, compute, security en het zwaartepunt op storage heeft hij een totaalbeeld van een gewenste omgeving. Bij Telindus is hij onderdeel van het Datacenter team om voor klanten een passend advies uit te brengen. In de avonden en in het weekend is Pascal vooral bezig met zijn hobbies golfen en het rijden in oldtimers.

1 reactie
Plaats een reactie
Odin Nijenhuis - 13 augustus 2018

Heldere uitleg Pascal! Goed te zien dat we in de samenwerking alternatieven naar onze klanten kunnen bieden waarbij we wel de garantie op SLA en datalocatie kunnen bieden. Geen cost in, geen cost out, oftewel wel de voordelen van de hyperscaler, niet de nadelen!