Overslaan naar content

Het verschil tussen Data Engineering & Data Science

Vraag aan tien Data Engineers en tien Data Scientists wat voor werk ze doen, en je krijgt twintig verschillende antwoorden. Wat die antwoorden in ieder geval gemeenschappelijk hebben is dat je werkt met data en code. Maar hoe zit het nou precies en hoe zien deze rollen er uit bij de Hot ITem Groep?

Referentiearchitectuur

Bij de Hot ITem Groep werken we met een referentiearchitectuur. Deze architectuur is de leidraad die we volgen in al onze projecten. We creëren een gemeenschappelijke datalaag waarmee we aan alle databehoeftes van de klant kunnen voldoen. Dashboards nodig? Geen probleem. Een statisch rapport naar de toezichthouder? Komt voor elkaar. Daarnaast een voorspelmodel nodig? Kom maar op. Door de data één keer te prepareren, kunnen BI-, Business-, en Data Science-experts snel waarde uit de data halen, zonder dat ze de data eerst zelf nog moeten prepareren.

Referentiearchitectuur

Datapreparatie en modelontwikkeling

Je hoort Data Scientists vaak zeggen dat zo’n 80% van hun werk bestaat uit datapreparatie. Bij ons wordt dat werk door een Data Engineer gedaan. De Data Engineer werkt met moderne technieken, in de cloud of on-premise, om data beschikbaar en juist gemodelleerd te krijgen. Onze Data Scientists gebruiken deze data vervolgens om modellen te maken en deze óók te industrialiseren, oftewel echt in gebruik te laten nemen. Doordat de data al beschikbaar is, is de kans klein dat een traject in de PoC-fase blijft hangen; een veel gehoorde ergernis onder Data Scientists.

Wie doet wat?

Het onderscheid lijkt volkomen duidelijk. Hoe komt het dan dat je toch zoveel verschillende antwoorden krijgt? Dat heeft waarschijnlijk te maken met het feit dat je in beide rollen veel werkt met data, veel code schrijft en altijd afstemt met de business om de requirements scherp te krijgen. Mensen die bij de ene organisatie Data Scientist worden genoemd, zullen ergens anders Data Engineer als functietitel hebben en vice versa. Bovendien zijn er veel variaties mogelijk in de mate waarin je je bezighoudt met de verschillende factoren van dit vakgebied.

Zoals gezegd is bij ons de scheiding tussen de twee rollen juist wel heel duidelijk. Door te werken vanuit één datafundament hoeft data maar één keer te worden geprepareerd. En daardoor kunnen mensen in beide rollen doen waar ze echt goed in zijn.

Nieuwsgierig geworden naar de mogelijkheden bij Hot ITem?

Wij zijn altijd op zoek naar talentvolle data-consultants en -specialisten. Bekijk de openstaande vacatures bij Hot ITem en wie weet worden we collega’s!

De Hot ITem Groep maakt onderdeel uit van het Conclusion ecosysteem. Een unieke bundeling van bedrijven op het gebied van Business Transformatie en IT Services, met elk hun eigen signatuur en vakgebied. Wat ons verbindt? De drive om met oplossingen te komen die echt impact maken.