Big data, big food? Van meten naar weten, procesoptimalisering en kostenreductie

Gepubliceerd op 10 juli 2015

Tal van machines en sensoren leveren aan de lopende band data. Een enorme hoeveelheid data is niet automatisch big data. Big data combineert gegevens uit verschillende bronnen om trends te herkennen of bepaalde conclusies te trekken. Hierdoor worden relaties tussen gegevens zichtbaar die voorheen ontoegankelijk waren. De blootgelegde verbanden worden dan vertaald naar een voorspellend model waarmee direct kan worden nagegaan wat het effect is van een bepaalde parameter op de kwaliteit van het eindproduct. Problemen kunnen zo in een vroeg stadium worden opgespoord en opgelost.

Big data, industry 4.0, internet of things… u hebt deze termen ongetwijfeld al eerder voorbij horen komen. Het is een hot topic op vele congressen en vakbeurzen, maar wat kan je hier nu mee als (klein) voedingsbedrijf? Analyse van data is uitermate belangrijk. Meten is een ding, maar pas als je relevante informatie kan extraheren uit deze data kan je de volgende stap zetten naar procesoptimalisering, kwaliteitsverbetering en kostenreductie. Ook Flanders’ FOOD zet hierop in met een opleidingsreeks “Haal meer uit je data – van meten tot procesbijsturing”.

Data verzamelen en analyseren

Voedingsbedrijven staan onder constante druk om te produceren aan een constante hoge productkwaliteit tegen de laagst mogelijke kost. Nieuwe methoden voor het verzamelen van informatie en het analyseren en combineren van grote datasets bieden heel wat potentieel voor kostenreductie en kwaliteitsborging. Daarnaast is er de trend naar meer digitalisering: steeds meer gegevens van productie-, reinigings- en logistieke processen worden opgeslagen in bijvoorbeeld de cloud of andere systemen. Deze gegevens zijn afkomstig van onder meer sensoren die producteigenschappen in-line of on-line meten, labo-analyses, …

Om uit al deze beschikbare date de relevante informatie te kunnen extraheren zijn er de laatste jaren complexe data-analysetechnieken op punt gesteld. Het is nu mogelijk om verbanden te ontdekken tussen specifieke gegevens en productkwaliteit en/ of kosten. Deze verbanden kunnen op hun beurt weer inzicht geven in hoe en waar ingegrepen kan worden in het proces om kosten te reduceren en de kwaliteit te verhogen. Investeren in bijvoorbeeld sensoren rendeert immers pas als er met de gegenereerde data ook effectief iets gedaan wordt.

Meer en meer sensoren, meer en meer data

Data-algoritmen ontwikkeld in het ene vakgebied kunnen vaak ook toegepast worden in andere vakgebieden. Denk maar aan de bio-informatica waar experimenten worden opgezet, gemodelleerd en het gedrag van bacteriën wordt voorspeld door gebruik te maken van data-analyse. Door de ontwikkeling van sensoren komen er ook uit processing meer en meer data beschikbaar. De modeleringstechnieken van biologische data kunnen dan toegepast worden voor het verwerken van deze data. De ingangsdata en de vragen zijn dan wel anders, de manieren om on de data te zoeken en te filteren zijn vergelijkbaar.

Ter illustratie kunnen enkele voorbeelden aangehaald worden van projecten uitgevoerd door NIZO waarbij een oplossing gevonden werd via de analyse van grote hoeveelheden data. Zo werden 25 miljoen wetenschappelijke artikelen doorzocht op specifieke termen die verschillende aspecten van zoutperceptie beschrijven om uiteindelijk, na verschillende filter stappen, te komen tot twintig interessante componenten die de zoutperceptie in voedingsmiddelen zouden kunnen verhogen. Hiervan werden er uiteindelijk vijf getest (VMT juli 2015). Een andere toepassing waarbij data-analyse succesvol werd ingezet was het ontstaan van een off-flavour tijdens de batch productie van kaas. Hier was de vraag welke procesparameters er veranderd waren tijdens de overgang van de ene batch naar de andere en hoe deze wijzigingen konden gekoppeld worden aan het ontstaan van een off-flavour. Op basis van de resultaten van de data-analyse en ervaring met het proces van kaasbereiding kon een expert niet alleen verklaren hoe de off-flavour ontstaan was, maar ook hoe het proces kon bijgestuurd worden.

Kwaliteit van data: een belangrijk aandachtspunt

Analyseren van grote hoeveelheden data brengt heel wat uitdagingen met zich mee. Allereerst dient er rekening gehouden te worden met de gevarieerde aard van de data. De vraag is dan hoe deze heterogene data (bijvoorbeeld, procestemperatuur, chemische samenstelling, seizoen, …) op een goede manier aan elkaar te koppelen zijn. Hoe betrouwbaar zijn de data waarmee je werkt? Van wie zijn ze afkomstig en onder welke condities zijn ze verzameld? Hoe je hiermee kan omgaan, maakt ook deel uit van de opleidingsreeks “Haal meer uit je data” die Flanders’ FOOD dit najaar organiseert.

Voorspellende modellen om problemen te signaleren en bijsturingen uit te voeren

Wanneer gegevens van kritische parameters mbt grondstoffen, proces, etc. gekoppeld worden aan de uiteindelijke productkwaliteit, wordt het mogelijk voorspellende parameters te definiëren. Eens de correlaties en de voorspellende parameters gekend zijn, kunnen de nodige voorzorgsmaatregelen getroffen worden en zelfs een voorspellend model worden ontwikkeld. “Random Forest” is een voorbeeld van dergelijke complexe analysemethode. Met deze methode kan in grote hoeveelheden complexe data gezocht worden naar niet-lineaire relaties en wordt aangegeven welke variabelen belangrijk zijn voor het correct voorspellen van outputparameters zoals bijvoorbeeld productkwaliteit. Op basis van deze sterk gereduceerde set variabelen kan dan een relatief eenvoudig te interpreteren model van een proces gegenereerd worden.

De belangrijkste meerwaarde hiervan is dat dergelijk model op basis in-line en on-line metingen vroegtijdig potentieel slechte productkwaliteit signaleert en suggesties doet aan de operator om procesbijsturingen uit te voeren. Op die manier worden problemen voorkomen en een constantere productkwaliteit gerealiseerd.

In combinatie met het inzetten van steeds meer geavanceerde sensoren wordt het ook mogelijk deze modellen in- en on-line in te zetten. Men moet niet meer wachten op de resultaten van het labo, de producteigenschappen zijn onmiddellijk beschikbaar. Zo kan het model, op basis van een range productspecificaties, de operator adviseren hoe het proces bijgestuurd moet worden om met de gewenste productspecificaties te blijven produceren. Dit soort model gebaseerde controle systemen zullen uiteindelijk een onderdeel vormen van de bestaande procesregelsystemen.

Process analytical technologies

De hierboven beschreven data-analyse en model gebaseerde controle systemen passen in het concept van “Process analytical technologies” – PAT, een welbekend concept in de farmaceutische en chemische industrie, maar in de voedingsindustrie nog een nobele onbekende. PAT gaat over ontwerp, analyse en controle van verschillende stappen in het productieproces door identificatie en monitoring van kritische procesparameters. Dit kan leiden tot verhoogde procesefficiëntie, gereduceerde productiekosten en een hogere kwaliteit en veiligheid van het eindproduct. De tools van PAT zijn enerzijds on-line real time monitoring van kritische procesparameters en anderzijds real-time multivariate data-analyse. De resultaten van deze data-analyse dienen dan als input voor procescontrole.

Hoe begin je ier nu aan als voedingsbedrijf?

In het najaar organiseert Flanders’ FOOD in samenwerking met KU Leuven (MeBioS) en UGent (LLPAT en BIOMATH) een driedaagse opleidingsreeks rond het thema “Haal meer uit je data: van meten tot procesbijsturing”. Het programma en de inschrijvingslink kan je hier terugvinden.

Big data: ook een hot topic in Europese projecten

Big data mag dan wel een buzz woord zijn, dat het thema wel degelijk relevant is blijkt ook uit de vele Europese projecten die hierop inzetten.

Enkele voorbeelden:

Genobox: Een Europees consortium van kmo’s uit de zuivel en de probiotica industrie. Het doel is software en algoritmes te ontwikkelen die het mogelijk maken om op basis van genoomsequenties snel en efficiënt bacteriën te selecteren die de gewenste functionele eigenschappen hebben. http://www.genobox.eu/wb/
Odex4All (open data exchange for all) Een consortium dat software ontwikkelt om tientallen wetenschappelijke databases aan elkaar te linken, zodat nieuwe verbanden tussen moleculen, eiwitten, gezondheid en wetenschappelijke literatuur zichtbaar worden. https://www.esciencecenter.nl/project/odex4all
Bynse: Big data oplossingen voor de landbouw. http://www.bynse.com/index.php?lang=en
Big data Europe: Integrating Big Data, Software and Communities for Addressing Europe’s Societal Challenges http://www.big-data-europe.eu/food/