Transcript
Nu we uit een vorige aflevering weten wat Big Data is, ontdekken we vandaag, wat je met die data kunt. Machine learning is hier het buzz word.
Dag Ben, welkom terug in de studio.
Hallo, dank je wel.
In één van de vorige afleveringen, hadden we het al over Big Data. Vandaag gaan we een stap verder. We gaan iets met die data doen.
En dat is dan het volgende buzz word, dat we tegenkomen: machine learning.
Ja, dat is inderdaad heel populair, zeker de laatste jaren. Alhoewel het al jarenlang bestaat en een beetje een veredelde naam voor statistiek is, soms.
Ah, oei.
Maar dat is niet erg. Als we de wiskunde hipper kunnen maken, is dat altijd leuk. Niet dat ik zo'n grote wiskunde-fan ben, dat is ook maar in de laatste jaren ontstaan. Maar als ik had geweten, dat je er zoveel mee kan doen, dan had ik wel wat beter opgelet in het middelbaar. Nee, maar het is inderdaad een heel leuke materie. En je merkt inderdaad, dat dat, zeker de laatste jaren, heel hard gebruikt wordt. Vooral naar personalisatie toe. Ze wordt heel veel in marketing gebruikt.
Iedereen kent dat, als je websites gaat bezoeken, dat je naar een bepaald product aan het kijken bent en je krijgt daarbij te zien: deze producten kunnen ook voor jou interessant zijn.
Dat zijn machine learning modellen, die daarachter zitten. Heel vaak op basis van aankoophistoriek, waarin we kunnen gaan kijken van: klanten die dit product gekocht hebben, of bekeken hebben, die hebben heel vaak ook deze andere producten bekeken. En dat is heel vaak...
Dat lijkt heel complex. Maar eigenlijk is dat gewoon geavanceerd tellen, als je een beetje kijkt naar wat daarachter zit. Er zitten wat moeilijkere wiskundige modellen achter, maar heel vaak is dat gewoon kijken van: ja, als we dit bekeken hebben, hoeveel keer zijn die andere dingen ook bekeken, samen met dit product? En diegene die het meeste samen bekeken zijn, ga je dan ook gaan tonen.
Het is iets complexer dan dat, maar dat is eigenlijk de basis.
Maar ik zie al meteen de link met het vorige onderwerp. Want vergelijken van al die statistieken, betekent ook weer veel data, Big Data.
Ja, het kan inderdaad heel snel een Big Data probleem worden. Zeker wanneer je een grote webshop hebt, of een groot evenementenbureau, waar je heel veel transacties hebt, of heel veel klanten hebt. Dan heb je daar heel vaak, heel veel informatie over. Maar ik merk ook heel veel, omdat we vanuit de industrie zowel met Big Data, als met machine learning bezig zijn, dat klanten heel vaak denken, dat je ze alle twee nodig hebt. En ze komen heel vaak naar ons met een probleem: ze willen machine learning gaan doen en ze denken dat ze daar tonnen data voor nodig hebben.
Maar we hebben even goed al modellen getraind, waar we slechts een aantal honderd voorbeeldcases hadden, om onze training op te doen. Waar je ook heel goede resultaten mee kan boeken.
Dus het is niet noodzakelijk zo, dat je tonnen aan data nodig hebt, om machine learning te kunnen gaan doen. Het kan ook op een beperktere set aan data.
Nu, je zegt iets heel belangrijk, hé. Die modellen trainen. Het is niet zo: ik koop een machine learning computer, ik zet die aan en die werkt.
Nee, nee. Het is inderdaad wel zo, dat je een beetje kennis moet hebben van...
Ja, het is vooral een programmeeraangelegenheid. Het is niet echt een kwestie van hardware. Hoewel het er ook wel mee speelt, afhankelijk van welk type machine learning je wil gaan doen. Dat andere hardware beter kan zijn. Maar het is voornamelijk een zaak van de juiste frameworks leren kennen en de juiste type modellen te leren herkennen, voor de juiste use case.
Wanneer je, bijvoorbeeld, een constante waarde wil gaan voorspellen, je wilt gaan voorspellen hoeveel mensen er op uw event gaan zijn, gebaseerd op uw vorige events, dan ga je naar typische regressiemodellen kijken, bijvoorbeeld.
Wil je gaan voorspellen in welke categorie bepaalde dingen vallen, op basis van een aantal gegevens, ga je meer naar classificatiemodellen kijken, bijvoorbeeld.
En daaronder heb je dan nog heel specifieke modellen, voor specifieke uses cases.
Maar het is, in machine learning, enerzijds de kunst, om de juiste modellen te kunnen kiezen, voor je use case. En anderzijds de kunst om uw data in een bepaalde vorm te krijgen, dat uw model zo goed mogelijk gaat scoren.
Ja, je gaf net aan, als voorbeeld voor de evenementensector, voorspellen hoeveel mensen er aanwezig gaan zijn op je evenement. Dat soort dingen.
We hebben de voorbeelden van e-commerce, waarbij we gaan aanbevelingen doen, van producten. In de evenementensector zouden dat tickets voor een evenement of sessies kunnen zijn.
Denk je nog aan zaken, die we in de evenementensector kunnen gebruiken?
Ja, je kan gaan kijken naar welke klantengroepen je wil gaan aanspreken. En op welke manier, bijvoorbeeld. Het is enerzijds de zaak van: hoe moeten ze de juiste soort tickets gaan aanbevelen, bijvoorbeeld.
Maar ook: welke mensen zijn meer vatbaar, om te antwoorden op e-mailaanbiedingen? Welke mensen krijgen liever nog dingen in de post toegestuurd? Dat zijn zaken, die je kan doen.
Zodanig dat je ze op de meest efficiënte manier kunt gaan bereiken.
Ja, maar evengoed kan je, binnen je evenement zelf, gaan kijken naar, bijvoorbeeld, stromen van toeschouwers en daar gaan sturen.
Als je merkt dat het, op bepaalde plekken binnen je evenement, te druk wordt, kan je daar gaan sturen en zeggen: op dit moment is het daar drukker, of routes gaan uitstippelen, doorheen uw evenement, bijvoorbeeld.
Of je kan de opstellingen gaan bekijken. Kijken welke dingen je best naast mekaar moet zetten.
Of als je een muziekevenement programmeert, met verschillende podia, kijken welke types muziek er bij mekaar passen, voor de programmatie.
De lijst is eigenlijk redelijk lang. De mensen staan er niet bij stil, hoeveel je eigenlijk kan doen, met uw data.
En eigenlijk, waar machine learning voor dient, is een stuk het buikgevoel, waar heel veel mensen van uitgaan en wat goed is, om dat te gaan, misschien, valideren, of te ontkrachten.
Eigenlijk gaan kijken van: ja, ik heb hier een idee, klopt dat effectief?
Of de kennis, die heel veel mensen hebben, of het buikgevoel, dat heel veel mensen hebben, eigenlijk gaan centraliseren in één systeem, om mensen daarin te gaan assisteren, om die kennis allemaal te gaan hebben.
Nu, als ik dat allemaal zo hoor, dan klinkt dat ook kostelijk. In de zin van: moet ik echt een Tomorrowland-grootte festival zijn, om daarmee aan de slag te kunnen? Of kun je daar ook als klein evenement iets mee doen?
In principe kan dat zelfs de bakker om de hoek zijn. Gewoon kijken naar hoeveel broden je verkoopt en op welke manier. En dat is relatief eenvoudig en dat is ook niet noodzakelijk iets dat je niet zelf kan.
Natuurlijk, om het heel uitgebreid te doen en alle kneepjes van het vak te kennen, kan je daar best wel een expert voor inschakelen.
Maar het is niet noodzakelijk iets dat superduur moet zijn.
Je merkt ook dat heel veel zaken, die vroeger heel moeilijk waren, of waar je zelf heel veel tijd moest gaan insteken, dat die ook als service beschikbaar worden gesteld.
Vroeger, als je nummerplaatherkenning wou gaan doen, bijvoorbeeld, dan moest je zelf een model gaan trainen, om heel veel nummerplaten te kunnen gaan herkennen, met heel veel voorbeelden. Vandaag de dag is dat gewoon één call naar een internetprovider, die dat aanbiedt als een service, met uw foto bij en dan kost u dat 0,0001 cent per foto. En dan kan dat heel laagdrempelig worden en valt uw instapkost voor uw modelontwikkeling eigenlijk volledig weg.
Oké, interessant. Ik denk dat we die technologie moeten gaan omarmen, vanuit de sector.
Ben, dank je wel voor je komst naar de studio.
Dank u wel.
En u, beste kijker, bedankt voor het kijken en alweer tot volgende week.