Project Description

MET SLIMME ALGORITMES ONLINE ONDERNEMINGEN VINDEN DIE ONDER DE VERPLICHTSTELLING VALLEN

HET TOEZICHT OP PENSIOENFONDSEN VERBETEREN

IN HET KORT

In veel landen, met name in Nederland, moeten bedrijven een deel van hun inkomsten afdragen aan het pensioenfonds voor hun personeel. Stel je eens voor hoe nadelig het is voor pensioenfondsen als bedrijven per ongeluk in de verkeerde sector geregistreerd staan bij de Kamer van Koophandel (KvK)! Dit kan leiden tot situaties waarin pensioenfondsen verplicht zijn om pensioenen te betalen aan werknemers, terwijl hun werkgevers nooit hebben bijgedragen aan het fonds.

Om dit probleem aan te pakken, hebben we een klant in de pensioenfonds-sector geholpen door gebruik te maken van web scraping en machine learning technologieën. Ons doel was om zoveel mogelijk KvK nummers te koppelen aan de websites van de juiste online ondernemingen. Dit stelde onze klant in staat om bedrijven te analyseren op basis van trefwoorden die relevant zijn voor hun sector. Hoe relevanter het trefwoord, hoe groter de kans dat het bedrijf tot die sector behoort. Gemiste premies werden hierdoor ingeruild voor efficiëntie, hogere inkomsten en verbeterde processen!

HET CONCEPT

De pensioenpremie die bedrijven moeten betalen hangt af van de bedrijfstak waarin ze actief zijn. Door het vervagen van sectorgrenzen zijn tegenwoordig veel bedrijven per ongeluk in een onjuiste categorie geregistreerd bij de KvK. Dit zorgt ervoor dat pensioenfondsen mogelijk pensioenen moeten uitkeren aan werknemers waarvoor nooit premie is betaald. Hierdoor bestaat het risico dat pensioenfondsen jaarlijks tot €4.000 – €5.000 per werknemer aan inkomsten mislopen. Dit leidde tot de vraag: “Hoe kunnen we onze klant helpen bij het automatisch herkennen van bedrijven die aan deze verplichtingen moeten voldoen?”.

DE UITDAGINGEN

Voor dit project moesten we zo veel mogelijk KvK-nummers koppelen aan de juiste bedrijfswebsites. Op deze manier konden we automatisch de website van elk bedrijf controleren op specifieke trefwoorden die aangaven in welke bedrijfstak het bedrijf zat. Hoe meer deze trefwoorden overeenkwamen met de branche, hoe zekerder we konden zeggen dat het bedrijf tot die branche behoorde. Om de nauwkeurigheid van deze tool te valideren en te verfijnen, gebruikten we een machine learning model dat was getraind op een dataset van 2000 bedrijfswebsites. Aangezien het scrapen van websites en machine learning processen veel berekeningen vergen, vooral wanneer het om grote hoeveelheden data gaat, kozen we ervoor om cloud computing diensten te gebruiken om snelle prestaties en schaalbaarheid te garanderen.

TECHNOLOGY STACK

Tijdens dit project gebruikte ons team de volgende methoden en technologieën:

  • Web scraping

  • Machine learning model en algoritmes

  • Microsoft Azure

RESULTATEN

Het identificeren van ondernemingen die geen premies betaalden was voor onze klant een grote uitdaging. Er moest handmatig onderzoek worden gedaan, dat vatbaar was voor menselijke fouten en veel tijd in beslag nam. Hierdoor kwam er niet alleen onzekerheid in het onderzoeksproces, maar werd het ook een vervelende en tijdrovende taak. Dankzij de web scraping tool heeft onze klant nu een slimme en generieke database. De tool genereert vervolgens automatisch een rapport gesorteerd op relevantie. Daarnaast is het alleen nodig om de bedrijven te onderzoeken die echt relevant zijn, oftewel de top 1% hoogst scorende online ondernemingen. Hierdoor kun je sneller nieuwe potentiële online bedrijven vinden en ze sneller aanschrijven en onderzoeken. Deze tool voorkomt ook dat de klant €4.000 – €5.000 premie per werknemer misloopt. Tot slot helpt deze tool ook potentiële klanten sneller te identificeren, wat resulteert in een algehele omzetstijging.

WIL JE MEER WETEN?

ANDERE PROJECTEN