Betere AI-modellen bouwen voor de spoorwegen begint met een solide gegevensbasis
De spoorwegsector digitaliseert in hoog tempo en gebruikt nieuwe technologieën zoals machine learning en kunstmatige intelligentie (AI). Deze nieuwe technologieën maken een grotere algehele efficiëntie in de sector mogelijk, wat belangrijk is voor het bereiken van de duurzaamheidsdoelstellingen in Europa en het verminderen van de bestaande druk op de beroepsbevolking. Dr. Igor Dakic, Senior Consultant in Strategic Asset Management bij de leverancier van ingenieurs-, ontwerp- en adviesdiensten AFRY, bespreekt de uitdagingen waarmee bedrijven worden geconfronteerd die hun gegevens willen gebruiken om bijvoorbeeld AI-modellen te trainen.
“AI is erg nuttig omdat het waardevolle inzichten kan halen uit gegevens, vooral uit grote datasets zoals die van spoorwegbedrijven”, zegt Igor Dakic. “Het kan helpen bij het identificeren van trends en patronen die misschien moeilijk te identificeren zijn met traditionele methoden, en het kan ook worden gebruikt om anomalieën en patroonovertredingen te detecteren, die anders zware handmatige analyse of correcties zouden vereisen. Het kan de vaardigheidskloof die we hebben op het gebied van data-analyse aanvullen, waardoor medewerkers zich meer kunnen richten op de strategische aspecten van datamanagement.”
Als het gaat om het implementeren van AI, probeert AFRY “het pad te vormen om het te kunnen implementeren, te bepalen voor welke gegevens het kan worden gebruikt en wat de mogelijke implicaties zijn”, deelt Dakic. “Er is consensus dat AI en datatoepassingen de kosten aanzienlijk kunnen verlagen en de kwaliteit en processen kunnen verbeteren. Voor elke use case bevestigen we eerst wat de voordelen in elke dataomgeving zijn in een pilotfase voordat we besluiten om op bredere basis te implementeren”, voegt hij eraan toe.
“Meer specifiek proberen we inzicht te krijgen in de kosten en baten van implementatie in vergelijking met dingen handmatig doen. Het doel is om de efficiëntie en nauwkeurigheid te verhogen ten opzichte van handmatige inspanningen, die enerzijds vatbaar zijn voor menselijke fouten, maar anderzijds ook robuuster zijn. AI kan ook meer substantiële schaalbaarheid bieden.” Er is inderdaad veel potentieel als het gaat om het gebruik van AI-modellen om het maximale uit spoorweggegevens te halen. Het begint echter allemaal met een solide datafundament, door Dakic gedefinieerd als “de integratie van alle noodzakelijke componenten voor het vaststellen van de juiste kwaliteit van informatie, vooral als het gaat om asset management systemen.” Maar zelfs deze eerste stap kent uitdagingen, vooral als het gaat om legacygegevens.
Uitdagingen van legacygegevens
“Het vermogen om AI te implementeren hangt echt af van de oorspronkelijke staat van het bestaande systeem en de beschikbare gegevens”, stelt Dakic. “Ik denk dat veel spoorwegorganisaties enorme hoeveelheden gegevens hebben, verspreid over verschillende afdelingen en systemen, en het integreren van informatie uit verschillende bronnen kan technisch behoorlijk complex en uitdagend zijn. Bovendien kunnen de beschikbare gegevens onnauwkeurig, incompleet of inconsistent zijn… Kortom, in tegenstelling tot wat sommigen misschien zeggen, zijn we een innovatieve industrie, maar dat betekent ook dat we voor veel valkuilen als eerste zijn gevallen. En dat kan allemaal van invloed zijn op het vermogen om in wezen activa effectief en efficiënt te beheren en efficiënt te opereren. Wat we ook zien in ons werk is dat dit vaak voortkomt uit een gebrek aan datagovernance, beleid en eigenaarschap, die allemaal alomvattend datamanagement en het onderhoud van hoogwaardige datafundamenten in de weg staan.”
Deze problemen komen volgens Dakic het meest voor als het gaat om legacy data: “Het is niet eenvoudig om AI toe te passen op legacygegevens die uit verschillende bronnen bij elkaar zijn geflanst, want om AI toe te passen hebben we betrouwbare gegevens nodig.” Sterker nog: “Als het gaat om legacygegevens, is het belangrijk om te begrijpen dat deze kunnen zijn opgeslagen in verouderde of verouderde systemen, onvolledig kunnen zijn of niet de gebruikelijke conventies kunnen volgen, of ook ongelijksoortig kunnen zijn in termen van verschillende activa, locatiehiërarchieën of structurerende systemen”, vervolgt hij. Bijgevolg hebben legacygegevens vaak te lijden onder problemen met de datakwaliteit, zoals onnauwkeurige, incomplete of inconsistente informatie. “Het waarborgen van de nauwkeurigheid en beschikbaarheid van legacygegevens kan tijdrovend zijn en aanzienlijke middelen vereisen”, benadrukt Dakic.
“In principe hebben we transitieplatforms nodig die zeer kostbaar kunnen zijn. Het kan ook erg complex zijn om van de oude systemen over te stappen op modernere technologie, die de implementatie van meer AI-gebaseerde processen mogelijk maakt”, legt hij uit. Anders moet er een expert aan te pas komen om de gegevens weer bruikbaar te maken, wat veel geld kost. “Eerst moeten we begrijpen of alle processen in overeenstemming zijn met de technische voorschriften. Daarna kunnen we bepalen wat de problemen zijn. Als het probleem bijvoorbeeld is dat de gegevensbronnen niet compatibel zijn, dan kunnen ze worden samengevoegd tot één database die voor andere doeleinden kan worden gebruikt”, concludeert hij.
Een sterk gegevensfundament bouwen
Zoals Dakic al eerder zei, is een sterke datafundament van groot belang. Wat zijn de eerste stappen om er een op te bouwen? “Sommige organisaties hebben een betere datakwaliteit dan andere en voor hen kan AI worden toegepast, de vraag is in welke mate,” stelt Dakic. Hij legt uit: “Het gaat erom hoe de gegevens worden opgeslagen en hoe ze worden bijgehouden, want spoorwegorganisaties hebben zeer grote gegevensverzamelingen en een breed scala aan verschillende soorten activa. Al deze gegevens kunnen zich op verschillende plaatsen bevinden en om ze betrouwbaar te kunnen gebruiken, moeten ze goed worden onderhouden.”
In termen van best practices die AFRY waarneemt, is “een gevestigd, robuust raamwerk voor gegevensbeheer” essentieel. Een dergelijk raamwerk “definieert de regels, verantwoordelijkheden en processen voor het beheer en onderhoud van gegevenskwaliteit en gestandaardiseerde formaten zoals productcodes”. Dit dient om “de compatibiliteit tussen verschillende systemen te verbeteren, die allemaal belangrijk zijn bij het vormgeven van de weg naar AI”, benadrukt Dakic. “Wat we vaak doen is het opzetten van een uitgebreide structuur en conventies, klanten voorzien van de middelen om datakwaliteit automatisch te monitoren en te rapporteren, en data governance processen opzetten die dit ondersteunen. Het is belangrijk om alle componenten te synchroniseren en er een geïntegreerd proces van te maken,” stelt Dakic. Volgens hem is dat de eerste vereiste om een solide basis voor datakwaliteit te leggen.
Hij noemt ook “verandermanagement dat alle relevante entiteiten betrekt bij discussies over de integratie van datastrategieën” als belangrijk. Velen zijn gewend aan traditionele methoden en het implementeren van nieuwe technologieën kan moeilijk zijn. Een andere belangrijke praktijk voor bedrijven die Dakic noemt, is “werknemers de ondersteuning en training bieden die nodig is om de nodige kennis te verwerven om te kunnen omgaan met de technologische vooruitgang, hetzij door mensen met de juiste achtergrond aan te nemen, hetzij door gevestigde technici op te leiden. Wat we uiteindelijk nodig hebben is een cultuur en mentaliteit voor datakwaliteit.”
Voor meer informatie over dit onderwerp kunt u Igor Dakic’s presentatie “Data Quality 360°: Guiding an Organisation to Data-Driven Success” op dinsdag 6 november 2023, op de Intelligent Rail Summit 2023 in Warschau, Polen.
Verder lezen:
- Intelligent Rail Summit 2023 kondigt sitebezoek aan Nevomo aan
- Een oude hond nieuwe trucjes leren: toestandsafhankelijk onderhoud invoeren
- Wat te doen met al die gegevens? – Bekijk de webinar discussie hier