Ondersteuning van wetenschappelijk onderzoek
UMC Utrecht
Kort samengevat, behelst het onderzoek van Edwin Cuppen het volgende:
About 3% of cancer patients are diagnosed annually with a Cancer of Unknown Primary (CUP) and there is also a significant fraction of patients with indeterminate, uncertain, or differential diagnoses, especially in metastatic or poorly differentiated tumors. Patients for which the primary tumor type is unknown have a worse prognosis, often due to complicated and laborious diagnostics and lack of therapeutic options as treatment options are almost exclusively driven by primary tumor type classification. Whole genome sequencing (WGS) is an emerging diagnostic approach and has already provided useful for the identification of matching personalized targeted treatments, but the obtained genome-wide knowledge also offers important potential for the identification of tumor tissue of origin. In the proposed project, we will use machine learning approaches to develop a WGS-based CUP classifier that can annotate cancers for which the primary tumor mass could not be identified. For this, we will consolidate, integrate and analyse the largest pan-cancer whole genome sequenced datasets worldwide, consisting of more than 8,000 patients. This project will be performed in a close collaboration between the research group of Edwin Cuppen at the UMC Utrecht, the pathology department of the Netherlands Cancer Institute and the Hartwig Medical Foundation and should drive implementation of the established algorithm in diagnostic patient reporting.'
In 3% van alle nieuwe gevallen van kanker diagnoses kan men de primaire tumorlocatie niet exact bepalen, en daarnaast er is ook een aanzienlijk groep van tumorpatiënten met een onzekere of onvolledige diagnose, vooral bij uitgezaaide en bij ongedifferentieerde tumoren. Deze patienten krijgen de diagnose ‘Primaire Tumor Onbekend’ (PTO) en treft jaarlijks ongeveer 2.000 patiënten in Nederland. Om het tumor type van PTO-patiënten te kunnen achterhalen hebben we CUPLR (Cancer of Unknown Primary Location Resolver) ontwikkeld, een machine learning gebaseerd model dat het primaire tumor weefsel kan classificeren op basis van genoom-brede mutatiekenmerken. Om CUPLR te ontwikkelen, hebben we gebruik gemaakt van eenvoudige en complexe mutatiekenmerken afkomstig van meer dan 6000 tumoren waarvan het DNA volledig in kaart is gebracht. CUPRL is in staat om weefsel van oorsprong met hoge nauwkeurigheid te voorspellen (90% totale precisie) en presteert beter dan de huidige geavanceerde classificatie modellen, voornamelijk voor bepaalde soorten kanker waarbij we nieuwe mutatiekenmerken hebben getest zoals virale inserties, genfusies en andere genomische afwijkingen. Verder hebben we hebben aangetoond dat CUPLR de primaire tumor van PTO-patienten kan voorspellen en clinici kan ondersteunen bij het nemen van nauwkeurige beslissingen met betrekking tot differentiële diagnoseclassificaties. CUPLR biedt ook interpreteerbare voorspellingen aan, wat individuele en manuale classificatie door clinici mogelijk maakt. Verder hebben we ook aangetoond dat CUPLR het tumorweefsel van oorsprong met hoge nauwkeurigheid kan voorspellen bij patiënten die gediagnostiseerd zijn met PTO. CUPLR is dus een nieuw algoritme dat in de kliniek geïmplementeerd kan worden als een aanvullende tool voor het bepalen van tumorweefsel van oorsprong maar ook clinici ondersteuning kan bieden voor kankers met differentiële diagnose.
Circa 3% van de kankerpatiënten -1.300 in Nederland- worden jaarlijks gediagnosticeerd met een ‘Primaire Tumor Onbekend’ (PTO) waarbij de patholoog en de behandelend arts het primaire tumor weefsel niet kunnen identificeren. Daarnaast is er een aanzienlijke groep van kankerpatiënten met een onzekere of onvolledige diagnose van het tumortype, vooral bij uitgezaaide en bij ongedifferentieerde tumoren. Ondanks dat de zorg voor deze patiënten de laatste jaren is verbeterd, sterft nog steeds de helft van de PTO-patiënten zeer vroeg na de diagnose, voornamelijk als gevolg van een lang diagnostisch traject en het ontbreken van therapeutische aanknopingspunten aangezien behandelingsmogelijkheden in de praktijk bijna uitsluitend worden gedreven door classificatie van het primaire tumor type.
We hebben gebruik gemaakt van de grootste whole genome sequencing databases van tumoren in de wereld (ICGC/PCAWG en Hartwig Medical Foundation) en bijna 7.000 samples uniform geanalyseerd. Hieruit hebben we duizenden karakteristieken geëxtraheerd, inclusief dimensies die niet eerder voor vergelijkbare toepassingen zijn gebruikt, en een nieuw ontworpen machine learning tool (CUPLR) getraind om een model te maken voor het voorspellen van 33 verschillende tumor types. Dit lukt voor meer dan 90%, ook op een onafhankelijke dataset die niet is gebruikt voor de training. Gebruik van CUPLR bij PTO patiënten geeft voor meer dan 50% van de patiënten een voorspelling met een hoge betrouwbaarheid van het tumor type. Als onderdeel van de tool en ter ondersteuning van gebruik in de kliniek, is een visualisatie van de resultaten ontwikkeld gericht op het ontsluiten van de machine- learning ‘black box’. Momenteel wordt er gewerkt aan verdere verbeteringen, bepalen van de waarde in de kliniek (samen met pathologen in het NKI) en implementatie in WGS-gebaseerde diagnostiek (samen met de Hartwig Medical Foundation).