Ondersteuning van wetenschappelijk onderzoek
Radboudumc
Het onderzoek van Marianne Jonker houdt in het kort het volgende in:
'De prognose van patiënten met zeldzame vormen van kanker is slechter dan die van patiënten met veel voorkomende vormen. Een belangrijke reden is dat voor zeldzame kankers het moeilijker is om mogelijke behandelingen te vinden, omdat doorgaans slechts kleine datasets beschikbaar zijn voor onderzoek. Bij het gebruik van dergelijke kleine datasets is het risico van overfitting in de gebruikte modellen groot. Dit maakt het moeilijk om statistisch significante patronen in de data te vinden, die mogelijk tot nieuwe behandelingen zouden kunnen leiden. Het samenvoegen van data van verschillende instellingen of ziekenhuizen zou een stap in de goede richting kunnen zijn, maar is in de praktijk lastig vanwege regelgeving en logistieke problemen.
In dit project worden twee complementaire routes voorgesteld. De eerste is om te focussen op statistische methoden die ook goed werken bij een kleine steekproefomvang, zonder overfitting. De tweede route is het ontwerpen en verbeteren van machine learning-algoritmen die de noodzaak van datapooling op één locatie omzeilen door rond medische instituten te ‘fietsen’ met kleine datasets (federatief leren). Gegevens over speekselklierkanker zullen worden geanalyseerd met de voorgestelde methoden.
Het project is een samenwerking tussen: dr. Marianne Jonker, prof. Ton Coolen, prof. Kit Roes en prof. Carla van Herpen, allen in het Radboudumc of Radboud universiteit.'
Met de Bayesian Federated Inference methodologie kan men uit de analyse resultaten die gevonden zijn op basis van afzonderlijke datasets (centra) reconstrueren wat er gevonden zou zijn als de datasets waren samengevoegd. De ontwikkelde methodologie blijkt zeer nauwkeurig te zijn en is toepasbaar in veel situaties. We hebben de methodologie en software ontwikkeld voor veelgebruikte statistische modellen (gegeneraliseerde lineaire modellen en time-to-event modellen), homogene en heterogene populaties, en voor voorspellings- en associatiemodellen. Data is geanalyseerd en de resultaten zijn boven verwachting goed. De volgende stap is het integreren van overfitting-theorie om overfitting te verkleinen als de datasets klein zijn.
Het eerste doel in dit project is het ontwikkelen en toepassen van de theorie van Bayesian Federated Inference (BFI) voor parametrische modellen en voor modellen voor time-to-event uitkomsten. We hebben dit afgerond voor parametrische modellen en ons artikel is gesubmit: Bayesian Federated Inference for Statistical Models (M.A. Jonker, H. Pazira, A.C.C. Coolen). De volgende stap is om de theorie te generaliseren naar het semi-parametrische Cox PH-model. We streven ernaar dit voor de zomer van 2023 af te ronden.