banner
Casa / Notizia / Modello di previsione del rischio bayesiano per la mortalità per cancro del colon-retto attraverso l'integrazione di dati clinicopatologici e genomici
Notizia

Modello di previsione del rischio bayesiano per la mortalità per cancro del colon-retto attraverso l'integrazione di dati clinicopatologici e genomici

Jun 05, 2024Jun 05, 2024

npj Precision Oncology volume 7, numero articolo: 57 (2023) Citare questo articolo

1373 accessi

3 Altmetrico

Dettagli sulle metriche

La stadiazione di routine del cancro del colon-retto con metastasi linfonodali (TNM) è imperfetta nel predire la sopravvivenza a causa dell'eterogeneità patobiologica del tumore e della valutazione imprecisa della diffusione del tumore. Abbiamo sfruttato gli alberi di regressione additiva bayesiana (BART), una tecnica di apprendimento statistico, per analizzare in modo completo le caratteristiche tumorali specifiche del paziente per il miglioramento della previsione prognostica. Delle 75 variabili clinicopatologiche, immunitarie, microbiche e genomiche in 815 pazienti in stadio II-III nell'ambito di due studi di coorte prospettici a livello statunitense, il modello di rischio BART ha identificato sette predittori di sopravvivenza stabili. Le stratificazioni del rischio (rischio basso, rischio intermedio e rischio alto) basate sulla sopravvivenza prevista dal modello erano statisticamente significative (rapporti di rischio 0,19-0,45 rispetto a rischio più elevato; P <0,0001) e potevano essere validate esternamente utilizzando il Cancer Genome Atlas (TCGA) ) dati (P ​​= 0,0004). BART ha dimostrato flessibilità del modello, interpretabilità e prestazioni paragonabili o superiori ad altri modelli di apprendimento automatico. Le analisi bioinformatiche integrate che utilizzano la BART con fattori tumore-specifici possono stratificare in modo robusto i pazienti affetti da cancro del colon-retto in gruppi prognostici ed essere facilmente applicate alla pratica clinica oncologica.

Il cancro del colon-retto si sviluppa nel contesto di una complessa interazione tra l’ospite, i microbi e le cellule neoplastiche nel microambiente intestinale locale1. La previsione di sopravvivenza basata esclusivamente sulla stadiazione delle metastasi linfonodali (TNM) è imperfetta a causa dell'eterogeneità del tumore e della valutazione imprecisa della diffusione del tumore. Nei pazienti in stadio II/III, la valutazione del rischio ha implicazioni cruciali sull'uso della chemioterapia adiuvante, nonché sull'intensità e sulla durata del trattamento2,3. Pertanto, sono necessarie analisi multivariate su larga scala dei fattori che contribuiscono alla progressione del tumore per prevedere meglio gli esiti dei singoli pazienti. Prove sempre più numerose indicano che fattori come lo stato di instabilità dei microsatelliti tumorali (MSI), la mutazione BRAF, la quantità di Fusobacterium nucleatum e gli infiltrati di cellule T sono biomarcatori prognostici rilevanti nel cancro del colon-retto4,5,6. Considerando questi risultati, abbiamo ipotizzato che l’integrazione delle caratteristiche tumorali e immunitarie con la classificazione TNM potrebbe migliorare un modello di previsione prognostica nel cancro del colon-retto.

Per utilizzare le variabili clinicopatologiche disponibili nella previsione della sopravvivenza, abbiamo implementato un modello di classificazione della somma degli alberi, gli alberi di regressione additiva bayesiana (BART). I metodi ensemble consentono una modellazione flessibile di relazioni non lineari e interattive tra predittori e variabili di risultato, mantenendo al contempo l'interpretabilità del modello attraverso misure di importanza variabile7, e hanno prodotto risultati promettenti nella classificazione dei sottotipi molecolari tumorali, nella risposta alla terapia e nella previsione della sopravvivenza in più tipi di cancro8,9,10. BART estende il classico paradigma dell'albero d'insieme introducendo una distribuzione probabilistica sottostante a un modello di somma di alberi, consentendo la regolarizzazione intrinseca. BART ha dimostrato prestazioni favorevoli e capacità di selezione delle variabili superiori rispetto ad altri metodi di apprendimento automatico, tra cui foresta casuale (RF), gradient boosting (GB), operatore di contrazione e selezione minimo assoluto (LASSO), spline di regressione adattiva multivariata e reti neurali artificiali (ANN)11 e ha fornito risultati promettenti in studi precedenti sulla profilazione proteomica, sull'analisi della rete di regolamentazione genetica e sull'analisi non parametrica della sopravvivenza12,13,14.

In questo studio, abbiamo costruito un modello BART che incorporava componenti dello stadio TNM con altri fattori per migliorare la stratificazione del rischio di mortalità nei pazienti in stadio II/III, utilizzando un database di pazienti con cancro del colon-retto in due ampi studi prospettici di coorte, vale a dire il Nurses' Health Study (NHS ) e lo studio di follow-up sugli operatori sanitari (HPFS). Abbiamo confermato le buone prestazioni del modello BART, indicate dalla curva delle caratteristiche operative del ricevitore (ROC) rispetto a RF, GB e altri metodi di apprendimento statistico e convalidate esternamente utilizzando il set di dati The Tumor Genome Atlas (TCGA). Abbiamo esaminato le variabili che contribuiscono ai modelli BART in termini di stabilità di significatività mediante test di permutazione su cinque volte la convalida incrociata, nonché la dipendenza parziale del risultato da variabili importanti. Il nostro studio ha dimostrato che i modelli di ensemble bayesiani possono integrare una varietà di fattori specifici del tumore e del paziente per migliorare la previsione di sopravvivenza e possono servire come strumenti clinici per valutare il rischio individuale di mortalità per cancro, aggiungendo così precisione alla gestione ottimale del paziente.