Wie können wir Brustkrebsrisiken in China besser vorhersagen und bewerten?

Wie können wir Brustkrebsrisiken in China besser vorhersagen und bewerten?

Brustkrebs ist die häufigste Krebsart bei Frauen weltweit. Im Jahr 2020 gab es schätzungsweise 2,26 Millionen neue Fälle. In China ist Brustkrebs die Hauptursache für Krebserkrankungen bei Frauen. Im Jahr 2020 wurden etwa 416.000 neue Fälle gemeldet. Die steigende Belastung durch Brustkrebs in China zeigt den dringenden Bedarf an wirksamen Risikobewertungstools, die speziell für die chinesische Bevölkerung entwickelt wurden.

Traditionelle Modelle zur Vorhersage des Brustkrebsrisikos, wie das Gail-Modell, das Claus-Modell und das Tyrer–Cuzick-Modell, haben eine begrenzte Genauigkeit. Ihre Werte für die Fläche unter der ROC-Kurve (AUC) liegen typischerweise zwischen 0,55 und 0,65. Diese Modelle stützen sich oft auf invasive Methoden wie Gentests und Brustbiopsien. Diese Methoden sind in China aufgrund wirtschaftlicher Einschränkungen und ungleich verteilter medizinischer Ressourcen nicht weit verbreitet. Diese Studie zielt darauf ab, diese Einschränkungen zu überwinden, indem sie fortschrittliche maschinelle Lernmodelle entwickelt, die hochpräzise, nicht-invasiv und für die chinesische Bevölkerung geeignet sind.

Die Studie nutzt Daten aus der Brustkrebs-Kohortenstudie bei chinesischen Frauen (BCCS-CW). Diese große prospektive dynamische Kohorte umfasst 122.058 Frauen im Alter von 25–70 Jahren aus Ostchina. Die Kohorte wurde 2008–2009 etabliert, mit Nachuntersuchungen von 2017 bis 2020. Die Teilnehmerinnen gaben detaillierte Informationen zu demografischen Merkmalen, physiologischen und reproduktiven Faktoren, medizinischer und familiärer Vorgeschichte, Ernährungsgewohnheiten, Lebensstil und Wissen über Brustkrebs durch persönliche Interviews und physiologische Messungen. Brustkrebsfälle wurden durch Verknüpfung mit nationalen Krankenversicherungsdatenbanken, Krankheitsregistern und lokalen Wohnsitzdaten identifiziert. Die Studie folgte den TRIPOD-Richtlinien und wurde von den Ethikkommissionen des Zweiten Krankenhauses der Shandong-Universität und des Nationalen Zentrums für die Kontrolle chronischer und nicht übertragbarer Krankheiten genehmigt.

Zur Entwicklung der Risikovorhersagemodelle wurden fortschrittliche maschinelle Lerntechniken verwendet, darunter strafregulierte logistische Regression (PLR), Bootstrapping und Ensemble-Learning. Das Ensemble Penalized Logistic Regression (EPLR)-Modell wurde für die kurzfristige Risikovorhersage entwickelt, während das Ensemble Penalized Long-Term (EPLT)-Modell für die langfristige Risikovorhersage konzipiert wurde. Beide Modelle wurden mit einem bagging-basierten integrierten Rahmen konstruiert, der mehrere PLR-Modelle aggregiert, um die Vorhersagegenauigkeit und Stabilität zu verbessern. Das EPLR-Modell umfasste 72 nicht-experimentelle Risikofaktoren, während das EPLT-Modell 51 Variablen enthielt. Die Modelle wurden mit Daten aus der Provinz Shandong trainiert und validiert, wobei die externe Validierung mit Daten aus den Provinzen Jiangsu, Hebei und Tianjin durchgeführt wurde.

Die Leistung der Modelle wurde anhand von Diskriminierung und Kalibrierung bewertet. Die Diskriminierung wurde mit AUC, ROC-Kurven und der Netto-Neuklassifizierungsverbesserung (NRI) bewertet. Die Kalibrierung wurde mit Kalibrierungsdiagrammen und dem beobachteten-zu-erwarteten (E/O)-Verhältnis bewertet. Das EPLR-Modell zeigte eine starke Diskriminierung mit AUC-Werten von 0,800 und 0,751 in internen und externen Validierungssätzen. Die NRI des EPLR-Modells im Vergleich zum Social Network-inspired Breast Cancer Risk Assessment Model (BCRAM) betrug 0,164 und 0,268 in internen und externen Validierungssätzen, was eine signifikante Verbesserung der Vorhersagegenauigkeit anzeigt. Das EPLT-Modell schnitt ebenfalls gut ab, mit AUC-Werten von 0,692 und 0,760 in internen und externen Validierungssätzen. Die NRI des EPLT-Modells im Vergleich zum Gail- und Han Chinese Breast Cancer Prediction Model (HCBCP) betrug 0,109 und 0,171 in der internen Validierung und 0,193 und 0,233 in der externen Validierung. Kalibrierungsdiagramme und E/O-Verhältnisse bestätigten weiterhin die Fähigkeit der Modelle, das Brustkrebsrisiko genau vorherzusagen.

Eine der wichtigsten Erkenntnisse der Studie war die Bedeutung nicht-experimenteller Risikofaktoren bei der Vorhersage des Brustkrebsrisikos. Das EPLR-Modell identifizierte „allgemeine Lebenszufriedenheit“ als den wichtigsten Prädiktor, was die Rolle psychologischer Faktoren beim Brustkrebsrisiko unterstreicht. Andere signifikante Prädiktoren waren Menopausenstatus, familiäre Brustkrebsvorgeschichte, Brusthyperplasie und Ernährungsgewohnheiten. Die Studie zeigte auch, dass die EPLR- und EPLT-Modelle traditionelle Modelle wie das Gail- und HCBCP-Modell übertrafen, die auf weniger Variablen basieren und oft invasive Tests erfordern. Die Einbeziehung einer großen Anzahl nicht-experimenteller Faktoren in die EPLR- und EPLT-Modelle macht sie besser geeignet für die breite Anwendung in China, wo der Zugang zu fortgeschrittenen medizinischen Ressourcen begrenzt ist.

Die Studie ging auch auf die Herausforderung unausgewogener Daten ein, indem sie eine Bootstrap-Strategie verwendete, um ausgewogene Datensätze für das Modelltraining zu erstellen. Dieser Ansatz reduziert Verzerrungen und verbessert die Genauigkeit der Risikofaktorauswahl. Darüber hinaus verbessert die Integration mehrerer PLR-Modelle durch Ensemble-Learning die Stabilität und Generalisierungsfähigkeit der EPLR- und EPLT-Modelle. Die Fähigkeit der Modelle, die Bedeutung von Risikofaktoren basierend auf ihrer Häufigkeit der Auswahl in mehreren PLR-Modellen zu bewerten, bietet wertvolle Einblicke in den relativen Beitrag verschiedener Faktoren zum Brustkrebsrisiko.

Trotz ihrer Stärken hat die Studie einige Einschränkungen. Erstens war die externe Validierung der Modelle auf Daten aus drei Provinzen beschränkt, und die langfristigen Vorhersagen des EPLT-Modells wurden nur mit drei Jahren Nachbeobachtungsdaten validiert. Eine weitere Validierung in größeren und vielfältigeren Bevölkerungsgruppen ist erforderlich, um die Generalisierbarkeit der Modelle zu bestätigen. Zweitens wurden einige etablierte Risikofaktoren wie Alkoholkonsum aufgrund ihrer geringen Bedeutung nicht in die Modelle aufgenommen. Schließlich berücksichtigte die Studie keine Brustkrebs-Subtypen, da der Datensatz keine Informationen zum Östrogenrezeptorstatus enthielt.

Zusammenfassend entwickelte und validierte diese Studie fortschrittliche maschinelle Lernmodelle zur Vorhersage des Brustkrebsrisikos bei chinesischen Frauen. Die EPLR- und EPLT-Modelle zeigten eine überlegene Diskriminierung und Kalibrierung im Vergleich zu traditionellen Modellen, was sie zu wertvollen Tools für risikostratifizierte Screening- und Brustkrebsprävention in China macht. Die Abhängigkeit der Modelle von nicht-experimentellen Risikofaktoren und ihre Fähigkeit, die Bedeutung dieser Faktoren zu bewerten, bieten einen praktischen und kosteneffektiven Ansatz zur Brustkrebsrisikobewertung. Zukünftige Forschung sollte sich auf die Validierung der Modelle in größeren und vielfältigeren Bevölkerungsgruppen konzentrieren und zusätzliche Risikofaktoren, einschließlich Brustkrebs-Subtypen, einbeziehen, um ihre Vorhersagegenauigkeit weiter zu verbessern.

For educational purposes only.
doi.org/10.1097/CM9.0000000000002891

Schreibe einen Kommentar 0

Your email address will not be published. Required fields are marked *