Abstract
Electrocardiography is a commonly used, safe, low-cost, non-invasive method to monitor the patient’s cardiovascular status. Its abundance provides researchers with large scale electrocardiogram (ECG) datasets which are publicly available and therefore enables them to develop powerful machine learning algorithms to predict cardiovascular diseases directly or to predict the overall health status of the heart by estimating the cardiac age.
For cardiac age predictions Convolutional Neural Networks (CNNs) are predominately
used. Due to the sequential nature of ECG signals we propose a transformer based approach to predict the cardiac age. The goal of this thesis is to train a transformer model for cardiac age prediction and to benchmark it against a state-of-the-art CNN. Furthermore, we aim at revealing the reasoning behind the models and hence to derive biological insights.
Evaluation and hence benchmarking different cardiac age models is not straight forward. Deviations from the biological age can either indicate an inaccurate model or are justified, because the individual suffers from an underlying cardiovascular disorder. To compare the models we therefore (1) benchmarked the models on a healthy cohort (2) used cox models to evaluate whether the predictions reflect a higher mortality risk, (3) visually compared the predictions and (4) revealed the models’ decision making process and highlight the most influential ECG areas with saliency maps.
In this work we were able to show that transformers are well suited for cardiac age prediction due to their ability to accurately predict the age for individuals in the healthy cohort (Pearson correlation between predicted and biological age: 0.9) and because a delta age of +8 years or higher is associated with a higher risk of mortality (Hazard Ratio: 2.08 and 2.07 on the Code 15% and the SaMiTrop dataset, respectively). Furthermore, we proof that models can be trained solely on diseased samples, but are still able to predict the age of healthy individuals accurately. At last, we reveal that the models for cardiac age prediction highly focus on the p-wave and especially on lead V1. This finding is inline with research in the fields of senescence and cardiology.
Elektrokardiographie ist eine weit verbreitete, sichere, kostengünstige und nicht-invasiveMethode zur Überwachung des kardiovaskulären Zustands eines Patienten. Ihre hohe Verfügbarkeit stellt Forschern umfangreiche öffentlich zugängliche EKG-Datensätze zur Verfügung, die es ermöglichen, leistungsfähige maschinelle Lernalgorithmen zu entwickeln. Diese Algorithmen können kardiovaskuläre Erkrankungen direkt vorhersagen oder den allgemeinen Gesundheitszustand des Herzens durch die Schätzung des kardialen Alters bestimmen. Für die Vorhersage des kardialen Alters werden überwiegend Convolutional Neural Networks (CNNs) verwendet. Aufgrund der sequenziellen Natur von EKGSignalen schlagen wir einen auf Transformern basierenden Ansatz zur Vorhersage des kardialen Alters vor. Das Ziel dieser Arbeit ist es, ein Transformermodell zu trainieren und es mit einem führenden CNN zu vergleichen. Darüber hinaus wollen wir die Gründe hinter den Modellen aufdecken und somit biologische Erkenntnisse ableiten.
Die Bewertung und damit das Benchmarking verschiedener Herzaltersmodelle ist nicht einfach. Abweichungen vom biologischen Alter können entweder auf ein ungenaues Modell
hinweisen oder gerechtfertigt sein, weil die Person an einer zugrunde liegenden Herz-
Kreislauf-Erkrankung leidet. Um die Modelle zu vergleichen, haben wir daher (1) die
Modelle an einer gesunden Kohorte getestet, (2) Cox-Modelle verwendet, um zu bewerten, ob die Vorhersagen ein höheres Sterblichkeitsrisiko widerspiegeln, (3) die Vorhersagen visuell verglichen und (4) den Entscheidungsprozess der Modelle offengelegt und die einflussreichsten EKG-Bereiche mit Salienz-Karten hervorgehoben.
In dieser Arbeit konnten wir zeigen, dass Transformatoren gut für die Vorhersage des
Herzalters geeignet sind, da sie in der Lage sind, das Alter von Personen in der gesunden Kohorte genau vorherzusagen (Pearson-Korrelation zwischen vorhergesagtem und biologischem Alter: 0,9) und weil eine hohe positive Abweichung zum biologischen Alter mit einem höheren Sterblichkeitsrisiko verbunden ist (Hazard Risiko: 2,08 bzw. 2,07 auf den Code 15%- und SaMiTrop-Datensätzen). Darüber hinaus beweisen wir, dass Modelle ausschließlich auf Elektrokardiogrammen von kranken Individuen trainiert werden können, aber dennoch in der Lage sind, das Alter gesunder Personen genau vorherzusagen.
Schließlich zeigen wir, dass die Modelle zur Vorhersage des Herzalters stark auf die
P-Welle und insbesondere auf die Ableitung V1 fokussieren. Diese Erkenntnis steht im
Einklang mit der Forschung in den Bereichen Seneszenz und Kardiologie.
For cardiac age predictions Convolutional Neural Networks (CNNs) are predominately
used. Due to the sequential nature of ECG signals we propose a transformer based approach to predict the cardiac age. The goal of this thesis is to train a transformer model for cardiac age prediction and to benchmark it against a state-of-the-art CNN. Furthermore, we aim at revealing the reasoning behind the models and hence to derive biological insights.
Evaluation and hence benchmarking different cardiac age models is not straight forward. Deviations from the biological age can either indicate an inaccurate model or are justified, because the individual suffers from an underlying cardiovascular disorder. To compare the models we therefore (1) benchmarked the models on a healthy cohort (2) used cox models to evaluate whether the predictions reflect a higher mortality risk, (3) visually compared the predictions and (4) revealed the models’ decision making process and highlight the most influential ECG areas with saliency maps.
In this work we were able to show that transformers are well suited for cardiac age prediction due to their ability to accurately predict the age for individuals in the healthy cohort (Pearson correlation between predicted and biological age: 0.9) and because a delta age of +8 years or higher is associated with a higher risk of mortality (Hazard Ratio: 2.08 and 2.07 on the Code 15% and the SaMiTrop dataset, respectively). Furthermore, we proof that models can be trained solely on diseased samples, but are still able to predict the age of healthy individuals accurately. At last, we reveal that the models for cardiac age prediction highly focus on the p-wave and especially on lead V1. This finding is inline with research in the fields of senescence and cardiology.
Elektrokardiographie ist eine weit verbreitete, sichere, kostengünstige und nicht-invasiveMethode zur Überwachung des kardiovaskulären Zustands eines Patienten. Ihre hohe Verfügbarkeit stellt Forschern umfangreiche öffentlich zugängliche EKG-Datensätze zur Verfügung, die es ermöglichen, leistungsfähige maschinelle Lernalgorithmen zu entwickeln. Diese Algorithmen können kardiovaskuläre Erkrankungen direkt vorhersagen oder den allgemeinen Gesundheitszustand des Herzens durch die Schätzung des kardialen Alters bestimmen. Für die Vorhersage des kardialen Alters werden überwiegend Convolutional Neural Networks (CNNs) verwendet. Aufgrund der sequenziellen Natur von EKGSignalen schlagen wir einen auf Transformern basierenden Ansatz zur Vorhersage des kardialen Alters vor. Das Ziel dieser Arbeit ist es, ein Transformermodell zu trainieren und es mit einem führenden CNN zu vergleichen. Darüber hinaus wollen wir die Gründe hinter den Modellen aufdecken und somit biologische Erkenntnisse ableiten.
Die Bewertung und damit das Benchmarking verschiedener Herzaltersmodelle ist nicht einfach. Abweichungen vom biologischen Alter können entweder auf ein ungenaues Modell
hinweisen oder gerechtfertigt sein, weil die Person an einer zugrunde liegenden Herz-
Kreislauf-Erkrankung leidet. Um die Modelle zu vergleichen, haben wir daher (1) die
Modelle an einer gesunden Kohorte getestet, (2) Cox-Modelle verwendet, um zu bewerten, ob die Vorhersagen ein höheres Sterblichkeitsrisiko widerspiegeln, (3) die Vorhersagen visuell verglichen und (4) den Entscheidungsprozess der Modelle offengelegt und die einflussreichsten EKG-Bereiche mit Salienz-Karten hervorgehoben.
In dieser Arbeit konnten wir zeigen, dass Transformatoren gut für die Vorhersage des
Herzalters geeignet sind, da sie in der Lage sind, das Alter von Personen in der gesunden Kohorte genau vorherzusagen (Pearson-Korrelation zwischen vorhergesagtem und biologischem Alter: 0,9) und weil eine hohe positive Abweichung zum biologischen Alter mit einem höheren Sterblichkeitsrisiko verbunden ist (Hazard Risiko: 2,08 bzw. 2,07 auf den Code 15%- und SaMiTrop-Datensätzen). Darüber hinaus beweisen wir, dass Modelle ausschließlich auf Elektrokardiogrammen von kranken Individuen trainiert werden können, aber dennoch in der Lage sind, das Alter gesunder Personen genau vorherzusagen.
Schließlich zeigen wir, dass die Modelle zur Vorhersage des Herzalters stark auf die
P-Welle und insbesondere auf die Ableitung V1 fokussieren. Diese Erkenntnis steht im
Einklang mit der Forschung in den Bereichen Seneszenz und Kardiologie.
| Original language | English |
|---|---|
| Qualification | Master |
| Supervisors/Reviewers |
|
| Publication status | Published - 2025 |
Fields of science
- 206003 Medical physics
- 206002 Electro-medical engineering
- 206 Medical Engineering
- 202027 Mechatronics
- 106 Biology
- 211 Other Technical Sciences
- 206004 Medical engineering
- 305 Other Human Medicine, Health Sciences
- 107002 Bionics
- 206001 Biomedical engineering
- 211905 Bionics
- 203015 Mechatronics
Cite this
- APA
- Author
- BIBTEX
- Harvard
- Standard
- RIS
- Vancouver