Opis badania

jak został stworzony wskaźnik ryzyka zawału?





Dane z I Katedry Kliniki Kardiolgii WUM

Meteorologiczne dane w bazie pochodzą z archiwów Instytutu Meteorologii i Gospodarki Wodnej i obejmują pomiary z lat 2014-2022. Dane o Ostrych Zespołach Wieńcowych zdobyto dzięki Ogólnopolskiemu Rejestrowi Procedur Kardiologii Inwazyjnej. Każdej pracowni Kardiologii Inwazyjnej przypisano najbliższą stację meteorologiczną, umiejscowioną w promieniu 50 kilometrów, co ma na celu minimalizację różnic w parametrach pogodowych między oboma lokalizacjami. Zestawienie dziennych danych meteorologicznych z informacjami o Ostrych Zespołach Wieńcowych pozwala na precyzyjną analizę wpływu warunków atmosferycznych na tę jednostkę chorobową.

Dane pogodowe na temat zanieczyszczenia powietrza - API

W projekcie korzystamy z danych meteorologicznych dostarczanych przez openweathermap.org. Dane te są codziennie pobierane za pomocą API, co pozwala nam na bieżąco monitorować warunki pogodowe. Informacje te są następnie wykorzystywane do zasilenia naszego modelu predykcyjnego, szacującego ryzyko kardiologiczne na podstawie zanieczyszczeń powietrza. Dzięki regularnym aktualizacjom, nasze prognozy są zawsze oparte na najnowszych dostępnych danych.

Model klasyfikacji na podstawie danych

Nasz model przewidujący ryzyko zawałów serca został wytrenowany na danych dotyczących dziennych ilości Ostrych Zespołów Wieńcowych (OZW) w Warszawie, zebranych na przestrzeni 8 lat. Zmiennymi objaśniającymi w modelu są: ciśnienie atmosferyczne (hPa), wilgotność (%), temperatura (°C), oraz stężenia zanieczyszczeń powietrza, takich jak CO, NO2, PM10, PM2,5, SO2 i O3 (wszystkie w µg/m³). Model klasyfikuje dzienne ryzyko wystąpień OZW za pomocą algorytmu lasów losowych, osiągając dokładność na poziomie 65%. Stworzony w Pythonie model będzie w przyszłości udoskonalany w celu zwiększenia precyzji predykcji.

Niskie ryzyko: Kategoria obejmująca wartości mniejsze niż średnia z ostatnich 8 lat pomniejszona o jedno odchylenie standardowe. Oznacza to, że wartości mieszczące się w tym zakresie są znacznie poniżej przeciętnego poziomu, co wskazuje na niższe ryzyko. Zakres: do 8 zawałów w ciągu dnia.

Umiarkowane ryzyko: Wartości mieszczące się w przedziale od średniej pomniejszonej o jedno odchylenie standardowe do średniej powiększonej o jedno odchylenie standardowe. Wartości te są bliskie przeciętnemu poziomowi, co oznacza umiarkowane ryzyko. Zakres: 8-20 zawałów w ciągu dnia.

Wysokie ryzyko: Kategoria obejmująca wartości od średniej powiększonej o jedno odchylenie standardowe do średniej powiększonej o dwa odchylenia standardowe. Wartości te są znacząco powyżej przeciętnego poziomu, co wskazuje na wyższe ryzyko. Zakres: 20-26 zawałów w ciągu dnia.

Bardzo wysokie ryzyko: Wartości przekraczające średnią powiększoną o dwa odchylenia standardowe. Oznacza to, że wartości w tym zakresie są znacznie powyżej przeciętnego poziomu, co oznacza bardzo wysokie ryzyko. Zakres: powyżej 26 zawałów w ciągu dnia.