Prognoza frekwencji oparta o AI

Ten wpis jest jedną z części szerszego artykułu "AI w służbie dziedzictwa: Dynamic Pricing Droplabs i predykcja frekwencji w kształtowaniu zrównoważonych zachowań turystycznych w TPN."

Na pierwszy rzut oka, pytanie o frekwencję na parkingu Palenica Białczańska wydaje się śmiesznie proste. Idealnie słoneczny weekend lub święto narodowe? Możesz obstawiać w ciemno – parking pęknie w szwach! Całodzienna ulewa i mgła w jesienny dzień powszedni? Zgadza się – będzie tam pusto. Przewidzenie obłożenia w tych kilkunastu skrajnych, "czarno-białych" dniach w roku to żadna sztuka, gdy skrajne cechy pogodowe i ewidentne kalendarzowe nakładają się na siebie.

Sztuka predykcji nie polega jednak na określeniu obłożenia w tych kilku, łatwych do zidentyfikowania dniach. Prawdziwe wyzwanie zaczyna się w dniach "nieoczywistych", które stanowią większość kalendarza: jak przewidzieć obłożenie, gdy w weekend zapowiadane jest jedynie częściowe zachmurzenie? Co decyduje o frekwencji, jeśli w wakacyjny dzień suma opadów jest trochę wyższa od zera, lub gdy maksymalna temperatura spada poniżej 20 stopni Celsjusza? Do tego dochodzą powakacyjne dni powszednie, których w ciągu roku jest najwięcej. 

Dla lepszego zobrazowania tego wyzwania, przeanalizujmy wykres rozrzutu (scatter plot) ilustrujący frekwencję na parkingu w Palenicy Białczańskiej względem sumy dziennych opadów. Maksymalna zajętość parkingu to ok. 1300 samochodów. 

Zdj. Wykres rozrzutu sumy dziennych opadów a frekwencji na Parkingu TPN. Obserwujemy słabą korelację.

Każda kropka reprezentuje jeden dzień w roku, a jej rozkład natychmiast obala proste intuicje. W dniach, w których nie było opadów odnotowywano frekwencję od bliskiej zeru, aż do maksymalnej. Terminy te reprezentują kropki na osi przechodzącej przez 0 mm sumy dziennych opadów. Podobnie, jest wiele dni z sumą opadów dochodzących do 10 mm, dla których frekwencja jest bardzo wysoka. Duże rozrzuty frekwencji zauważamy też w dni o jeszcze większej sumie dziennej opadów.

“Współczynnik Pearsona mówi nam o liniowej korelacji, której hipotetyczny przebieg został wykreślony na wykresie czarną linią. Nie oznacza to, że rzeczywiste zachowanie klientów jest liniowe. Badając tą metodą omijamy inne rodzaje korelacji i zależności. Taki rozkład punktów oznacza, że współczynnik Pearsona wskazuje na słabą zależność. Mamy do czynienia z rozkładem losowym z lekkim odchyleniem w stronę malejących wartości. Ta cecha może służyć jako dodatkowa informacja dostrajająca model predykcyjny, natomiast sama w sobie bez kontekstu innych cech nie dałaby żadnych możliwości wyciągnięcia wniosków”

 - wskazuje Michał Piłat, Data Scientist w Droplabs. 

Takie przykłady można mnożyć, analizując dane pod kątem wybranych cech np. obecności pokrywy śnieżnej, zachmurzenia, ale też uwzględniając dane tylko dla wybranych okresów np. wakacje, ferie konkretnych województw, dni wolne od pracy.

“Ludzie posiadają wrodzoną skłonność do utrwalania w pamięci charakterystycznych zdarzeń oraz nadawania im większego znaczenia niż wynikałoby to ze statystyki. W przeciwieństwie do ludzkiego postrzegania, systemy oparte na uczeniu maszynowym (AI) stosowane przez Droplabs a wykorzystywane w Tatrzańskim Parku Narodowym, umożliwiają analizę rzeczywistych, rozbudowanych zbiorów danych w wielowymiarowych kontekstach. Umożliwia to identyfikowanie subtelnych zależności i wzorców,  ponieważ wychodzą poza schematyczne myślenie i intuicyjne uproszczenia.”

 - dodaje Monika Karpierz-Nałęcz, Head of AI w Droplabs

Aby rozwiązać wyzwanie przewidywania frekwencji, Tatrzański Park Narodowy korzysta z Prognozy frekwencji opartej o AI dostarczanej przez Droplabs. W panelu webowym dostępny jest podgląd przewidywanej frekwencji na dany dzień w przyszłości - widoczne są widełki “od do”. Dostępny jest też podgląd pomagający zrozumieć skuteczność prognozy - dla dat w przeszłości można sprawdzić jaka była prognoza historyczna a jakie były faktycznie uzyskane wartości - pomaga to budować zaufanie do modeli. 

Zdj. Zrzut ekranu z panelu Droplabs pokazujące historię prognoz od drugiej połowy września 2025 r.

Podobnie jak standardowe prognozy pogody, predykcje frekwencji Droplabs na przyszłe dni nie są statyczne – zmieniają się w czasie. Obowiązuje tu zasada: im bliżej terminu, tym predykcja jest skuteczniejsza. Wynika to z faktu, że horyzont czasowy się skraca, a modele dysponują większą ilością danych lepszej jakości np. świeżymi, bardziej precyzyjnymi prognozami meteorologicznymi czy też większą liczbą sygnałów dot. zachowań klientów w sklepie online.

“Dłuższe horyzonty predykcyjne są z natury trudniejsze do estymacji, ponieważ model musi przetwarzać i weryfikować cały dynamicznie zmieniający się kontekst danych. Przykładowo, ten sam poziom rezerwacji może oznaczać co innego w zależności od prognozy pogody – sugerując wizytę planowaną lub spontaniczną. Kiedy prognoza meteorologiczna ulega zmianie, zmienia się cały kontekst decyzyjny. Model musi dopasować predykcję do aktualnej sytuacji rynkowej i warunków zewnętrznych, zamiast polegać na danych i założeniach sprzed kilku dni.

- wskazuje Piotr Pyznarski, założyciel Droplabs odpowiadający za produkt i technologię (CTO)

Modele predykcyjne Droplabs charakteryzują się wysoką skutecznością. W Tatrzańskim Parku Narodowym trafnie określając widełki frekwencji dla nadchodzącego dnia w  ok. 90% przypadków. 

Zdj. Zrzut ekranu z panelu Droplabs pokazujące historię prognoz od drugiej połowy września 2025 z dodatkowo zaznaczonym okresem 19-22.09 na które prognozowane było maksymalne obłożenie oraz zaznaczonym czwartkiem 18.09 oraz 25.09r.

Dla zobrazowania, spójrzmy na zrzut ekranu historii prognozy z drugiej połowy września 2025 widoczny wyżej. Przykładowo, na piątek, 19 września 2025 r., a także na cały następujący po nim weekend oraz pracujący poniedziałek, 22 września, przewidywano pełne obłożenie parkingu – co w pełni się sprawdziło.

Co ważniejsze, system z powodzeniem wychwytuje subtelne zmiany popytu. Model trafnie przewidział znaczący spadek frekwencji w kolejny czwartek, 25 września, w porównaniu do czwartku z poprzedniego tygodnia. Rzeczywiste dane potwierdziły ten trend: 25 września odnotowano zaledwie 350 samochodów, podczas gdy czwartek tydzień wcześniej przyciągnął ponad 800 pojazdów.

Zdj. Z lewej: prognoza pogody dla Zakopanego widziana z perspektywy dnia 9.10.2025 (czwartek). Z prawej: zrzut ekranu z panelu Droplabs ukazujące historyczne wartości prognozy frekwencji dla m.in. 9.10.2025 (czwartek) i 10.10.2025 (piątek).

Analiza danych z 9 października 2025 r. ilustruje niezależność popytu od samej prognozy pogody. W czwartek, 9 października, przy deszczowej i chłodnej aurze, na parkingu stawiło się 217 samochodów. Pomimo w zasadzie identycznych okoliczności atmosferycznych zapowiadanych na następujący piątek, model frekwencji wskazywał na znacznie wyższe widełki przewidywań. Rzeczywiste dane potwierdziły tę predykcję: frekwencja w piątek była ponad dwukrotnie wyższa, osiągając 450 pojazdów. 

Parking TPN przy szlaku na Morskie Oko stanowi złożoną infrastrukturę, składającą się z trzech odrębnych stref postojowych: głównego parkingu na Palenicy Białczańskiej (o pojemności ok. 600 pojazdów), pasa drogowego między Palenicą Białczańską a Łysą Polaną oraz parkingu utwardzonego na Łysej Polanie.

Precyzyjne prognozy frekwencji mają znaczenie dla przygotowania operacyjnego TPN. Umożliwiają one efektywne planowanie patroli Służby Parku, optymalne rozmieszczenie załogi na placach postojowych oraz bieżące dostosowywanie komunikacji do turystów. W rezultacie, wydajniejsze zarządzanie operacjami prowadzi do optymalizacji kosztów funkcjonowania Parku.

W kolejnym artykule zgłębiamy się w technologiczna stronę rozwiązań i zobaczymy wgląd w systemy AI od Droplabs. Zapraszamy do jego lektury pod tym linkiem.

Ten wpis jest jedną z części szerszego artykułu "AI w służbie dziedzictwa: Dynamic Pricing Droplabs i predykcja frekwencji w kształtowaniu zrównoważonych zachowań turystycznych w TPN."