FAQ
Najczęstsze pytania o sieć Żabka - z danymi, nie z wyczuciem. I te pytania, które powinny paść, kiedy ktoś patrzy na mapy korelacji, ale zwykle nie padają.
Żabkozbiór to niezależny projekt fanowski/analityczny oparty na danych publicznych. Nie jest powiązany z Żabka Polska sp. z o.o. ani Żabka Group. Nazwa "Żabka" i powiązane znaki towarowe należą do ich właścicieli.
Podstawowe fakty o sieci
Ile jest Żabek w Polsce?
Ponad 13 200 aktywnych sklepów, w ponad 2200 miastach i miejscowościach. Liczba zmienia się codziennie - sieć otwiera nowe punkty praktycznie bez przerwy, choć część sklepów też zamyka się po drodze (patrz niżej).
Gdzie jest najwięcej Żabek?
W liczbach bezwzględnych: Warszawa (ponad 1100 sklepów) i województwo mazowieckie jako całość. Ale to głównie efekt wielkości miasta i regionu - większa populacja, więcej sklepów, bez wyjątku. Licząc na mieszkańca, prowadzi pomorskie (ok. 0,46 sklepu na 1000 osób), nie mazowieckie. Ranking odwraca się w zależności od tego, co dzielisz przez co - to nie przypadek, to dokładnie ten sam mechanizm, który opisujemy w sekcji o mieszaniu liczb bezwzględnych z gęstością niżej.
Gdzie jest najdalej do Żabki?
Najdalszy punkt od jakiejkolwiek Żabki w Polsce leży w Bieszczadach, około 46,5 km w linii prostej od najbliższego sklepu. To praktycznie środek Połoniny Wetlińskiej.
Ile Żabek przybywa rocznie?
Rocznie otwiera się od kilkuset do ponad 1900 nowych sklepów - rekordowy był 2025 rok z 1943 otwarciami. Prawie połowa dzisiejszej, wciąż aktywnej sieci powstała od 2023 roku. Tempo przyspieszyło zauważalnie po 2020.
Czy Żabka też zamyka sklepy, czy tylko otwiera nowe?
Tak, zamyka - to normalna rotacja sieci convenience, nie coś wyjątkowego. Problem jest inny: nasz wykres historii wzrostu (na dashboardzie, sekcja Sieć) liczy otwarcia tylko dla sklepów, które są aktywne dziś. Sklep, który otworzył się w 2015 i zamknął w 2022, po prostu nie istnieje w tym wykresie - jakby nigdy go nie było. To sprawia, że wcześniejsze lata wyglądają na słabsze niż realnie były (patrz "survivorship bias" niżej). Zamykanie sklepów zaczęliśmy śledzić dopiero, odkąd ten projekt działa - to osobna, znacznie krótsza historia.
Czy Żabka jest w każdym mieście w Polsce?
Nie, ale jest blisko - ponad 60% gmin ma co najmniej jedną Żabkę, a pokrycie powiatów jest praktycznie kompletne (314 z 314 powiatów lądowych ma przynajmniej jeden sklep). Miejsca bez Żabki to głównie małe, rozproszone gminy wiejskie.
Skąd pochodzą te dane
Skąd pochodzą te dane?
Główne źródło to publiczny plik lokalizatora sklepów na zabka.pl - ten sam, z którego korzysta wyszukiwarka sklepów na ich stronie. Wzbogacamy go danymi GUS BDL (zarobki, bezrobocie, populacja), GBIF (obserwacje płazów), InPost ShipX (paczkomaty) i GUGiK (granice administracyjne, geokodowanie, wysokość terenu). Pełny opis źródeł, cały potok ETL i lista znanych ograniczeń są na stronie metodyki.
Jak często aktualizowane są dane?
Codziennie, automatycznym potokiem o 3:00 w nocy czasu warszawskiego. Ekonomiczne dane GUS (zarobki, bezrobocie, populacja) aktualizują się rzadziej, bo GUS sam publikuje je raz w roku.
Czy mogę pobrać te dane samodzielnie?
Tak. Cała baza DuckDB (~48 MB) jest do pobrania z dashboardu, na licencji CC BY 4.0. Granice województw są dostępne jako GeoJSON. Surowe API jest udokumentowane pod /docs.
Czy to oficjalna strona Żabki?
Nie. Żabkozbiór jest niezależnym projektem fanowskim/analitycznym na danych publicznych, niezwiązanym z Żabka Polska sp. z o.o. ani Żabka Group. Nazwa "Żabka" i powiązane znaki towarowe należą do ich właścicieli.
Częste błędne wnioski
Ta sekcja istnieje, bo dane statystyczne łatwo naginają się do historii, którą chcemy usłyszeć. Poniżej są konkretne pułapki, w które łatwo wpaść, patrząc na ten dashboard - i dlaczego wniosek "oczywisty na pierwszy rzut oka" bywa nieprawdziwy.
Czy wysoka korelacja na mapach ekonomicznych oznacza, że bogactwo powoduje więcej Żabek?
Nie - i to jest najważniejsza pułapka na całym dashboardzie. Mapy w sekcji "Żabka a Polska" pokazują korelację: odchylenie gęstości sieci od trendu wyznaczonego przez zarobki lub bezrobocie w danym powiecie. Współczynnik r (np. r = +0,25 dla płacy) opisuje siłę tej zależności statystycznej - nie mechanizm przyczynowy. Równie dobrze mogłoby być odwrotnie (więcej sklepów napędza lokalną gospodarkę), albo - najbardziej prawdopodobnie - obie zmienne zależą od trzeciego czynnika: gęstości zaludnienia i urbanizacji. Bogate powiaty są zwykle też gęściej zaludnione i bardziej zurbanizowane, a to jest to, co realnie przyciąga sieci convenience - nie sama obecność pieniądza.
Czy więcej obserwacji płazów w GBIF przy danym sklepie znaczy, że tam żyje więcej żab?
Niekoniecznie. Rekordzista (ponad 2000 obserwacji w promieniu 5 km) to sklep na Ursynowie w Warszawie - gęsto zaludnionej dzielnicy z parkami, nie rezerwacie przyrody. Dane GBIF to zgłoszenia obywatelskiej nauki: odzwierciedlają gęstość obserwatorów ze smartfonami, nie tylko gęstość płazów. Dziewicze, słabo zamieszkane tereny (Bieszczady, Puszcza Białowieska) mogą mieć realnie więcej płazów i mniej zgłoszeń - po prostu mniej osób tam patrzy i wgrywa obserwacje.
Czy wykres wzrostu sieci od 1998 roku pokazuje pełną historię otwarć?
Nie - to jest survivorship bias w czystej formie. Wykres liczy otwarcia wyłącznie dla sklepów, które są aktywne dziś. Sklep, który otworzył się w 2003 i zamknął w 2015, jest niewidoczny - jakby nigdy nie istniał. To sprawia, że wczesne lata (1998-2010) wyglądają na słabsze, niż realnie były, bo część tamtej kohorty już wypadła z danych. Krzywa, którą widzisz, to "historia zwycięzców", nie kompletna historia sieci.
Skoro Warszawa ma najwięcej Żabek, to znaczy, że rynek jest tam najbardziej nasycony?
Nie wynika to z samej liczby. Ranking liczb bezwzględnych to w gruncie rzeczy ranking wielkości miast i regionów - większa populacja, więcej sklepów, praktycznie bez wyjątku. Żeby ocenić realne nasycenie, trzeba znormalizować: sklepów na 1000 mieszkańców albo na km². Te dwa ranking wyglądają zupełnie inaczej niż ranking liczb bezwzględnych (patrz sekcja GRAN na dashboardzie, z przełącznikiem między metrykami) - i to jest dokładnie powód, dla którego ten przełącznik istnieje.
Czy różnice w otwarciu w niedzielę między województwami to celowa strategia regionalna?
Dane pokazują tylko wynik (flaga open_sunday per sklep), nie przyczynę. Różnice w odsetku sklepów zamkniętych w niedzielę między regionami odzwierciedlają najpewniej lokalne wzorce ruchu klientów i indywidualne decyzje na poziomie pojedynczych punktów (część placówek korzysta z wyjątków od ustawowego zakazu handlu, np. na stacjach paliw czy w miejscach o określonej strukturze przychodów) - nie scentralizowaną politykę "zamykamy zachód, a nie wschód".
Czy ten zbiór danych jest kompletny i wolny od brakujących wartości?
Nie. Około 218 sklepów nie ma daty otwarcia w źródle. Wysokość terenu jest opcjonalna (wymaga ponad 13 tysięcy zapytań HTTP) i bywa NULL. Populacje powiatów to dane roczne z GUS, nie aktualne szacunki. Pełna lista ograniczeń jest na stronie metodyki.
Chcesz zobaczyć te dane na mapach i wykresach, nie w tekście?
Otwórz dashboard →