Proč potřebujete globální síť sond

Monitoring z jedné lokality často nestačí. Vaše služba může fungovat z jedné sítě a zároveň selhávat z jiné, jedna země může vidět normální odezvu a jiná timeouty. Proto nsmon kontroluje služby paralelně z více sond po celém světě a nevyhodnocuje dostupnost jen podle jednoho osamoceného pohledu.

Proč jeden check z jednoho místa zkresluje realitu

Internet není jedna jednotná síť. Různé regiony, různí provideři i různé síťové cesty se mohou chovat odlišně. Pokud měříte jen z jedné lokality, snadno získáte falešný pocit, že je vše v pořádku, i když část uživatelů už reálně naráží na problém.

Stejně tak nechcete vyhlašovat incident jen proto, že v jednom regionu zrovna nefunguje určitý provider nebo konkrétní síťová cesta. To často není něco, co můžete jako provozovatel služby přímo ovlivnit. Smyslem více sond je právě odlišit izolovaný regionální problém od skutečné nedostupnosti vaší služby.

Kdy více-lokační sondy dávají největší smysl

Regionální výpadek

Služba může být dostupná z jedné části světa a zároveň nedostupná z jiné. Jedna lokace vám takový rozdíl neukáže.

Problém u konkrétního providera

Někdy neselže aplikace, ale jen konkrétní síťová cesta mezi dvěma operátory nebo cloudy.

Rozdílná latence podle lokality

Uživatelé nezažívají jednu univerzální latenci. Více sond ukáže, jak se odezva liší napříč regiony.

Potřeba odlišit lokální anomálii od skutečného incidentu

Když selže jedna sonda a ostatní jsou zdravé, jde často o lokální problém, ne o outage celé služby.

Jak globální síť sond v nsmonu funguje

01

Služba se kontroluje z více lokalit současně

nsmon neposílá check jen z jednoho místa, ale z více geograficky oddělených sond. Díky tomu vidíte, jestli je problém lokální, regionální, nebo skutečně globální.

02

Počet sond závisí na tarifu

Kolik sond se na ověření služby podílí, závisí na subscription tieru. Vyšší počet sond zvyšuje jistotu i přesnost vyhodnocení.

03

Každá sonda vrací vlastní pohled

Každá lokalita měří dostupnost a odezvu samostatně. Díky tomu lze vidět, zda se problém projevuje napříč sítěmi, nebo jen v úzkém segmentu internetu.

04

Teprve potom vzniká finální vyhodnocení

Incident potvrzujeme až ve chvíli, kdy si jsme dostatečně jistí, že nejde jen o izolovaný problém jedné lokality nebo jednoho providera.

Jak o více-lokačním monitoringu přemýšlet

Prakticky jde o několik paralelních pohledů na stejnou službu:

Probe A (Praha)        HTTPS 200, 78 ms
Probe B (Frankfurt)    HTTPS 200, 86 ms
Probe C (Londýn)       HTTPS 200, 91 ms
Probe D (New York)     timeout
Probe E (Warszawa)     HTTPS 200, 80 ms

Rozdílné výsledky jsou cenný signál

Když se služba chová různě podle lokality, monitoring to má ukázat, ne skrýt.

Latence se ukládá z úspěšných sond

Více sond neukazuje jen to, zda je služba UP nebo DOWN, ale i to, jak se liší odezva mezi regiony.

Ne každý regionální problém je váš incident

Když je služba funkční z většiny lokalit a problém se týká jen jednoho regionu nebo providera, nechceme z toho dělat falešný outage vaší služby.

Více sond zvyšuje důvěru v verdict

Když stejný problém vidí více nezávislých lokalit současně, je mnohem pravděpodobnější, že jde o skutečný incident.

Co jedna sonda obvykle neuvidí

Jedna sonda obvykle neodhalí, že problém existuje jen v určitém regionu nebo jen u části uživatelů. Stejně tak neumí spolehlivě rozlišit, jestli jde o skutečný výpadek služby, nebo o izolovanou síťovou anomálii mimo vaši kontrolu.

Právě proto je globální síť sond tak důležitá. Nejde jen o více dat, ale hlavně o správnější interpretaci toho, co se se službou opravdu děje.

Jedna sonda vs globální síť sond

Otázka Jedna sonda Globální síť sond
Co ukáže Jeden konkrétní pohled z jedné lokality. Více paralelních pohledů z různých sítí a regionů.
Riziko Snadno přehlédne regionální problém nebo naopak vyvolá zbytečný alert. Lépe odliší izolovaný regionální problém od skutečné nedostupnosti služby.
Hodnota pro troubleshooting Omezená, protože chybí srovnání. Vyšší, protože vidíte, kde se problém opravdu projevuje.
Související článek

Jak nsmon z výsledků více sond udělá finální rozhodnutí?

Na globální síť sond navazuje Smart Quorum Consensus, který omezuje falešné poplachy a rozhoduje, kdy je služba opravdu DOWN.

Přečíst článek o Smart Quorum Consensus

Typické situace z praxe

Evropa je zdravá, USA hlásí timeouty

To většinou ukazuje na regionální síťový problém, ne na globální pád aplikace.

Selže jen jedna sonda

Často jde o izolovaný problém konkrétního regionu nebo providera, ne o skutečný outage vaší služby.

Všechny sondy hlásí stejný fail

To je mnohem silnější signál potvrzeného incidentu.

Latence se liší podle regionu

To je normální a zároveň důležitá observabilita pro reálné uživatelské chování.

Důležitá omezení

  • Více sond zlepšuje přesnost, ale není to absolutní model všech sítí na světě.
  • Počet použitých sond závisí na subscription tieru a na tom, kolik paralelních pohledů je pro daný monitoring k dispozici.
  • Více-lokační monitoring nenahrazuje aplikační validaci typu HTTP body match nebo DNS expected IP.
  • Rozdíly mezi lokalitami je potřeba interpretovat v kontextu protokolu a typu služby.

Co lidé zkoušejí ručně

Ping z jedné lokality
ping example.com

Rychlý základ, ale pořád jen z jednoho zdrojového místa.

Traceroute z jedné lokality
traceroute example.com

Ukáže trasu z jedné sítě, ale neřekne nic o ostatních regionech.

Ruční test z více serverů
ssh na více VPS a spouštět stejné checky ručně

Funguje, ale je to pomalé, bez historie a těžko škálovatelné.

Časté dotazy

Služba není dostupná jen v datacentru, ale v sítích vašich uživatelů.

nsmon kontroluje endpointy z více nezávislých probe lokalit, takže regionální problémy, rozdíly v latenci i skutečné výpadky uvidíte dřív a přesněji. Vytvořte si účet zdarma a monitorujte z perspektivy reálného internetu.