Každý z nás pracuje s elektronickým zařízením a už se se setkal, že se „zaseklo“. Zařízení se dostane do stavu, kdy LED diody signalizují chod zařízení, ale přesto s námi nekomunikuje. Ano, mám namysli převážně ethernet Switche, Routery, počítače, Access Pointy a prostě všechno, co strkáme do elektrické zásuvky a jednou za čas se projeví jeho nesprávná činnost. Většina provozovatelů síťového hardware používá Dohled. Na světelném panelu vidí správný chod sítě a o výpadku se dozví včas. Co dělat, když se na Dohledu rozsvítí červená kontrolka?
Ve většině případech pomůže Reboot zařízení, které právě padlo. Ne však každé zařízení tuto funkci má. Například běžný Ethernet Switch nemá vzdálenou správu a jediný způsob zotavení je prostě přijít k němu, vypnout jej od napájení, počkat pár sekund a opět jej připojit. Oproti běžným Switchům má Router vzdálenou správu. V menu nalezneme vždy Reboot. Ten však nemusí pomoci v každé situaci. Běh programu sice začne znovu od Nuly, ale tvůrci hardware nám znepříjemňují život tím, že nepropojují Reset signál mezi všemi jeho části. Pokud Router obsahuje modul switche, je téměř jisté, že signál Reset se k němu nedostane. Tvůrci se tímto brání před poškozením jiných obvodů na desce a tím uměle zvyšují jeho spolehlivost. V důsledku toho nám Router sice pracuje správně, ale některé Ethernet rozhraní prostě nekomunikují. Stejné je to i u Access Pointů. Provedeme Reboot, ale rádiová karta stále nepřenáší pakety. A opět je jedinou možností jeho zotavení prostě přijít, vypnout od napájení, počkat pár sekund a opět jej připojit.
Už slyším Vaše hlasy, které se dělí do dvou skupiny. První skupina říká, že používá jen drahý a tudíž spolehlivý hardware. Druhá skupina říká, že téměř všude na routerech používá velké množství skriptů, které zamezují jeho nesprávnému chodu. I když na první pohled vypadá, že hardware je stabilní, o jeho nedokonalosti nás přesvědčí první bouřka či naše oblíbena Skupina ČEZ. Je jasné, že s těmito vlivy výrobci (v důsledku snižování nákladů na výrobu) prostě většinou nepočítají.
Téměř všemocný lék „Vypnout a zapnout“, který odstraní až 90% problémů, nemusí být vždy tak snadný. Zařízení je buď daleko od naši provozovny nebo je uzamčené v místnosti, od které nemáme teď hned klíče. To je ta pravá chvíle řešit výrobní nedokonalosti jiným způsobem.
Přichází na scénu externí Watchdog – hlídací zařízení, které nám pomáhá chránit spolehlivost zařízení. (Výraz Watchdog zdomácněl spíše ve střední Evropě. Jinde se používá výraz Watcher.) Na Českém trhu nalezneme minimálně tři zařízení z domácí výroby.
V další části článku si povíme o základních principech testování správného chodu zařízení.
Foto z slavného britského serálu „The IT Crownd“.
Vypnout a zapnout – existuje mnoho různých řešení
O tom, proč potřebujeme externí Watchdog jsme si povídali v první části tohoto článku. Teď je na řadě metodika jak odhalit špatný chod zařízení.
Použití sériového portu
Použití sériového portu našeho hardware je nejjednodušší způsob, jak odhalit špatný chod zařízení a pomoct jej zotavit. Použít lze na PC nebo Routerech, které jsou vybavené sériovým rozhraním. Je nutné naprogramovat a spustit skript (program), který na sériové rozhraní bude pravidelně vysílat data. Postačí, když bude vysílat například ASCII znaky „ABCDE“ každou minutu. Pomocí externího zařízení posloucháme, co se na sériové lince děje. Pokud přijde sekvence „ABCDE“, pak je vše v pořádku. Pokud se tato sekvence na sériové lince delší dobu neobjeví, zařízení nepracuje správně (zaseklo se) a pak stačí pomocí relé jej vypnout a zapnout. Toto zařízení je konstrukčně nejjednodušší a pracuje samo bez naši obsluhy. Jenže ne všechna zařízení mají software typu Open Source, abychom mohli sami ovládat sériový port.
Pohled na schéma jednoduššího provedení Watchdogu pro sériový port. Zdroj: http://www.volny.cz/ladmanj/watchdog.htm
Výhody:
+ nízké výrobní náklady
+ jednoduchá konstrukce
+ zařízení pracuje bez naši obsluhy
Nevýhody:
– vyžaduje Open Source
– zařízení musí mít sériové rozhraní
Použití GSM modulu
Pokud zařízení, které chceme monitorovat, nemá sériové nebo jiné použitelné rozhraní, je nejsnazší způsob použití GSM modulu. Pomocí SMS zprávy nebo pouhým vytočením telefonního čísla můžeme ovládat relé, které zařízení odpojí a připojí zpět k napájecímu napětí. Bohužel takové zařízení neodhaluje závadu, ale jenom řeší její odstranění.
GSM Modul s relé
.
Domácí provedení GSM resetátoru. Zdroj: http://internet.vprdeli.com/view.php?cisloclanku=2006042902
Výhody:
+ lze ovládat jakékoliv zařízení
Nevýhody:
– nutno čekat, až Dohled ohlásí závadu
– pouze manuální ovládání
– vysoké pořizovací náklady
Použití IP rozhraní
Použití IP rozhraní je nejefektivnější způsob, jak odhalit špatný chod zařízení. Zařízení funguje špatně, když nepřenáší žádná data nebo neodpovídá na druhé vrstvě TCP protokolu. K takovému odhalení špatného chodu nám slouží nástroje Ping, Traceroute, HTTP Response, DNS Response,a další. Tyto diagnostické nástroje můžeme používat nejen ve Windows nebo Linuxu, ale díky velkému množství programových knihoven také v malých zařízeních s procesory Atmel, WSI, Motorola a dalších. Zřízení s využitím ethernetového rozhraní pak můžeme ovládat přes Webové stránky, což je uživatelsky příjemné. V internetovém prohlížeči můžeme ovládat všechny funkce a zobrazovat jejich stavy. Většina Dohledových software umí s takovým zařízením spolupracovat na úrovni Telnetu, XML nebo SNMP protokolu.
Ukázka IP Watchdogu České výroby
Výhody:
+ zařízení pracuje bez naši obsluhy
+ pořizovací náklady nižší než u GSM modulů
+ práce s IP protokoly
+ kontrola více zařízení
+ vzdálená správa přes Web
+ přímé propojení s Dohledem
Nevýhody:
– neznámé
Optický modul
Než popíšu tuto metodu, chci uvést na svou obhajobu, že jsem to neměl ze začátku v úmyslu. Nakonec jsem se rozhodl tuto metodu popsat, ale to jen proto, že návody na takový Watchdog můžete omylem vyGooglit. Takové zařízení však dokáže na mé tváři vyloudit spíše jen úsměv.
Zařízení se skládá ze dvou tranzistorů, fotodiody, kondenzátoru, rezistoru a potřebného relé. Fotodioda se upevní na sledované zařízení tak, aby mohla snímat reakce LED, která detekuje aktivitu zařízení jako je Switch nebo Access Point (když přenáší data, pak blíká). Pokud sledovaná LED svítí, nabíjí se kondenzátor. Pokud zhasne, kondenzátor se vybíjí. Blikáním takové LED tedy nelze kondenzátor plně nabít. Pokud LED přestane blikat a jen trvale svítí, stihne se kondenzátor plně nabít a dojde k sepnutí relé. Úpravou zapojení docílíme, že relé sepne při zhasnuté LED.
Jedna z možných variant řešení. Zdroj: http://www.cipis.net/ovislink/1120AP/watchdog
Výhody:
+ zařízení pracuje bez naši obsluhy
+ jednoduchá konstrukce
+ pořizovací náklady do 50,- Kč
Nevýhody:
– naprostá nekontrolovatelnost chování zařízení
Vypnout a zapnout – a tak to řešíme my 🙂
Externí Watchodogy pro monitorování běhu zařízení lze koupit téměř v každém E-shopu, který se specializuje na prodej síťových prvků. V tomto oboru se naplnilo rčení „Zlaté české ručičky“. Na našem trhu lze najít hned několik českých výrobků. Jednomu z nich chci v tomto díle věnovat pozornost.
Jedná se o zařízení s obchodním názvem IP-WDT. Jeho rozměry se výrazně neliší od jiných, ale hliníková krabička naznačuje, že jej lze použít i v náročnějších podmínkách. Krabička nemá ostré hrany a krásně vklouzne i do zaplněné instalační krabice na střeše panelového domu. Watchdog je vybaven jedinou LED na předním panelu. Pomocí dvou barev signalizuje stav zařízení. Zadní panel je osazen potřebnou zásuvkou RJ45 s LED pro Link a Act., kolíkovým DIN konektorem pro další rozšíření a svorkovnicí pro připojení vodičů. Svorkovnice je odpojitelná od zařízení, takže jeho výměna kus za kus je snadná a vodiče se nemusí ze svorkovnice odpojovat.
Přední panel IP Watchdogu obsahuje LED a Reset.
Napětí pro napájení Watchdogu se přivádí pomocí zmíněné svorkovnice. Na svorkovnici nalezneme také spínací a rozpínací kontakty dvou relé a kontakty pro kontrolu napětí v síti 230V. Externí zdroj napájecího napětí může být nevýhodou, ale taktéž dobrým pomocníkem. Můžeme totiž jedním zdrojem napájet více zařízení nebo použít zálohovaný zdroj nízkého stejnosměrného napětí, kterým jsou Popy běžně vybaveny. V případě vadného zdroje měníme jenom jej a Watchdog tak zůstává netknutý.
Zadní panel obsahuje RJ45 a odpojitelnou svorkovnici.
Samotné funkce zařízení jsou také zajímavé. Nabízí dvě nezávislá přepínací relé. Každé relé můžeme ovládat jiným testem. Běžný test pomocí ICMP Pingu (též ICMP ECHO) je samozřejmostí jako u všech podobných zařízení. Můžeme nastavit až 8 testů a ke každému z nich přiřadit jiné relé. Relé lze uvést do různých kombinací stavů, např. Rozepni -> počkej -> a zase sepni. Kromě základního testu můžeme použít také test ověřování dostupnosti webového serveru metodou HTTP Response. Pokud webserver dotazovaného zařízení mlčí, je tento stav vyhodnocen jako závada.
Schéma testování Access Pointu pomocí PINGu.
Schéma testování dostupnosti Webserveru (HTTP Response)
Zajímavou a novátorskou funkcí je metoda pasivního poslechu UDP paketů. Watchdog poslouchá UDP pakety v síti a pokud se do stanovené doby žádný v síti nevyskytne, je tento stav vyhodnocen také jako závada. Pro vysílání UDP paketů lze použít nabízený UDP vysílač. Použití pasivního poslechu UDP paketů je velkou výhodou, pokud chceme monitorovat ethernetovou síť, ve které se nachází velké množství switchů bez vlastních IP adres. (Na běžný switch totiž nelze Pingat.) Jediný tento vysílač roznese pomocí broadcastu UDP pakety do celé sítě až k Watchdogu. Pokud topologie sítě využívá sériové zapojení switchů (např. propojení několika vchodů v panelovém domě), pak stačí aby Watchdog byl na jednom konci a UDP vysílač na druhém. Máme tak pod kontrolou celou trasu.
Schéma šíření UDP paketů sítí směrem k Watchdogu
Samozřejmostí je, že všechny závady jsou ukládány do Logu s datumem a časem, kdy vznikly. Dále si všechny tyto události můžeme posílat na e-mail. Tuto funkci můžeme obohatit přeposíláním takového varovného e-mailu na mobil.
Celé zařízení má krom standardních funkcí také mnoho novinek oproti podobným výrobkům. Jednou takovou novinkou je kontrola přítomnosti napětí v síti 230V. Napětí z el. zásuvky přivedeme na svorkovnici Watchdogu. Pokud napětí zmizí (nejpravděpodobněji výpadkem energetické sítě ČEZ), Watchdog nám pošle e-mail. Získáme tak včas informaci o tom, že serverovna běží na záložní baterie. Další novinkou je teplotní čidlo uvnitř zařízení. Díky němu můžeme mít neustálí přehled o okolní teplotě. Ve Watchdou lze nastavit horní a dolní teplotu, při které má odeslat varovný e-mail. Tuto funkci ocení ti, jenž žijí v neustálém strachu, že se jim jejich router na střeše uvaří nebo naopak zamrzne. Možná to na první pohled není patrné, ale graf naměřené teploty nám spolu s jiným grafem může odhalit také zdroj častých závad.
Jak jsem již naznačil, všechny události, stavy a aktuální hodnoty, lze z Watchdogu vyčítat a dále zpracovávat v Dohledovém centru. V tomto směru tvůrci opět přináší novátorské řešení. Watchdog totiž není vybaven SNMP serverem, který je nahrazen XML výstupem. Toto řešení přineslo menší zátěž procesoru a menší nároky na paměť Watchdogu. XML výstup má neocenitelnou výhodu také při zpracování vyčítaných dat, grafování a zobrazování stavů ve vlastním Dohledovém software. Data lze snadno vyčítat pomocí CGI Skriptů, Javy, PHP, ASP a dalšími interneprety. Výrobce dále uvádí, že implementace do hojně užívaných dohledového nástrojů MRTG, CACTI či NAGIOS je velmi snadná.
Ukázka XML výstupu, který nahrazuje SMNP server.
Bude mít tento výrobek z české produkce úspěch i u Vás? Zařízení si lze u výrobce zapůjčit, takže nebrání nic tomu, abyste si jej osahali také vy.
Bližší informace o tomto výrobku naleznete na stránkách http://www.ipwatchdog.eu .
Autor Martin Sobotík je provozovatelem sítě Opavský Bezdrát.
Diskuze k článku
David, 31. 12. 2008 (03:50):
Zařízení je dle popisu velice zajímavé, i článek je napsán hezky. Sami bychom v síti potřebovali mnoho takovýchto zařízení, protože, pokud opravdu bezproblémů zvládají vše co je popsáno, je to hodně šikovné a chlapci si určitě dost pohráli. Ovšem asi nepoužijeme ani jedno, jelikož cena je opravdu vysoká. Možná cena časem půjde dolů, ale to než se stane, tak zde bude mnoho jiných výrobců stejných zařízení, a za poloviční ceny, a jejich výrobky se budou lépe prodávat, i kdyby méně chytřejší, ale dnes ta cena dělá opravdu své.
Karel Řeřicha, 14. 12. 2008 (22:16):
Ano, asi jsme se nepochopili. Mluvím o případu, kde ICMP pakety páteří procházejí, tj. IP watchdog nedetekuje problém, nicméně sledované zařízení na cestě nepracuje správně, nedostanete se na něj a nedostanete se ani na www rozhraní watchdogu, takže stejně nasedáte do auta a jedete. Není to možná typický příklad, ale chci na tom demonstrovat, že GSM watchdog má oproti IP watchdogu v tomhle zcela zásadní výhodu, a to v přístupu přes jiné médium. Netuším, proč to není uváděno v nevýhodách. Dále je velmi sporné to, že ve výhodách IP watchdogu je uváděna automatická funkce a u GSM watchdogu funkce manuální v nevýhodách. U obojího bych spíše mluvil o vlastnostech než o výhodách či nevýhodách, každá varianta je vhodná na různé použití. Jinak stále tvrdím, že je to pěkný článek, škoda jen toho mírného možná nevědomého zkreslení. Celkově dobrá práce, díky.
DarkLogic, 14. 12. 2008 (10:25):
Ach jo, Vy to pořád nechápete. Nejde o Váš konkrétní watchdog, ale o to, že se bez upozornění mezi jakžtakž seriózními články najednou objeví reklamní. Nezlobte se na mě, ale když je půlka článku jen popis vlastností jednoho konkrétního produktu a předcházející část článku jen vtáhnutí do úvahy, proč je nakonec ip watchdog zrovna to pravé, tak co to může být?
Jinak když si tak říkáte o ty nevýhody? – co třeba cena, která je leckdy vyšší, než cena samotného hlídaného zařízení?
A další věc – má vůbec tento Váš watchdog potřebné certifikáty pro používání v ČR?
M. Sobotík, 13. 12. 2008 (17:46):
Ještě mi to neda, takže doplním:
Watchdogy fungují samostatně a netřeba je ručně ovládat. Když ho nasadíme tak, aby monitoroval páteř, pak sám pozná, že neběží a páteřní spoje vypne a zapne. Jak název článku napovídá, jeho využití je zejména tam, kde stačí jen vypnout a zapnout a je vhodným doplňkem pro dohled, který hlídá chod sítě. Pokud ale páteřní spoj padá z jiného důvodu, je jasné, že watchdog nepomůže.
M. Sobotík, 13. 12. 2008 (17:33):
No, myslím si, že jste správně nepochopil jeho využití.
M. Sobotík, 13. 12. 2008 (17:31):
Sám za sebe mohu říct, že jsem v článku nepsal o tom, že je to jediný výrobek. Naopak jsem zdůraznil, že jich je více. Článek se zabývá něčím, co se děje a nabízí hned několik řešení. Obecné nevýhody IP watchdogu opravdu neznám. Jsou navrženy tak, aby problém řešili a jejich konstrukce nedovoluje samočinné zastavení.
Ale je zajímavé zmínit na jaké nevýhody jste přišli. Sem s nimi a nestyďte se 🙂
DarkLogic, 12. 12. 2008 (18:15):
..mělo se jednat o příspěvek reagující na p. Sovu.
DarkLogic, 12. 12. 2008 (18:14):
Taky je odkazovaný článek řádně označen: "Lupa.cz » Rubriky » PR článek » Novinky v nabídce Forpsi". To se o tomto článku říct nedá. Ať se takové články klidně objeví, ale _označit_ je by bylo fajn!
Jinak běžně nejsem ten typ čtenáře, který po přečtení článku hned zkoumá detaily. Ale na tomhle článku mi prostě bylo něco podzřelé, když se pak pořád mluví o jednom typu, neznají se jeho nevýhody apod. Takže ano, je to PR, jinak by mi to prostě nemohlo přijít tak nápadné a vůbec bych se nad tím nepozastavil. Nevím, jaký je problém taký článek označit. To se bojíte, že to pak nikdo nebude číst?
Karel Řeřicha, 12. 12. 2008 (17:04):
Zcela zásadní nevýhoda IP watchdogu je tak, že když se na něj nedostanete, tak vám nic nezresetuje. Tj. když vám vytuhne páteř k watchdogu, tak je vám na nic. To by tam mělo být jasně uvedeno. Stejně tak jako to, že je to PR článek Mílo. Bez diskuzí. Jinak samozřejmě IP watchdog je dobrá věc a článek je celkem fajn.
M. Sobotík, 9. 12. 2008 (13:56):
Pokud používáte ve Vaši síti NAT, pak opravdu volte dobře, kde jej zapojíte. Když se stane, že jedna strana NATu odpadne a vy se na Watchdog nedostanete, pak je jistě vhodné zapojit jedno relé právě na router s NATem, který může odpadnout. V kombinaci s PINGem na tento router je toto přímo učebnicové použití 🙂 Přestane-li Router na PINg odpovídat, Watchdog sám pomocí relé provede reboot tohoto Routeru.
M. Sobotík, 9. 12. 2008 (13:47):
Tento Watchdog je vybaven mnoha bezpečnostními prvky, aby k jeho zatuhnutí nedocházelo. Pokud by však k takovému stavu docházelo, rádi provedeme potřebné úpravy jak na straně firmware, tak na straně hardware.
Miloslav Sova, 9. 12. 2008 (09:40):
Dobrý den,
soudnosti mám po těch 6 letech existence serveru Internetprovsechny.cz doufám pořád dost. O tom jestli se jedná o PR článek nebo ne, bychom mohli dlouho polemizovat. Jukněte třeba sem http://www.lupa.cz/clanky/novinky-v-nabidce-forpsi/ to je klasické PR. Mě toto téma připadalo dostatečně zajímavé a osobně jsem pana Sobotíka poprosil jestli by nebyl ochoten něco napsat (takže nepřišel a neřekl "heleďte se pane Sova já vyrábím taková udělátka já vám o tom něco napíšu). Navíc jsem na podzimní konferenci IPV majitele sítí přímo vyzval, aby se podělili o své zkušenosti a zlepšováky formou článků na našem webu. Takže, až budete mít někdy příště něco zajímavého vy, a bude to přínosem i pro ostatní lokalní poskytovatele internetu rádi si od vás něco přečteme. Hezký den přeje Sova
loser, 9. 12. 2008 (08:02):
Ja bych to az tak jako reklamu nevidel. Clanek je urcite zajimavy.
Jen presne nevim, kam IP Watchdog zapojit. Asi bych jej dal za branu (router) privadejici konektivitu – ale co kdyz se kousne prave tato brana a ja se zvenci na IP Watchdog nedostanu a nesrestartuji ho? To si myslim, ze je prave nevyhoda (ted jiz znama 🙂
DarkLogic, 9. 12. 2008 (05:44):
"Martin Sobotík je provozovatelem sítě Opavský Bezdrát"…a Opavský Bezdrát je výrobcem IP watchdogu, o kterém se mluví od půlky článku až do konce.
To provozovatel tohoto webu nemá soudnost, aby aspoň označil tento článek jako reklamní? A není to prvně, co se podobné reklamní články bez označení tady vyskytují!
Btw. nevýhody IP watchdogu nezjištěné? – a co třeba, že se sám může "kousnout"?