Hlavní navigace

Jak vás budou na webu špehovat v novém desetiletí?

29. 10. 2010
Doba čtení: 7 minut

Sdílet

 Autor: 21971
Pro různé obory je velmi lákavé získat informace o tom, jak se chovají jiní lidé. Zajímá to nejen sociology a psychology z teoretického hlediska, ale zajímá to i tajné služby a policii, a rovněž to zajímá obchodníky. Na webu mají mnoho možností, jak vás sledovat. Mažete cookies, vypínáte javascript a myslíte si, že je všechny znáte? Nové metody jsou velmi odolné!

Myšlenka sledovat chování a pohyb lidí je tak stará jako civilizace sama. Dnešní technika k tomu dává téměř neuvěřitelné nástroje a možnosti – a to nemluvíme o populárních „kamerových systémech“ či „sledování polohy mobilních telefonů“. Většina uživatelů Internetu ví, nebo alespoň tuší, že jejich pohyb po této síti sítí není anonymní, že za sebou nechávají stopu. Někteří, ti poučenější, vědí i o metodách, které se ke sledování používají nejčastěji: IP a cookies. Myslíte si, že když použijete anonymizér a zakážete cookies, že máte vyhráno?

Velká sledovací trojka

Při sledování uživatelského chování není až tak důležité vědět, že osoba 1 je Pepa Novák a osoba 2 je Franta Dvořák, ale je důležité, aby se na různých webech objevila osoba A jako osoba A, nikoli jako B. Stačí vědět, že člověk, který přišel na náš web, přišel z webu XYZ a předtím byl šestkrát na webu PQR. K tomu potřebujeme jen nějaký „štítek“ s kódem, který dotyčnému připneme…

Ve skutečnosti nesledujeme konkrétního člověka, ale konkrétní prohlížeč, což je dostatečná aproximace a fakt, že jeden člověk se nám jeví jako dva různí (jeden v práci, jeden doma), není rozhodující.

Nejznámější „cejchovadla“ jsou IP adresa a cookie. IP adresy ve verzi IPv4 pomalu docházejí, navíc s funkcemi jako NAT nejsou tak spolehlivé – jednu IP tak sdílí třeba celý úřad s několika tisíci lidmi. Ale pro hrubou představu IP samosebou postačí, navíc s IPv6 bude možné dát každému zařízení jeho vlastní IP, čímž význam IP pro sledování opět o něco vzroste.

Cookies jsou informace, které si server ukládá do vašeho prohlížeče s HTTP odpověďmi, a které váš prohlížeč posílá serveru s požadavky zpět. V těchto cookies mohou být uloženy informace pro uživatele potřebné a užitečné (například po přihlášení na nějakou stránku si do cookie servery běžně ukládají informace o přihlášení), ale i některé ne zcela nevinné, jejichž účelem je monitorovat uživatelův pohyb. S oblibou takové cookies používají například reklamní sítě či jiné velké weby, jejichž kód je vložen lege artis do cizích stránek – počítadla, „like tlačítka“ apod.

IP a cookies zná snad každý poučený uživatel. Poslední do trojice nejobvyklejších sledovacích metod jsou Local Shared Object, které lze poměrně přesně popsat jako „cookies pro Flash“. Vzhledem k penetraci Flashe, která přesahuje 90 % prohlížečů, je to téměř spolehlivě použitelná metoda, srovnatelná s cookies, ale s tou výhodou (či nevýhodou), že uložená data nejsou vidět přímo v prohlížeči a běžný uživatel neví, jak se jich zbavit a jak je zakázat. Více o LSO píše Dan Dočekal v článku Flash Cookies – vlezlé, obtížně smazatelné a masově zneužívané a přidává i návod, jak je smazat a zakázat.

Než vznikne flamewar na téma „Flash je virus a bezpečnostní riziko, já vám to vždycky říkal“, tak si řekněme, že Flash v tom není rozhodně sám, že Silverlight má něco podobného, a že ve srovnání s dalšími metodami, které si představíme, jsou Flash cookies poměrně nevinnou hříčkou.

Panopticlick

Se zajímavým nápadem identifikace přišla služba Panopticlick, která demonstruje, jak lze identifikovat prohlížeč i bez použití cookies. Přesný popis metody vyšel na Rootu v článku Váš prohlížeč je identifikovatelný i bez cookies. Zjednodušeně řečeno využívá toho, že lidé si své prohlížeče upravují k obrazu svému pomocí rozšíření a různých nastavení. Využívá informace nejen o prohlížeči a jeho verzi (známý user-agent řetězec), ale i např. o nastavení kompresních metod, o předvolbách jazyků (to vše posílá prohlížeč s každým HTTP dotazem), o instalovaných pluginech, o verzi Flashe, o rozlišení obrazovky atd. a z nich seskládá jakýsi „otisk prstu“ vašeho prohlížeče, který je do jisté míry unikátní (do jaké míry je unikátní ten váš, si můžete zkusit na výše uvedeném odkazu – dozvíte se, kolik lidí má stejnou konfiguraci prohlížeče jako vy).

„Otisk prohlížeče“ má omezení – stačí přeinstalovat novou verzi, změnit rozšíření, updatovat FLASH, změnit monitor – a změní se i otisk. Ale takové změny se neodehrávají každý den, takže jako podpůrná identifikační metoda je to rozhodně užitečné. Navíc identifikace zůstává stejná, i když použijete např. TOR.

Panopticlick

Z více než milionu „stejných“ prohlížečů považuje panopticlick právě tento za unikátní. Byli jste identifikováni.

A to není vše…

Téměř neskutečnou sbírku možných míst, kam si může v prohlížeči sledovací software uložit svá data, nabízí knihovna Evercookie. Autor ji nazývá „téměř nesmazatelnou cookie“ a používá kombinaci několika možných míst, kam si lze údaje uložit. Ukládání si tedy „diverzifikuje“ a s poměrně vysokou pravděpodobností ví, že někde přežijí i poměrně rafinované „mazání osobních údajů“. Posuďte sami:

Kromě zmíněného ukládání dat v cookies, Flash cookies a Silverlight cookies si může uložit data ve Web Storage, což jsou úložiště dat pro webové aplikace (LocalStorage, GlobalStorage, SessionStorage). Smazat je možno v nastavení prohlížeče – pokud víte, že něco takového vůbec existuje (je to poměrně nová technologie). MS Internet Explorer sice WebStorages neoplývá, ale nabízí další úložiště s názvem userData.

Některé prohlížeče (Chrome, Safari, Opera) mají i cosi, co se nazývá Web SQL Database – ano, je to SQL databáze v prohlížeči. Tam si může skript vytvořit databázi s tabulkami a do ní ukládat, co hrdlo ráčí; pokud se bude držet zpátky a uložená data nepřekročí cca 5 MB, tak se o tom uživatel ani nedozví. Smazat je možno v Chrome např. z vývojářské konzoly.

Data lze uložit pomocí JavaScriptu i do window.name, což je informace svázaná s oknem prohlížeče. Lze je uložit do cache prohlížeče, lze si je poznamenat i do HTTP atributu ETag. Ke špehování lze použít i historii prohlížeče (odkazy na už navštívené stránky se vykreslují jinou barvou, lze tedy zjistit, zda jste na určité stránce byli nebo ne).

Téměř kuriózní je ukládání dat do PNG obrázku, který je vložen někam do HTML stránky a je poslán s příznakem „cachujte na 20 let“. V tomto obrázku jsou v RGB složkách uloženy potřebné údaje – např. v posledním bitu každé barevné složky. Takto „steganograficky“ uložená informace může být použita k rekonstrukci dat v případě smazání všech možných cookies, a to celkem jednoduše JavaScriptem a HTML elementem Canvas, pomocí něhož má skript přístup k jednotlivým pixelům.

Evercookie

Autor konceptu Evercookie si vyhraje. Jak ještě do prohlížeče uložit vaši identitu? Vždycky se ještě něco najde…

Jak se sledování bránit?

Existuje jediný spolehlivý způsob, jak se sledování na Internetu ubránit: Najděte si místo, kde je do vašeho počítače či WiFi routeru zapojen síťový kabel. Vytáhněte jej, pevně uchopte, natáhněte co to jde a trhnutím jej vyrvěte ze zdi i s tou krabičkou, co do ní vedou dráty. Pak na to místo položte svůj notebook, přidejte mobilní telefon, polijte benzínem, zapalte a odejděte do hlubokých lesů, oblečeni pouze do jutového pytle. (Bohužel, i zde hrozí nakonec riziko, že vás někdo najde a vysvětlí vám, že sledování je pro vaše dobro: pro vyšší bezpečnost země, pro šťastné děti bez zvrhlíků a pro lepší požitek z nakupování.)

Pokud toto řešení u vás nepřipadá v úvahu, musíte se smířit s tím, že můžete být sledováni tak rafinovanými způsoby, že se vám o nich ani nezdá, natož abyste věděli, jak se jim ubránit. Útěchou vám budiž vědomí, že dokud nebude chtít někdo sledovat přímo vás osobně, budete jen položka ve statistikách „uživatelského chování“.

A teď seriózněji: Můžete pravidelně mazat cookies, historii prohlížeče, cache, zakázat JavaScript, Flash, Javu a pluginy vůbec, zakázat stahování obrázků, používat TOR a nastavit si prohlížeč tak, aby se tvářil jako ten nejběžnější na trhu. Váš prohlížeč tak bude schopnostmi odpovídat zhruba roku 1994 – sice bude odolný snad proti všem popsaným špehovacím metodám, ale bude nepoužitelný na cokoli jiného než pročítání telefonního seznamu.

Pokud chcete mít prohlížeč použitelný i na dnešní aplikace, budete jej muset dovybavit pomocí doplňků, které dovedou nežádoucí činnosti omezit. Nebudeme si jmenovat konkrétní doplňky, spíš rámcově: Hodí se vám doplněk NoScript, který umožní běh JavaScriptu pouze na stránkách a doménách, které výslovně povolíte (whitelist). Kromě jiného dokáže detekovat i běžné útoky typu Clickjacking, takže by měl mít své místo v prohlížeči každého poučeného uživatele. Oceníte i doplněk, který nahradí Flash na stránce ikonou a spustí ho až v okamžiku, kdy o to požádáte (např. kliknutím). Bude se vám hodit doplněk, který zná nejčastější sledovací cookies a dokáže je rychle smazat, aniž by přitom vyhodil ty užitečné. Totéž pro různá úložiště.

BRAND24

Otázka bezpečnostního rizika není černobílá a nelze říct: Toto je riziko, toto není. Hovoříme vždy o přijatelném či nepřijatelném riziku s ohledem na osobní přínos. Například pravděpodobnost autonehody je poměrně vysoká, ale toto riziko je pro většinu z nás akceptovatelné, protože výhody dopravy autem převažují. Takový postoj je důležité zaujmout i v otázce sledování na Internetu – tedy uvědomit si, jaké riziko je pro nás přijatelné a jaké ne, a tomu přizpůsobit své chování a používané nástroje.

Pravděpodobně nejzávažnějším bezpečnostním rizikem ale zůstává víra, že „když zakážu cookies, smažu historii a použiju proxy, tak jsem anonymní“. Pokud si uvědomíte, že tomu tak není, je to lepší bezpečnostní opatření než pět firewallů.

Používáte pluginy do prohlížeče na filtrování sledovacích cookies?

Byl pro vás článek přínosný?

Autor článku

Sleduje, popularizuje a učí moderní webové technologie (HTML5 a podobné). Popularizuje nové nástroje a elektroniku, provozuje weby, sleduje dění na internetu, píše o něm a komentuje ho.

Upozorníme vás na články, které by vám neměly uniknout (maximálně 2x týdně).