Open source řešení WebXray pomáhá chránit veřejné weby

webXray open source

V únoru zveřejnilo britské Centrum pro etiku a inovace dat (CDEI) zprávu o online cílení a postupech sledování reklam na veřejných webových stránkách. K tomuto tématu bylo provedeno několik dalších studií a většina z nich používala webXray s otevřeným zdrojovým kódem ke shromažďování údajů a provádění analýzy na úrovni souladu webových stránek s platnou regulací ochrany údajů.

Zpráva CDEI s názvem „Přezkum online cílení: Závěrečná zpráva a doporučení“ byla zveřejněna po vydání několika studií o reklamě třetích stran na webových stránkách britské místní rady BBC, prohlížeče Brave a společnosti ePrivacy Cookiebot. Tyto studie zdůraznily přítomnost reklam třetích stran a sledovačů reklamy. Cookiebot například zjistil, že 52% webových stránek veřejných zdravotnických služeb EU obsahuje komerční sledovače. BBC Shared Data Unit analyzovala během dvou dnů stránky více než 400 místních rad a zjistila, že webové stránky místních rad Spojeného království obsahují více než 950 souborů cookie a zdá se, že více než dvě třetiny rad nevyžadují správnou formu souhlasu podle zákonů na ochranu soukromí.

BBC, Brave a Cookiebot použili pro analýzu dat studie open source software webXray pro analýzu reklamy třetích stran na veřejných webových stránkách. WebXray je software s otevřeným zdrojovým kódem pro analýzu obsahu třetích stran na webových stránkách a identifikaci společností, které shromažďují uživatelská data. Software je přístupný neprogramátorům díky uživatelskému rozhraní příkazového řádku. WebXray je profesionální nástroj určený pro akademický výzkum, pracovníky v oblasti ochrany osobních údajů, regulátory a uživatele, kteří jsou zvědaví na skryté toky dat na webu.

Díky webXray mohou uživatelé přistupovat k sestavám s následujícími informacemi: průměrný počet třetích stran a soubory cookie na webové stránce, nejčastěji se vyskytující domény a prvky třetích stran, objemy přenesených dat, použití šifrování SSL. WebXray používá vlastní knihovnu vlastnictví domény k identifikaci původu toku dat z dané domény třetí strany k vlastníkovi společnosti a případně k mateřským společnostem. Schéma dat použitá pro vlastní knihovnu vlastnictví domény je flexibilní a umožňuje generování vlastních přehledů i rozšíření o autorizaci pro přidání dalších zdrojů dat.

Veřejná verze webXray používá Chrome k načítání stránek a ukládání dat do databáze SQLite. Software s otevřeným zdrojovým kódem byl vyvinut pomocí Pythonu a je nyní k dispozici na GitHubu pod licencí General Public License 3.0.

Obce a vlastníci veřejných webových stránek mohou pomocí webXray zkontrolovat, zda dodržují platné právní předpisy EU, obecné nařízení o ochraně údajů (GDPR), a snadno sledovat, které společnosti používají na své platformě procesy reklamy a sledování reklam třetích stran.

Na základě těchto zjištění vydal britský CDEI ve své zprávě tato doporučení:

  • Regulátor poškození online by měl vyžadovat, aby poskytoval regulační dohled nad cílením;
  • Návrh kódu pro použití online cílení ve veřejném sektoru;
  • Měly by být vyžadovány platformy pro hostování veřejně přístupných archivů pro online politickou reklamu, „příležitostnou“ reklamu (zaměstnání, úvěr a bydlení) a reklamu na produkty s omezeným věkem;
  • Nařízení by mělo povzbudit platformy, aby uživatelům poskytovaly více informací a kontrolu; „Zprostředkovatelé dat“ by mohli zlepšit správu dat a obnovit rovnováhu mezi uživateli.

Zdroj: https://joinup.ec.europa.eu