Данните, които рутинно се събират в Web логовете - IP адрес, ID на „бисквитката", операционната система, тип на браузъра и други – могат да заплашат онлайн поверителността, тъй като могат да бъдат използвани за разпознаване на дейността на отделните машини, заявиха изследователи от Microsoft.
В същото време анализите на такива данни, ако са анонимни, могат да помогнат да се засече зловредна дейност и така да се подобри цялостната сигурност на Интернет, казват те.
Изследователите са открили, че през 62% от времето HTTP информацията за помощната програма (агента) на потребителя може точно да посочи хост машината. Ако се комбинира тази информация с IP адреса точността може да достигне до 80,6%. Ако информацията за агента на потребителя се съчетае само с IP префикса, то точността остава висока – 79,3%.
По-високата точност се постига, когато повече от един идентификатор (ID) на потребител се свърже към една хост машина, което се случва, когато семейството споделя един единствен компютър. В такива случаи многобройните идентификатори биха определили изключително точно този хост компютър, като нивото на прецизност достига 92,8%.
Анализът на тази на пръв поглед плодородна информация е правен за един месец (август 2010) върху анонимни данни от Hotmail и Bing data за стотици милиони потребители. Изследователите казват, че са се опитали да открият дали едно парче от данните в лог файла може да разкрие категорично дадена хост машина.
Те открили, че дори от анонимните данни може да „изтича" информация. Например при замяна на IP адреса с неговия IP префикс все още остава достатъчно информация, която в комбинация с други общоприети фактори от логовете, може да разкрие потребителя.
Изследователите са ровили в данните, събирани от събития на ниво приложения, насочени към уеб сървъри в мрежите на Hotmail и Bing.
От Hotmail те са събрали сурови данни за операционната система и типа на браузъра, IP адреса на източника, времето за логване и анонимни потребителски ID идентификатори. От Bing та са взели анонимни HTTP поредици за потребителския агент, IP адреса на източника за търсенията, времето на търсене, анонимни ID на „бисквитките", издадени от Bing и датите на създаване на тези „бисквитки".
Изследователите са показали колко много подробности за идентифициращата информация могат да бъдат разкрити от масово използвани идентификатори. Те не са се опитвали да разкрият дейности на отделните личности, а да разберат мострите на обединените дейности и да проучат тяхното влияние.
Изследователите казват, че тяхната употреба на данни отговаря на правилата за поверителност на Microsoft и като част от тази политика данните не могат да бъдат предоставени на външни изследователи.
КОМЕНТАРИ
Стефана Здравкова, Logitech: Българските потребители са изключително информирани