международный информационный проект "РУССКИЙ ДИАЛОГ"
Внимание! "Русский Диалог" изменил адрес. Теперь к ссылке rus-dialog.com добавляем ACTIVEBOARD, получается Rus-Dialog.Activeboard.Com. Постепенно на форуме все ссылки относящиеся к Rus-Dialog.com и Sobesednitsa.Activeboard.com будут заменены на Rus-Dialog.Activeboard.Com
По каким параметрам можно идентифицировать пользователя в интернете.
В основе идентификации пользователя в Интернете лежат его действия, без которых статистическая система не знает, подключен он сейчас к Сети или нет. На данный момент подавляющее большинство систем учета пользователей учитывают только запросы на загрузку web-страниц (то есть запросы по протоколу HTTP), таким образом, посещения Сети только для просмотра текущей корреспонденции (протоколы POP3i, IMAPi) или загрузки файлов через протокол FTP остаются неучтенными. Каждое действие описывается рядом параметров, которые можно зафиксировать. Это: -некоторые передаваемые серверу характеристики браузера (тип, язык, встроенные расширения, поддержка приложений), -IP-адрес, -данные прокси-сервера, -поддержка cookie и Java, -часовой пояс, -и др. Все эти параметры передаются серверу при запросе страницы или могут быть получены через специальный Java-код. На основе полученных исходных данных можно с некоторой точностью идентифицировать пользователя. Погрешность идентификации, основанной на IP-адресе (до недавнего времени учет был основным методом идентификации), складывается из погрешностей передачи и погрешностей пользования компьютером. Так, например, при работе пользователей через прокси-сервер вся подсеть, которая за ним скрывается, в большинстве случаев будет иметь единый IP-адрес. С другой стороны, работая через коммутируемое соединение, пользователь при каждом подключении будет получать от провайдера новый IP-адрес и т. д. В России, где выделенные каналы для домашних пользователей являются большой редкостью, погрешность идентификации по одному IP-адресу очень высока: в среднем до 40% пользователей не могут быть идентифицированы таким способом. Для более точной идентификации еще в начале 90-х годов начали применять так называемые - небольшие файлы, записываемые на компьютер пользователя при заходе на сайт. В этих файлах содержится некоторая ключевая информация (например, уникальный идентификационный номер, присваиваемый пользователю сайта) в специальном формате. При последующем заходе на сайт записанная ранее информация считывается и именно таким способом пользователь идентифицируется. Погрешности этого метода заметно ниже, так как они идентифицируют не IP-адрес, который в большинстве случаев выдается динамически из пула, а конкретный компьютер. Тем не менее остаются проблемы совместного использования компьютеров, а также идентификация тех пользователей, которые используют различные компьютеры для подключения к Сети (например, дома и на работе, и в интернет-кафе и т. д.). Вышеописанные погрешности частично компенсируются существующей в ОС Windows возможностью заведения на одном компьютере нескольких профилей с различными настройками Интернета, так как в этом случае cookies пишутся для каждого пользователя отдельно. Для компенсации погрешностей идентификации, возникающих из-за удаления или отказа в приеме cookies, используется интегральная идентификация одновременно по нескольким параметрам. Совместно с cookies используют IP-адреса и некоторые параметры браузера, которые передаются в HTTP-запросе. Например, если у пользователя отключены cookies, но мы хотим его идентифицировать в пределах сеанса, то запоминается IP-адрес и настройки компьютера - разрешение монитора, количество цветов, версия браузера и т. п. - поэтому можно достигнуть очень высокой степени идентификации. Указанная схема имеет смысл только в пределах сеанса (здесь сеанс - это одно непрерывное подключение пользователя например гость ), для долговременного мониторинга ее использовать нельзя, так как эти настройки изменяются. Следует особо отметить, что при любой схеме идентификации статистическая система не имеет персональных данных пользователя, если он не пожелает их специально сообщить. Таким образом, не может идти и речи о нарушении какой бы то ни было приватности - все данные собираются в обезличенном виде. По полученным исходным данным можно получить вторичные отчеты путем группировки нескольких полученных параметров. Так, например, располагая данными о часовом поясе и IP-адресе, а также сеткой распределения IP-адресов между интернет-провайдерами, можно получить данные о географии пользователя с точностью до города или области. По этим же данным, а также по времени соединения можно вычислить место соединения (дома, на работе, в интернет кафэ и пр.). Анализируя статистику за продолжительный период времени, можно отделить пользователей мобильных компьютеров, которые подключаются через разных провайдеров и из разных типов подсетей, от стационарных. При наличии на странице специального раздельного кода, реализованного в системе SpyLOG, можно получить данные о скорости загрузки страницы, а следовательно, и о скорости соединения.