Sí. Usamos un par de cookies, y una ni siquiera es nuestra. Deberá aceptarlas para evitar este mensaje que mostramos por imperativo legal

“Cómo combatir la fuga de datos y el robo de clientes on line”, noticia en Interdixit

Diseño + Desarrollo. Multimedia. Web. Comunicación. Grafismo. Arte

Noticia: “Cómo combatir la fuga de datos y el robo de clientes on line” de la sección Tendencias

Cómo combatir la fuga de datos y el robo de clientes on line

El 75% de los sitios más populares de Internet captan para terceros las preferencias y otros datos personales de sus usuarios sin que estos lo adviertan, según el último informe sobre privacidad en la Red encargado por el Wall Street Journal. La fuga de datos afecta también a los sitios visitados en la misma sesión de navegación y puede servir para robar clientes on line.

El estudio anual de Wall Street Journal, encargado a BuiltWith, indica que las tres cuartas partes de una muestra de 1.000 sitios web más populares incluyen código de redes sociales como Facebook, Google+ o Twitter. Utilizado como una llamada META en el código fuente de la página y diseñado para alimentar el social graph de la red social, no es necesario siquiera activar botones de seguimiento en la red social, de preferencia (iLike) o realizar un comentario para que los datos de navegación se envíen automáticamente. De hecho, ni siquiera es necesario estar registrado y activo en ese momento en la red social para que ésta reciba los datos de la experiencia de navegación.

El informe recoge también la distribución a terceros de datos que captan los sitios de la muestra. 70 de ellos captaban un nombre de usuario y la cuarta parte de ellos lo comparten con otras empresas, junto al nombre real del usuario y la dirección de correo electrónico, además de otros datos.

Destaca el sitio de búsqueda de pareja OKCupid, que compartía con terceros la orientación sexual de sus miembros, sus hábitos de consumo de drogas reconocidos, el nombre de usuario, género, edad y código postal. Estos datos los facilitaba a seis empresas distintas.

Una docena de los sitios analizados enviaron información a terceros que permitía identificar sin problemas a los usuarios por su correo electrónico o nombre de usuario. De un grupo de 20 sitios que manejan información sensible como datos médicos de sus usuarios o de menores d edad, se detectó que 9 enviaban esta información a otras empresas, generalmente distribuidoras de publicidad.

De la censura del informe tampoco se libra el propio Wall Street Journal, que comparte con tres empresas ajenas direcciones de correo electrónico y nombres de usuario de sus clientes. En este caso, la administración del periódico neoyorquino ha expresado su voluntad de controlar este comportamiento anómalo.

En esta misma página se puede descargar un archivo PDF que reproduce las conclusiones principales del informe, indicando el tipo de información directa compartida y el sitio de Internet que lo hace.

Conocer el mecanismo para solucionarlo
Además de la información directa que solicitan los portales de Internet a sus usuarios y con la que comercian, estos disponen de otra información muy valiosa correspondiente a los referrers (el origen del acceso) y, en muchas ocasiones, a las puertas de salida (las páginas de destino fuera del website).

Por lo tanto, saben de qué competidor y de qué producto se llega, qué se visita en sitio propio y hacia dónde se va al salir, lo que permite tener una ruta de navegación comparativa en el caso de intención de compra.

Las redes sociales, por su parte, pueden captar sin que nadie lo advierta esta información para su propio uso. Cuando se instala cualquier widget con programación propia de la red social en la página web (botones de seguimiento, de recomendación, casillas de comentarios…) se está abriendo la puerta para que la red social registre todos los datos de navegación, interna y externa, de los usuarios.

Es más, cuando se utiliza un CMS como WordPress, aunque no se utilicen widgets externos, el código de Facebook está ya pre-programado como un META open graph, de modo que, sin que el bloguero lo sepa, todos los datos de sus visitantes acaban en manos de la red social: qué productos o servicios les interesan, su edad aproximada, su localización geográfica, el dispositivo con el que navegan, los horarios, las compras realizadas, los precios consultados, los comentarios recibidos desde sus amistades en la red social, etcétera.

Toda esta información es valiosísima para un competidor comercial, que podrá ajustar su oferta en precio y calidad, enfocando los mensajes al perfil de público que busca estos productos en el website propio.

La fuga de los datos se produce, por lo tanto, en bloques de tres dominios de navegación consecutiva: el anterior, el que dispone de la programación que saquea los datos y el posterior. Si dos de los dominios tienen la misma programación de captación, el bloque afectado será, como mínimo, de cuatro dominios distintos en una sesión de navegación.

Si, en cambio, en la sesión se produce una navegación consecutiva de dos dominos que no saqueen la información, el continuo de interés se habrá roto para la red social —siempre y cuando el usuario no esté registrado y activo en la red social, ya que ésta tomará los datos directamente—.

La forma de evitar la fuga consiste en la eliminación, siempre que sea posible, de la programación javascript facilitada por las redes sociales para sus botones. Aunque resulte muy cómoda para los administradores de sistemas.

Salvo en casos de bloques de comentarios de la red o listas de seguidores, que aportan poco a la calidad y contenido del website, los botones de seguimiento y recomendación no dejan de ser enlaces con variables o enlaces que llaman a una aplicación javascript externa que sólo se activa a petición. Son fáciles de programar y limpios.

Además, es recomendable eliminar el código META que por defecto puedan incorporar los blogs y que sólo sirve como punto de enganche de las cookies que se hayan instalado en las páginas de los usuarios.

Crecimiento imparable del código que sustrae los datos
El Instituto Politécnico de Worcester realizó una investigación sobre 100 sitios de internet populares, descubriendo que el 56% disponian de programación que pasaba los datos de usuarios a terceras empresas. Según este estudio, el código de Facebook se encontró en un 67% de los websites, con un crecimiento desde el 63% el año anterior. Twitter se encontró en un 54% de los sitios y Google+ en el 30%, con un incremento de 18 puntos respecto al año 2011.