Unidad 5
Unidad 5
Unidad 5
Offline
Para medir las audiencias en medios tradicionales (offline) como son por ejemplo la radio y la
televisión, comScore se basa en dos cosas: la instalación de audímetros y extrapolaciones
estadísticas.
Para conseguir esa información, comScore “recluta” a un grupo muestral de personas con
diferentes características (edad, sexo, situación geográfica, poder adquisitivo…). Se les instala un
aparato llamado audímetro o panel en sus televisores que registran todo lo que el usuario
visualiza.
A partir de ahí, se hace una estadística del número más o menos aproximado de personas que
sintonizó cada emisión en la televisión.
Online
Para la medición de audiencias en sitios web (online) hay una parte que es igual que la anterior:
comScore dispone de un muestral de alrededor 30.000 usuarios que han accedido a que les
instalen una especie de audímetro en sus ordenadores. Un pequeño software llamado cProxy que,
una vez instalado, registra todas las webs visitadas por el usuario.
La gran ventaja de comScore frente a sus competidores que solo usan datos muestrales, es que
dispone también de datos censales obtenidos a partir de quienes utilizan su herramienta de
analítica web, DAX (Digital Analytix).
Es la metodología híbrida del Unified Digital Measurement (UDM), la cual registra todos los
visitantes del sitio web y ayuda a entender el tamaño y calidad de su audiencia, y que en su día le
permitió ganar el concurso frente a sus competidores, Nielsen y Kantar Media.
Para obtener el dato unificado, recibe el tráfico censal reenviado a través del tag de Direct y,
después, descarta el tráfico no humano. Una vez obtenida la ratio de CPP (Cookies Per Person) por
país a partir de todos los datos obtenidos en todos los lugares en los que trabaja, realiza una
extrapolación de cuántos “individuos” representarían el número total de cookies generadas.
Para conseguir el dato definitivo, hay que sumar los panelistas de los que dispone del dato
muestral. Este sistema híbrido permite y facilita datos de usuarios únicos fundamentales para los
sitios webs y medios online que viven de la publicidad.
5.2.2 MÉTODO SITE CENTRIC
¿Qué son los Site Centric?
Los Site Centric son los datos de todas las visitas que recibe nuestra web. Con este tipo de métricas
no solo sabemos el número de visitas, sino también identificamos su comportamiento en el sitio
web; también nos permite armar pequeñas encuestas para conocer más a fondo al consumidor.
Para mucho, ya que estos datos son los pilares básicos de nuestra estrategia digital. A medida que
conocemos el comportamiento del consumidor en nuestras plataformas digitales, podremos crear un
contenido más atractivo para él, les doy un ejemplo: en la agencia donde trabajo llevamos la cuenta
de un Cinema. Hace un tiempo empezamos a variar el contenido y hacerlo más jocoso, así pues,
publicábamos memes representados por escenas de películas, ¿el resultado? El comportamiento del
consumidor hacia este tipo de contenido fue notorio (como era de esperarse) y sutilmente
empezamos a meter branding, acción que le ha caído de perlas para las arcas de nuestro cliente,
tomando en cuenta la situación país y todo.
Las dos aplicaciones más conocidas para medir estos dados son Google Analytics y Omniture.
5.3 FACEBOOK
Actualmente la plataforma de Facebook incluye:
Apache Thrift.
Thrift es un conjunto de herramientas y librerías software creadas por Facebook para acelerar el
desarrollo e implementación de servicios backend eficientes y escalables. El principal objetivo es
permitir comunicaciones eficientes y fiables a través de lenguajes de programación mediante la
abstracción de porciones de cada lenguaje en una librería común, específicamente Apache Thrift
permite a los desarrolladores definir los tipos de datos e interfaces de servicios en un archivo único
en lenguaje neutral y generar todo el código necesario para construir clientes RPC y servidores.
Actualmente Thrift soporta los siguientes lenguajes C++, Java, Python, PHP, Ruby, Erlang, Perl,
Haskell, C#, Cocoa, Smalltalk y OCaml. Facebook utiliza esta tecnología para su sistema de
búsqueda integrando así un backend desarrollado en C++ con un frontend escrito en PHP.
Facebook utilizo esta tecnología para utilizar las librerías de Java y que en PHP no existen, como
por ejemplo la librería para realizar el envío de SMS.
Apache Cassandra
Apache Cassandra es una Base de Datos no relacional, distribuida y basada en un modelo de
almacenamiento de Clave-Valor, escrita en Java, además de Facebook, sitios como Reddit y Twitter
también usan Cassandra, la usan para almacenar los datos de los usuarios de forma estructurada y
distribuida. Se dice que Cassandra pertenece a una segunda generación de bases de datos, a un
paradigma llamado NoSQL. Facebook hizo público el código de Cassandra al tiempo que lo entregó
a la comunidad Apache en el 2008, Facebook no podría escalar sin Cassandra.
Apache Hive
Este es un proyecto auspiciado por la Fundación Apache. Entre sus varias funcionalidades destaca
una que es fundamental para el funcionamiento de Facebook: el análisis de grandes conjuntos de
datos sobre los cuales es posible inquirir, buscar información en ellos, Facebook no podría ofrecer
su servicio de búsqueda sin Hive.
Scribe Server
Lo que hace Scribe es muy sencillo: es un sistema de distribución y registro de mensajes en los
servidores, es tolerante a fallas y capaz de funcionar sobre una gran cantidad de equipos, gracias a
Scribe Facebook logra gestionar con mayor facilidad y eficiencia sus miles de servidores.
Una gran cantidad de peticiones PHP impone un consumo excesivo de CPU, y en Facebook han
logrado solucionar el problema con este desarrollo en el que llevaban trabajando más de 3 años y
que permite convertir el código PHP en código C++, que luego se compila con g++ para obtener un
código objeto mucho más eficiente en consumo de recursos de lo que era el código PHP original, el
resultado es un software de igual funcionalidad, pero optimizado para un alto desempeño. De
hecho, Facebook afirma que gracias a HipHop para PHP usa hasta 50% menos CPU que antes,
Facebook sería más lento sin la ayuda de HipHop para PHP.
Protocolo XMPP
Extensible Messaging and Presence Protocol (XMPP) es un protocolo para comunicación en tiempo
real, la cual sirve de base para un amplio rango de aplicaciones, incluyendo mensajería instantánea,
información de presencia o también llamada “listas de contactos”, charlas con múltiples
participantes, voz, video llamadas, colaboración, sindicalización de contenidos y enrutamiento
generalizado de datos en XML.
El chat de Facebook y la integración con sistemas como Windows Live no sería posible sin XMPP
con DIGEST-MD5.
5.4 TWITTER
Tecnologías más importantes que usa Twitter en su infraestructura.
Twitter no sólo ha hecho uso de importantes tecnologías Open Source para sus propósitos, si no
que ha colaborado activamente con el desarrollo de algunas y la creación desde cero de algunos
framework que a muchos les sonarán. El constante ciclo de desarrollo de aprendizaje y desarrollo
con la comunidad es un beneficio mutuo. Su mayor reflejo lo podemos observar en la cuenta de
Github de Twitter en los más de 80 repositorios y 180 miembros que componen la mayor parte del
software libre utilizado por la plataforma.
MySQL usada principalmente para almacenar los Tweets. Ellos han desarrollado su propio
fork para ajustarlo a la necesidades, por supuesto, abierto a la comunidad. En él se ha
prestado especial atención en la optimización y en el rendimiento, claves para el servicio.
El abanico de proyectos Apache usados en su infraestructura y que nos estamos
acostumbrando en ver en las grandes redes sociales: Cassandra, Hadoop, Lucene, Pig. En
muchos de ellos Twitter los ha esponsorizado.
No podía faltar un clásico como Memcached para manejar la caché y escalar el creciente
tráfico de la plataforma. De ahí ha salido un interesante proyecto abierto que han liberado
recientemente, Twemcache, ajustando sus necesidades a la base de Memcached.
LAGO
Es un generador de carga para testear el tráfico en producción. Es un herramienta fundamental
para el entorno en el que se mueve Twitter con millones de peticiones en cortos espacios de
tiempo.
ZIPKIN
Ayuda a recolectar los tiempo de respuestas de las peticiones de la API de Twitter.
SCALDING
Es una librería de Scala que hace más sencillo escribir los jobs de MapReduce en Hadoop
integrándose perfectamente con la Scala y la JVM.
APACHE MESOS
Para construir aplicaciones distribuidas y compartir recursos entre data center.
No tan relacionada con la ifraestructura, pero si uno de los proyecto proveniente de Twitter
tenemos a Bootstrap que nos permite crear ágiles páginas HTML5 con componentes potentes.
CONCLUCIONES
5.2 Metodologías
Este se encarga más que nada en las estadísticas de marketing usan herramientas para monitorear
paginas para saber que es el contenido más relevante para el cliente, ellos planean estrategias
para tener la atención del público, tiene versión online y offline para hacer monitoreo,
dependiendo a que publico este dirigido
Al igual que comscore se usa para saber el comportamiento de las personas hacia un contenido en
específico y así tomar estrategias para hacer más llamativo el producto o servicio que brinda la
pagina
5.3 FACEBOOK
Facebook utiliza muchos lenguajes diferentes para elaborar sus aplicaciones haciendo así más
compatibles su plataforma al público, muchos piensan que Facebook usa solo php pero no es así
hay muchas bases de datos y servidores en los que puede estar su contenido siendo así menos pro
pensó a ataques informáticos.
5.4 TWITTER
En el caso de Twitter el lenguaje el cual se utiliza es Ruby, pero también se están manejando más
lenguajes de código abierto como es mysql entre otros, además también realizan más proyectos
que ayuden a mejorar más la red social en la cual uno puede participar.
BIBLIOGRAFÍA
https://dircomfidencial.com/actualidad/comscore/
http://www.revistaindice.com/numero61/p32.pdf
https://hipertextual.com/2011/02/7-tecnologias-de-software-que-sostienen-a-facebook
http://jamvaldivia-poo-upc.blogspot.mx/
https://histinf.blogs.upv.es/2012/12/20/twitter/
https://www.iedge.eu/alberto-san-agustin-herramientas-de-medicion-en-la-industria-publicitaria-
online
https://elcopynoctambulo.wordpress.com/2014/12/27/site-centric-y-user-centric/