Por César Pérez Carballada
Conseguir que alguien re-envíe a sus seguidores uno de nuestros tweets (el conocido retweet) es un objetivo básico en Twitter, ya que permite expandir nuestro mensaje llegando más allá de nuestro círculo más cercano (y así también conseguir más seguidores).
La cuestión es cómo lograr el retweet, es decir, qué características tiene que tener nuestro mensaje para que sea re-enviado.
En Internet se pueden encontrar muchos sitios dando consejos sobre cómo obtener retweets. Algunos dicen verdades obvias como “sé uno de los primeros en lanzar nuevas noticias” (sin dar detalles de cómo encontrar esas primicias) o “escribe contenidos virales” (una falacia ‘petitio principii’ en toda regla: para ser viral escribe contenidos virales).
También hay muchos “rules of thumb” no demostrados como que poner más hashtags (etiquetas) ensucia el tweet y por ende reduce el número de retweets e incluso hay mitos que nadie se ha encargado de comprobar jamás: “se deben utilizar adjetivos” o “la cantidad de RTs tiene poco que ver con la cantidad de followers que se tenga”.
¿Estas reglas son correctas? ¿De verdad no hay relación entre el número de followers y la cantidad de retweets? ¿Es cierto que los adjetivos incrementan la probabilidad de un RT?
UNA PRIMERA APROXIMACIÓN
La única forma de saber realmente qué funciona es contrastar datos estadísticos reales. Un ejemplo es el análisis realizado por Dan Zarrella (1), quien compara tweets que han logrado ser re-enviados vs. un grupo de control compuesto por tweets seleccionados al azar. Si bien este análisis no es el ideal (quizás el grupo de control debería estar constituido solo por tweets que NO han sido re-enviados para mostrar el impacto neto del RT) al menos está basado en datos reales ya que analiza 10 millones de tweets al azar y otros 40 millones de tweets que han logrado ser re-enviados, para ver qué diferencia a unos de otros.
En ese análisis se llega las siguientes conclusiones:
- Los retweets tienen links
Si el 18,96% de los tweets incluyen un link, en el caso de aquellos que logran ser re-enviados este porcentaje sube a 56,69%, sugiriendo que la presencia de un link está asociada con un mayor probabilidad de ser re-tuiteado.
- Algunas palabras son más retuitables que otras
Al analizar la frecuencia de aparición de las palabras en los tweets que logran al menos un RT se puede determinar qué palabras están asociadas con los retweets. Las 20 palabras más retuiteadas son las siguientes (en inglés, pero muestran una tendencia temática que podría ser aplicable a otros idiomas):
En esa lista destaca la palabra “you” (“tu” o “Ud.” en castellano) como la más común en los retweets (si me hablas a mí, es más probable que haga RT), así como la palabra “Twitter” (a quienes usan Twitter les encanta hablar sobre ella).
En esta lista también se destacan:
- las palabras asociadas a pedir que nos retuiteen (en verde) mostrando que la petición directa o el viejo “call to action” aun funciona (es cuestionable si el uso frecuente de esta táctica puede llegar a cansar y alienar a los followers).
- las palabras relacionadas a los blogs (en rojo) sugiriendo que promocionar un blog en Twitter es algo muy recomendable ya que logra un alto nivel de RT
- las referencias a los “social media” (en azul) mostrando que en Twitter este tema tiene gran repercusión
- las palabras relacionadas con títulos de artículos que logran gran viralidad (en gris) como “10 consejos para…”, “Top 10…”, “Cómo…”, etc.
- Algunas palabras son menos retuitables que otras
El opuesto al punto anterior, las palabras que es menos probable encontrar en un re tweet son la siguientes:
En esa lista se destacan:
- las palabras que denotan una respuesta a la pregunta original de Twitter (“what are you doing?” o “¿qué estás haciendo?”) tal como “escuchando”, “mirando”, “yendo”, “casa”, “trabajo”, “aburrido”, etc. (en azul), todas son malas para lograr un retweet.
- las palabras que denotan informalidad también logran bajos niveles de RT (en verde): “haha”, “lol”, “gonna”, “hey”.
- las palabras en los mensajes de buenas noches son malas para RTs (en gris): “noche”, “cama”, “dormir”, cansado”.
De esta lista se desprende que para conseguir retweets se deben evitar los temas mundanos y conversacionales e incluso, irónicamente, la respuesta a la pregunta original de Twitter.
- Los retweets son más complejos
Cuando se analizan el número promedio de sílabas en cada palabra, se observa que los retweets tienen palabras más largas (1,62 sílabas vs 1,58) y si se analiza el tipo de palabras utilizadas para ver qué nivel de educación requieren (según las metodologías de Flesch-Kincaid y SMOG) veremos que los retweets tienen palabras más complejas que requieren un mayor nivel educativo.
- Los retweets tienen contenido nuevo
Si comparamos la cantidad de veces que cada palabra de un tweet ha sido incluida en otro mensaje (como una medición del nivel de “novedad”) vemos que los retweets repiten mucho menos su contenido, indicando que si un tweet es “nuevo” tendrá mayores posibilidades de ser retuiteado.
- Los retweets incluyen más adverbios y tiempos verbales
Al aplicar un algoritmo a los tweets que identifican la función gramatical de cada palabra, vemos que los retweets tienen una mayor presencia de adverbios, verbos en pasado, presente (no en 3ra persona) y sujeto en singular (“Tu”), mientras que el sujeto plural (“nosotros”) parece ser una señal de bajo retweet. Los adjetivos son indiferentes y no sugieren una mayor probabilidad de RT.
- Los retweets tienen más signos de puntuación
Los tweets que logran ser re-enviados tienden a tener más signos de puntuación (97,6% vs. 85,9%), especialmente los “dos puntos” (:), pero como ese signo es muchas veces utilizado en los RT para mostrar el contenido original, se deben analizar los signos excluyendo los “dos puntos”, y aun en este caso los retweets tienen más signos de puntuación (93,4% vs 83,8%). Entre los signos de puntuación más comunes en los RT (vs. los tweets que no logran ser re-enviados) están el “punto” y el “signo de exclamación” (después de los “dos puntos”). El único signo que aparece con mayor frecuencia en los mensajes que no logran ser re-tuiteados es el “punto y coma”.
- Los retweets son menos emocionales y autorreferenciales
Analizando los tweets con dos diccionarios de léxicos (el RID o “Regressive Imagery Dictionary” y el LIWC o “Linguistic Inquiry and Word Count”) vemos que el tipo de palabras más usadas en los tweets que no logran un RT tienden a ser más emocionales o a estar relacionadas con emociones negativas, malas palabras, los sentidos y la auto-referencia. Este análisis es para tweets en inglés, pero parece tener sentido aplicarlo a otros idiomas.
UN ESTUDIO MÁS CIENTÍFICO
Estas recomendaciones son útiles porque están basadas en el análisis de datos reales sin embargo, no son perfectas, porque su autor llevó a cabo una simple comparación con un grupo de control sin mostrar correlaciones matemáticas ni la significancia estadística de las diferencias entre ambos grupos con lo cual solo pueden considerarse como diferencias direccionales.
Además el análisis se concentra mucho en el contenido de los tweets sin analizar el contexto relacionado con el autor o sus hábitos en Twitter (por ej, antigüedad de la cuenta, cantidad de followers, etc.) los cuales también pueden influenciar el nivel de RT.
Para solventar estos problemas podemos recurrir a otro análisis (2) publicado por un grupo de científicos del PARC (Palo Alto Research Center Inc), el instituto donde se desarrollaron innovaciones tales como la impresora láser o la interfaz gráfica de los ordenadores (iconos, pop-ups, ventanas, ratón, etc.). Estos científicos llevaron a cabo un estudio académico más profundo que no solo explica qué factores hacen que un tweet sea re-enviado sino además permiten construir un modelo estadístico para predecir la probabilidad de un RT.
Para empezar los científicos identificaron 8 variables claves inherentes a un tweet: 3 de contenido (la inclusión de una URL, la mención de un usuario –excluyendo la fuente original si es un RT-, la inclusión de un hashtag) y 5 de contexto (el número de followers del autor del tweet, el número de personas a las cuales sigue el autor, la antigüedad de la cuenta, la frecuencia de tuiteo y la cantidad de tweets marcados como favoritos por el autor).
En paralelo se escogieron dos muestras de tweets: (i) una primera muestra de 1,77 millones de tweets seleccionados al azar entre aquellos enviados durante un día y luego (ii) una segunda muestra de 73,9 millones de tweets seleccionados al azar entre aquellos enviados durante casi 2 meses.
La primera muestra fue utilizada para construir un modelo de PCA (“Principal Component Analysis”) que permite determinar la correlación entre las variables y la probabilidad de ser re-tuiteado, y también se le aplicó un modelo GLM (“Generalized Linear Model”) para desarrollar un modelo predictivo de la probabilidad de un RT, mientras que la segunda muestra se utilizó para profundizar en el estudio de las variables de cada tweet analizando el impacto individual de cada una.
El primer dato interesante es que de la primera muestra (1,77 M de tweets), un 14% de todos los mensajes son retweets (212 mil), sugiriendo que los retweets son una clara minoría dentro de Twitter.
En esta muestra general se identificaron los tweets originales que no son retweets (1,56 M), y entre ellos se seleccionaron 10.000 al azar para un análisis en profundidad. En esa muestra se encontró que el 2,2% de los mensajes habían logrado ser re-tuiteados al menos una vez (ninguno logró ser re-tuiteado más de 20 veces). Esto señala que la probabilidad de ser re-tuiteado es bastante baja: solo el 2,2% de los tweets lo logra. Como comparación podemos tener en cuenta que en esa muestra 3,4% de los tweets fueron borrados por sus autores tras la publicación, con lo cual es más probable que un tweet sea borrado por su autor a que sea re-tuiteado por sus seguidores.
Para entender el efecto de las variables de contenido y contexto, los académicos realizaron un análisis PCA (una variante de “factor analysis”), el cual identifica factores que explican la probabilidad de re-tuiteo y después correlaciona las 8 variables de un tweet con esos factores. El resultado se ve en los siguientes dos gráficos donde cada variable es un vector que muestra la correlación (cuanto más cercana es la dirección y el sentido entre dos vectores, mayor será la correlación entre ellos).
Así vemos que las variables “número de seguidores”, “usuarios seguidos”, “presencia de URL” y “presencia de hashtag” están positivamente correlacionados con el RT (gráfico a la izquierda) mientras que la “frecuencia de tuiteo” y la “cantidad de favoritos” parecen estar negativamente correlacionada con el RT (gráfico a la derecha).
Para confirmar estos datos, los científicos aplicaron un GLM (“Generalized Linear Model”), un modelo matemático que es un poco complejo de explicar en detalle, pero de forma resumida su resultado es el siguiente:
En este gráfico vemos cada variable y si tiene correlación positiva o negativa con el RT, es decir, si incrementa la probabilidad que un tweet sea re-enviado (positiva), o si reduce esa probabilidad (negativa). La barra muestra el nivel de confianza estadístico: por encima de la línea de puntos podemos afirmar que la correlación es estadísticamente significativa (al 95%) con lo cual podemos confirmar el impacto positivo de las primeras 5 variables, mientras que el impacto negativo de la “mención” y de la “frecuencia” es solo marginal o direccionalmente aceptable (los “favoritos” no tienen significancia estadística).
Los coeficientes del modelo están al final de este post, con los cuales se puede predecir la cantidad promedio de retweets de un mensaje determinado (simplemente conociendo el número de seguidores, perfiles seguidos, la antigüedad de la cuenta, la inclusión o no de una URL, etc.).
LOS EFECTOS INDIVIDUALES
Para ahondar en los impactos independientes de las variables, los científicos utilizaron la segunda muestra de 74 millones de tweets encontrando lo siguiente.
- URL
Como vimos antes, incluir una URL afecta positivamente la probabilidad de que un mensaje sea retuiteado, y en este segundo análisis ese impacto positivo se comprueba ya que el 28,4% de los tweets que lograron RT tenían una URL vs. 21,1% en los mensajes en general.
Como hecho interesante, también se encontró que aunque una URL incrementa significativamente la probabilidad de ser re-tuiteado, el tipo de URL también afecta esa probabilidad. En el siguiente gráfico vemos las 29 direcciónes URL (top domain) que son más frecuentemente incluidas en Twitter, detallando la cantidad de veces que aparecen en un tweet, en un retweet y el ratio de retweet (la división de las dos cifras anteriores). Este ratio está normalizado para que la cifra promedio sea 1 (así un ratio de 2 implica un retuiteo dos veces mayor al promedio).
Así vemos que, por ejemplo, www.YouTube.com es la cuarta URL que más frecuentemente aparece en Twitter, y su ratio de retweet es 1,5 (un tweet con esa URL es un 50% más retuiteado que el promedio) mientras que la URL www.formspring.me es la quinta más frecuente aunque su ratio de retweet es de solo 0,05, señalando que los tweets que contienen esa URL, a pesar de ser muy comunes, rara vez son retuiteados.
Si ponemos en un gráfico (ver a continuación) las 50 URLs más comunes y su ratio de retweet, vemos que no hay ninguna correlación, ya que algunas URLs muy utilizadas no tienen casi RTs mientras que algunas menos populares son casi 3 veces más retuiteadas que el promedio.
Esto sugiere que el solo hecho de agregar una URL incrementa la probabilidad de RT, pero también importa de qué URL se trate. Llamativamente los dominios de medios personales como justin.tv y twitcam.com tienen un ratio de retweet sumamente bajo (< 0,15) mientras que los sitios de trivia como omg-facts.com y los buscadores en tiempo real como holykaw.alltop.com tienen un alto ratio de retuiteo (> 4,0); entre los sitios de noticias el ratio varía, por ejemplo los tweets que incluyen la URL de sitios como mashable.com, theonion.com y nytimes.com presentan un alto ratio de retweet (> 2,5) mientras que algunos sitios agregadores como news.yahoo.com y news.google.com tienen un ratio bajo (< 0,6).
- Hashtags
El modelo había encontrado una correlación positiva entre hashtags y RT, y al analizar los 74 millones de tweets se comprobó este hallazgo: 10,1% de todos los tweets incluyen un hashtag, mientras que entre aquellos que logran ser re-enviados ese porcentaje sube al 20,8% (¡el doble!).
De la misma manera que ocurre con las URLs, también importa qué hashtag se utilice, ya que no todos tienen altos ratios de retweet . Por ejemplo, el hashtag #followfriday es solo el 10mo más utilizado, pero es el 3ro que logra más re-tweets (2,5 veces el promedio).
El gráfico a continuación es similar al de las URLs que ya vimos, mostrando los 50 hashtags más utilizados y allí se puede ver claramente que algunas “etiquetas” logran un alto nivel de retweet mientras que otras apenas si logran alguno.
Esto confirma que el solo hecho de agregar un hashtag incrementa la probabilidad de RT, pero al final depende de qué hashtag se trate.
- Número de followers
Si comparamos el ratio de retweets (eje vertical en el siguiente gráfico) con el número de seguidores del autor del tweet (eje horizontal) encontramos que hay una relación casi directa: a mayor número de followers, mayor será el ratio de retweet.
Lo interesante es la relación entre ambas cifras y cómo cuesta más incrementar los RT al principio cuando no se tienen muchos seguidores. Por ejemplo, al pasar de 100 a 500 seguidores (x5), la probabilidad de ser re-tuiteado aumenta x3,7 (de un ratio de 0,27 a 1), pero al pasar de 2.900 a 4.600 seguidores (+159%) el ratio de retweet crece un 150% (de 4 a 6); así en el primer caso los crecimientos tienen una relación 1,35 : 1 mientras que en el segundo caso esa relación ya se iguala en 1,06 : 1 (al principio el ratio de RT crece más lentamente que el número de seguidores, luego estos crecimientos tienden a igualarse).
Así vemos que es crucial aumentar la cantidad de seguidores, porque cuantos más seguidores tengamos, mayor será el ratio de retweet.
- Número de perfiles que seguimos
También existe una relación entre la cantidad de perfiles que seguimos y el ratio de retweet, aunque (ver siguiente gráfico) la relación no es tan fuerte como en el caso de nuestros “followers”.
Una posible explicación es que los usuarios que siguen a más personas producen tweets más interesantes por la mayor exposición a conocimiento diverso. Es curioso que entre los 1.500 y 2.100 perfiles la relación se rompe (y decrece) para luego crecer nuevamente.
- Cantidad de tweets publicados
En el modelo de correlaciones vimos que la cantidad de tweets que un usuario escribe no tiene una correlación estadísticamente significativa con el ratio de retweet, y al analizar los 74 millones de tweets de la segunda muestra, eso se confirma (ver a continuación).
Así vemos que a medida que crece la cantidad de tweets enviados, el ratio de retweets se mantiene prácticamente constante (mostrando la falta de correlación), solo al principio de la distribución (a la izquierda) parece haber una correlación incipiente que desaparece a partir de los 300 tweets enviados. Si se analizan la cantidad de tweets por día se ve algo similar (gráfico no incluido por razones de espacio).
- Antigüedad de la cuenta
Al analizar la antigüedad de la cuenta en Twitter usando el GLM se encontraba una pequeña correlación positiva que se confirma al analizar la segunda muestra, así vemos (ver a continuación) que una cuenta pasa a tener un ratio de retweet superior a la media a partir de los 300 días de antigüedad.
Resulta curioso observar que la relación presenta al principio una forma de “U”, comenzando con un ratio más alto, para luego descender y finalmente comenzar a crecer nuevamente a los 200 días, transformándose a esa altura en una curva en “S” que crece hasta estabilizarse a partir de los 430 días. Esto señala que durante el primer mes de una cuenta se logra un ratio de retweet promedio, luego este ratio cae y comienza a subir nuevamente a partir del 6-7 mes para estabilizarse, por encima del promedio, alrededor del año y dos meses, momento a partir del cual la antigüedad de la cuenta no influye en el ratio de RT.
- Cantidad de favoritos
La cantidad de tweets que un usuario ha marcado como favoritos no tiene ninguna correlación (estadísticamente significativa) con los retweets. Esto es porque el 42,5% de los tweets son escritos por usuarios que no han marcado ningún tweet como favorito y 92,8% de los tweets son enviados por usuarios con menos de 100 favoritos, con lo cual el uso de esta funcionalidad todavía es muy baja para sacar conclusiones sobre su impacto en los RTs.
RESUMEN DE CONCLUSIONES
Las reglas generalmente sugeridas para lograr un retweet se basan en pura especulación y opiniones subjetivas y, por esa razón, deberían dejarse de lado. Por otro lado, algunos estudios analíticos sobre el tema han identificado qué factores realmente están asociados con una mayor probabilidad de que un tweet sea re-enviado. Así para incrementar esta probabilidad, en relación al contenido se puede:
- Incluir un link o URL (aunque no todos funcionan igual)
- Agregar un hashtag (aunque no todos funcionan por igual)
- Usar algunas de las palabras señaladas con alto valor de retweet (‘twitter’, un ‘call to action’, ‘social media’, títulos virales como “top”, “10…”, etc.)
- Evitar usar las palabras de bajo retweet (palabras informales o que denotan lo que se está haciendo, los mensajes de “buenas noches”, etc.)
- Usar conceptos elaborados y palabras no tan simples
- Utilizar más adverbios, tiempos verbales y signos de puntuación
- Hacer referencia a contenido sobre el que no se ha escrito mucho
- Evitar el contenido emocional o autorreferencial
Y en relación al contexto, para incrementar la probabilidad de un RT se puede:
- Incrementar el número de seguidores (“followers”)
- Incrementar el número de perfiles a quienes seguimos
- Tener una cuenta más antigua (así con el paso del tiempo crecerá el ratio de RTs)
Finalmente, aunque sea sorprendente, no importa la cantidad de tweets que escribamos (no tiene relación alguna con el nivel de RT) ni las menciones a otros usuarios.
*****
La probabilidad de lograr un retweet está ampliamente ligada al contexto del entramado social de su autor y al contenido informacional contenido en los tweets, con lo cual además de seguir los consejos arriba mencionados, debemos recordar que la calidad del contenido es la que, en última instancia, logrará que nuestros tweets sean re-enviados viralmente porque, como ya dijo Bill Gates en 1996 al hablar sobre el futuro de Internet: “Content is King” (el contenido manda).
Tweet
Comparta aquí su opinión con los demás lectores de Marketísimo
Fuentes:
(1) “The science of ReTweets”, Dan Zarrella, 2009
(2) Suh, B., Hong, L., Pirolli, P. & Chi, E. H. Want to be Retweeted? Large Scale Analytics on Factors Impacting Retweet in Twitter Network. Palo Alto Research Center, Inc. 2010
Nota: Coeficientes del modelo GLM aplicado a los RTs
___________________________________________________________
- Suscríbase al reader o reciba los artículos por correo
- Enviar este artículo por email
Autor: César Pérez Carballada
Artículo publicado en http://www.marketisimo.com/
___________________________________________________________
6 comentarios:
Un gran post, como siempre!
Un pequeñísimo apunte. En el gráfico con las 20 palabras más efectivas para lograr retweet, "Check out" creo que es usado en esos twitts con el sentido de "échale un vistazo", no el de "pagar".
Un saludo.
Buenos días,
mis felicitaciones por el post, extraordinario como siempre.
En mi opinión la mayor lección de todas es la qu eapuntas al final; se sigue confirmando que un contenido de interés es lo determinante para la divulgación de un mensaje. El resto son maneras de facilitar su divulgación.
Gracias por compartir conocimiento tan útil.
Un saludo: Imanol
Alucinado me hallo despues de leer el post o mas bien artículo de divulgación científica. Enhorabuena, de verdad. Muy buen trabajo!!!
Santiago, probablemente estés en lo correcto, y "check-out" tenga la connotación de "compartir" un contenido.
Imanol, las características identificadas tienen una alta correlación con los RTs pero no significan necesariamente causalidad, por esa razón algunas de ellas (complejidad, signos de puntuación, etc) son evidencia de buen contenido, más que ser razones de RT en sí mismas, con lo cual estás en lo cierto, un buen contenido es fundamental.
Muy buena información, pienso tambien que conseguir ser re-enviado depende mucho del contenido, desde el punto de vista cientifico se analiza de forma general el mensaje reenviado, por poner un ejemplo los contenidos vitales a mi no me interesan, sin embargo Harlem shake fue más difundido que cualquier otro hecho mucho más trascendente a su tiempo, (A pesar de ello sé muy bien de lo que se trata Harlem shake) se debe a novelería, lo que quiero decir es que tratar de ser reenviado a través de cierto grupo de personas, sobre temas específicos, es una manera mucho más difícil de difundir el mensaje en tw ya que habría que ignorar lo viral y difundirse con buen contenido de actualidad, conseguir ser reenviado es algo que me resulta muy difícil todavía, lo que no me sucede por ejemplo en pinterest, pienso que tw y pint funcionan de manera parecida, en cuanto a la difusión de su información, pero digamos que en pint rara vez una persona sube un pin, más bien repinea semejante a lo que en tw tuitea, tengo más de 100 amigos en pint, y ninguno sube un solo pin, todos repinean, y eso se debe a que la información en pinterest es más digerible, pues son imágenes... Sin embargo un rt en tw me consigo uno por cada 10 o 15 tweets...
Mil Disculpas, quise decir "virales" no "vitales"
Publicar un comentario