Algoritmos de Yahoo: Flickr Interestingness™ es un post realmente interesante, que explica en detalle cómo (supuestamente, pues todo es ingeniería inversa y una patente) hace Flickr para dotar de relevancia a las fotos que sube la gente y crear la sección Interesting, que seguro habéis visitado alguna vez y conocéis por lo espectacular de sus fotos.
Dicha selección se realiza automáticamente, en base a una serie de baremos que maneja Flickr, como pueden ser el número de vistias a la foto, desde dónde se ha visitado, el número de meta-datos y la calidad de los mismos, o incluso la cercanía de la foto a la ciudad donde has dicho que resides.
Pero en realidad, lo que nos debería de hacer reflexionar este algoritmo es cómo han resuelto un problema, para mí abierto, que es el de la relevancia social de los contenidos generados por los usuarios, ya sean fotos, enlaces, posts, vídeos, etcétera.
Y es que si por algo se caracteriza esta época de Internet que estamos viviendo es por la cantidad de dicho contenido, que obliga a filtrarlo si queremos seguir teniendo vida social, familiar y laboral. Y ahí está el problema, en filtrar lo relevante de lo menos relevante.
Criterios como:
- número de enlaces entrantes (veces que te han citado)
- número de visitas
- número de comentarios
- tags asociados al contenido
- karma del autor del contenido
- o el reciente sistema de clasificación por votos
no aseguran, para nada, dar en el clavo y asegurarnos la interestingness, pero de momento es con lo que nos podemos conformar.
Por suerte cada escenario plantea unas características inherentes a él diferentes, lo que permite elaborar criterios específicos mucho más precisos.
Por ejemplo, todos conocemos del.icio.us y su sistema de recomendación de URLs a través de tu red social. ¿Qué es relevante para ti? Lo que te recomiendan tus amigos. Nada más.
Por otro lado tenemos digg o <pon aquí tu clon>, que cuanto más populares se hacen, el sistema de votaciones se vuelve más permisivo, y se convierten en medios más genéricos, con lo cuál abarcan más usuarios, pero éstos están más insatisfechos con los contenidos. ¿La solución? Más contenido en portada, con lo cuál volvemos a tener que filtrar el resultado del filtro (votos, en este caso)
Y por último, tenemos la fusión de estos dos conceptos en coRank, como se puede ver en este pequeño gráfico incluído en su web:

Problemas:
- tienes que convencer a tu red social de que lo utilice
- es un concepto que requiere mucha más labor activa por parte del usuario, que la que puede requerir del.icio.us, pues el filtrado va implícito al uso de la herramienta (sino para qué utilizarla, pudiendo utilizar un agregador convencional), con lo cuál el usuario se va a cansar y va a terminar abandonándola
- tiene, además, el peligro de que los primeros siempre serán los primeros, es decir, que los que están ya arriba en el ránking, van a seguir estando por mucho tiempo
Y esto es de lo más nuevo en filtrado colaborativo que se ha hecho últimamente, y la lista de aplicaciones que han fracasado no es corta, precisamente (¿recordáis Rojo?)
Concluyendo: que es un problema difícil, y lo es más, cuanto más se intenta abarcar. Supongo que pronto irán surgiendo nuevas ideas, cada vez más basadas en redes de confianza, pues si al final el uso de internet se está extendiendo tanto éstas cada vez serán más numerosas, y ¿qué mejor forma de que te digan tus "amigos" qué tienes que leer?

