Sunday, 9 August 2009

Visualización de alarmas mediáticas

Montañas de granitos de arena

Visualización de alarmas mediáticas según el número de historias recogidas en Google News. Para comparar, en la leyenda inferior se recogen las amenazas junto con el número de muertes a nivel mundial que han provocado. En la mayor parte es cero, y la amenaza más letal parecen ser las “abejas avispas asesinas”, que se han llevado por delante a 1000 personas, cuatro veces más que la gripe aviar.

Saturday, 25 October 2008

mapa de apoyos electorales de los periódicos norteamericanos

Mapa de los apoyos electorales de los periódicos norteamericanos.
Mapa de los apoyos electorales de los periódicos norteamericanos.

En Infochimp han hecho esta interesante visualización de los datos del 2008 y 2004 de los apoyos que los periódicos norteamericanos han dado a los candidatos presidenciales. 29 periódicos que en el 2004 apoyaban a Bush han dado ahora su apoyo a Obama, mientras que sólo 4 han dado el paso contrario, apoyar a McCain, habiendo apoyado a Kerry en el 2004.

Tuesday, 29 July 2008

Más ideas de mashups con feeds de periódicos online

Uno de los proyectos que quiero arrancar este verano es un mashup de feeds de periódicos online. La idea original era tener un análisis automatizado y empírico de la autoría de las noticias, los porcentajes de noticias procedentes de agencias o firmadas por la redacción. Hice una prueba de concepto de esta idea ayudándome de Yahoo! Pipes, de la que podéis ver los resultados aquí.

Luego vi que se podría hacer mucho más con eso: cantidad y frecuencia de publicación, nubes de tags al estilo wordle por día o por rango, una búsqueda de palabras al estilo google trends… Parece mentira, pero de un simple feed se pueden extraer un montón de posibilidades de visualización.

De hecho, hace poco he descubierto Kill The Cliché, que parte de una idea parecida: también analiza feeds de periódicos online, en este caso americanos, pero lo que hace es buscar en el texto de la noticia ciertos clichés, palabras o frases que se suelen repetir hasta la saciedad, y cruzarlos con los autores de las noticias. Con estos datos configuran un ranking de clichés más repetidos y de los periodistas que más los usan. Además permite a los visitantes de Kill The Cliché configurar la búsqueda de clichés: se pueden sugerir nuevas palabras y frases típicas y votar las que ya se están monitorizando.

Su lema es: More data = better media y resulta un experimento interesante para comprobar lo que da de sí un feed de texto con un poco de imaginación. Seguramente veamos más servicios de este tipo a medida que los medios online comiencen a publicar más APIs y la interacción y el procesado de los datos que generan sea más sencillo.

Friday, 4 July 2008

Enséñanos cómo hacerlo mejor

El Gobierno británico ha convocado un concurso de mashups y visualización de datos con el fin de incentivar nuevos usos de datos públicos que puedan ser de utilidad para sus ciudadanos. El premio a la mejor idea es de 20.000 libras (más o menos 30.000€) para hacerla realidad, pero todos los británicos han ganado ya con este concurso, ya que el Gobierno ha hecho disponible una buena cantidad de datos públicos para inspirar nuevas ideas. Es de esperar que de esta iniciativa de lugar a más proyectos además de la idea ganadora. No es necesario ser británico para participar, pero claro, la idea ha de estar enfocada y ser aplicada a datos del Reino Unido.

Se han enviado ya alrededor de unas 100 ideas. Es difícil de decir, porque en el listado parece que se repiten algunas. Transporte público, infraestructuras, salud y criminalidad son las cuatro áreas que más propuestas tienen. También hay propuestas relacionadas con la ecología, pago de impuestos y bicicletas. De todas las propuestas que han llegado hasta ahora, me quedo con dos del área de salud, Healthy Britain y When Will I Get Ill? que podrían incluso combinarse en una sola:

  • La propuesta de Healthy Britain es proporcionar estadísticas médicas de un área geográfica, lo que permitiría, por ejemplo, a una persona que esté valorando mudarse, ver cuál es el ratio de personas atendidas por heridas de arma blanca en el área, o si hay más casos de cáncer o enfermedades respiratorias de lo normal.
  • When Will I Get Ill? propone una web de consulta en la que, introduciendo tu edad y tu localidad, podrás ver qué enfermedades tienes más posibilidades de tener, teniendo en cuenta las estadísticas del sistema público de salud.

¿Y por qué no están haciendo esto los medios online? Es información local, útil, contextualizada y de servicio público. Es algo que los ciudadanos quieren, y que van a consultar y usar más veces y durante más tiempo que cualquier vídeo o galería de fotos.

Friday, 16 May 2008

Monday, 28 April 2008

Mi primer mashup: jugando con Yahoo! Pipes

He hecho caso a la recomendación de Paul Bradshaw, y hoy he estado trasteando con Yahoo! Pipes, una herramienta online que te permite jugar y trastear con feeds y datos, reordenarlos, extraer partes, y mil cosas más. En la lista de proyectos que tengo en mente está el de hacer un mashup con feeds de periódicos online españoles. La idea es la de acumular y organizar los datos que proporcionan estos feeds para luego, crear visualizaciones con los datos acumulados a lo largo de cierto tiempo: autores de las noticias, nubes de tags con palabras más repetidas en titulares y textos, horas y frecuencia de publicación y más cosas que aún no he definido.

Lo que he hecho con Yahoo! Pipes es una prueba de concepto de esta idea, una especie de prototipo que agrupa los feeds de Adn.es, Publico, El Pais, El Mundo y Soitu.es y extrae el autor de cada noticia. El resultado es un feed que nos muestra las noticias con un título siguiento este formato: [Medio] Autor, lo que nos permite de un vistazo ver los autores de las últimas noticias publicadas en los principales medios online españoles y ver, por ejemplo, cuál es la prevalencia de las agencias en cada uno, o de las noticias de redacción, las que por un motivo u otro el autor ha declinado firmar. La utilidad de los datos es limitada, claro, ya que el feed recoje sólo los últimos 5 items de cada medio, de hecho, lo de prototipo le viene un poco grande.

Lo que yo pretendo hacer va un poco más allá tanto en visualizaciones como en datos a presentar, con posibilidades de comparativas entre medios y entre el mismo medio, en dos rangos de tiempo diferentes. Para ello necesito, además de capturar los feeds, programar el script que diseccionará los feeds y que grabará el contenido en una base de datos. La parte más divertida será, mientras se van guardando los datos, ir creando las visualizaciones. De hecho, es la excusa perfecta que estoy esperando para comprarme un libro de Processing.

Thursday, 21 February 2008

sigue el dinero

Bush y el dinero del petróleo.

Las viejas máximas siguen siendo válidas, y un puñado de datos bien organizados, con una visualización interesante, pueden ser más efectivos que cualquier reportaje. La imagen representa la financiación a la campaña presidencial de George W. Bush del año 2004 proveniente de compañías de la industria petrolífera. Aún más interesante es ver la relación entre la cantidad recibida por John Kerry y la recibida por Bush: 185.000$ frente a 2.650.000$. Cuantos más candidatos y empresas donantes seleccionemos para visualizar en el gráfico, más sangrante es la comparación y más obvio resulta (si no lo era ya) cuál era el candidato favorito del petróleo.

En el gráfico de las elecciones del 2008, para las que aún falta incluso saber los candidatos de cada partido, las cantidades están más repartidas, aunque esta vez las petroleras están apostando a caballo perdedor. Y eso que hacen apuesta múltiple: Giuliani por el lado Republicano (500.000$), y Clinton por el partido demócrata (200.000$).

Vía Information Aesthetics.

Friday, 25 January 2008

Entrevista a Casas Tristes: proyecto de localización de casas vacías en España

Uno de los mashups más interesantes que ha surgido en España últimamente es Casas Tristes, puesto en marcha por el colectivo Derivart. Su objetivo es documentar todas las casas vacías, desocupadas, que existen en España. Según los datos del Ministerio de la Vivienda, en 2005 había 3.350.000 viviendas vacías en todo el estado. La cifra de segundas viviendas sería similar, por lo que en España tenemos más de 7 millones de viviendas vacías o de veraneo/fin de semana. Pero uno de los puntos fuertes de la web de Casas Tristes, además del mashup con Google Maps (en proyecto está la integración con el sistema de mapas con licencia CC openstreetmap) son las diferentes visualizaciones de datos que nos permiten ver y explicar tendencias históricas de una problemática compleja de una forma más eficaz, al poner varios factores en relación.

Durante estos días he tenido la oportunidad de entrevistar a Mar Canet, uno de los miembros de Derivart responsables de Casas Tristes. Ha sido mi primera entrevista a través de Google Docs. La verdad es que ha sido curioso poder asistir al proceso de respuesta de preguntas y correciones de otros creadores del proyecto.

Continue Reading

Wednesday, 23 January 2008

resumen del taller de mashups en Hangar

La semana pasada asistí a un taller de mashups en Hangar, impartido por la gente de pimpampum. El taller tuvo un nivel un poco inferior a lo que me esperaba. Mi idea es que sería algo más práctico y técnico, con actividades concretas, pero fue más parecido a un tour guiado a través de una serie de enlaces.

Lo que más me llamó la atención es que prácticamente todos los mashups presentados tienen un carácter casi exclusivamente lúdico: juegos, visualizaciones curiosas y llamativas, o propuestas de interfaces alternativas, pero pocas veces la recontextualización de los datos tiene una intención crítica o la mezcla de varias fuentes permite extraer información nueva o que no fuese evidente al principio.

La excepción, y uno de los que más me gustó, es esta reformulación del feed de Google News que muestra de forma visual el peso de cada noticia en los medios, dotando de una mayor área a aquellas noticias con más artículos relacionados, por tanto, a aquellas que más cobertura están obteniendo. El resultado es una cartografía del sesgo de los medios, pero que tampoco está libre de sesgos propios al aceptar el feed de Google News como una representación fiable de todo lo que se publica en medios de comunicación. Tampoco, creo, tiene en cuenta la distinta capacidad de influencia de cada medio. Pero ambas son limitaciones que vienen impuestas desde la propia fuente de datos utilizada, y no anulan ni le quitan efectividad al proyecto.

Lámpara en Hangar

Otros mashups acabaron teniendo más posibilidades de las inicialmente planteadas por sus creadores, como esta aplicación, hecha por el propio equipo que impartía el taller, que permite crear una tira de varias viñetas a partir de fotos de flickr, añadiendo bocadillos de varias formas y textos. Aunque lo hicieron como un juego, comenzaron a ver en los archivos que algunos profesores lo usaban como un ejercicio en sus clases de idiomas.

También se hizo mucho hincapié en la visualización de datos. La mayor parte de los proyectos presentados tenían una interfaz realizada en flash, a pesar de los problemas de indexación en buscadores que presenta, y a la necesidad de disponer de un plugin adicional para visualizar los datos.

Con todo, fue una experiencia interesante e inspiradora. Lo suficiente como para añadir un ítem más a la lista de cosas para hacer durante este año. Ahora sólo tengo que refrescar y mejorar lo suficiente mis nociones de PHP y mySQL, algo que de todos modos ya estaba en la lista. Para los curiosos, podéis ver las notas en las que basaron las presentaciones de los tres días.