Archive

Posts Tagged ‘Catalonia’

més Mohameds que Jordis?

26/11/2011 3 comments

del grup InfoExplorers surten mil idees i ens costa donar sortida, ja sigui per la complexitat dels conjunts de dades com de vegades per manca d’un objectiu concret i comú

aprofitant el poc quòrum de l’altre dia, vàrem decidir començar a jugar amb els noms dels nadons a Catalunya, per comarques, amb la idea de respondre la pregunta que es feia Duran Lleida, de CiU i que dóna el titol a aquesta entrada

agafant les dades d’IDESCAT a lo bruto, endevinant l’ús dels paràmetres de la crida HTML i amb una mica de parsing HTML cutre, hem pogut agafar la primera plana de noms (els 25 més populars) de cada comarca entre els anys 1997 i 2010, inclosos; el resultat? una bonica imatge creada amb tagxedo (la posició del nom no té res a veure on s’ha usat més, la mida si, és proporcional al nombre de cops que s’ha posat):

noms dels nadons a Catalunya, 1997-2010 (font: IDESCAT)

noms dels nadons a Catalunya, 1997-2010 (font: IDESCAT)

trobeu els Mohameds? jo no, en canvi veig molts Jordis i no parlem ja dels Marcs o les Maries… de fet les dades diuen que en aquest període de temps, hi ha hagut 976 Mohameds (o Mohammeds, per cert) contra 3780 Jordis, així que, sr. Duran Lleida, ejem, ejem… de fet, si en lloc de tenir en compte els 25 primers noms usem tota la info d’IDESCAT, hi ha 7364 Jordis i 2975 Mohameds (i variants), que no són pocs però està lluny dels 20444 Marcs, per exemple…

però no siguem manipuladors, potser en Duran Lleida es referia a una situació concreta: les dades mostren que els Mohameds van batre als Jordis l’any 1999 a Osona, per exemple, ha passat uns quants cops més… de fet és un fet que s’inicia tímidament el 1999 però desperta amb més força el 2006, on en 7 comarques hi han nascut més Mohameds que Jordis, fet que s’ha repetit a 9 comarques el 2007, a 7 el 2008 i a8 el 2009 i el 2010, sembla “estabilitzar-se”

i on ha passat més cops? doncs 9 cops a Osona i al Baix Empordà, i 8 cops a l’Alt Empordà; algú podria dir-me si és en aquestes comarques on partits com PxC amb el seu discurs xenòfob treu millors resultats? igual Duran Lleida només volia fer com Albiol a Badalona, copiar el discurs de PxC per esgarrepar quatre vots… (per cert, per mi PxC sempre ha volgut dir Peó per Cavall); si ho repetim per tots els noms, no només els 25 primers, els resultats no són gaire diferents

tots els scripts i dades els teniu a http://personal.uoc.edu/opendataviz/nadons

problemes? noms amb accents, ç, ñ i altres caracters especials, la majoria d’eines unix (p.e. uniq) no funcionen correctament; treure els accents vol dir que Júlia i Julià passen a ser el mateix, un problema que conec de primera mà…

crítiques, comentaris, idees, finançament tot serà molt ben rebut!!!

Advertisements
Categories: visualization Tags:

Catalan government facilities

just a quick post for setting up this blog, these are the facilities of the Catalan government (well, only those 18856 out of 25309 that have been geolocalized), the bounding box approximately reveals the borders of Catalonia

you can find the original data set here, the graph was created using Gnuplot