Els núvols de paraules

20150102 tv

Avui parlaré dels núvols, però no del núvol a on es guarden les dades i del que tothom en parla, sinó dels núvols de paraules.

En plena era de les imatges i la informació no podem deixar de banda l’ús de les paraules, però tot i així podem organitzar-les de manera que es comportin com a imatges sense deixar de banda el vessant comunicatiu d’aquestes és el que es coneix com a núvol de paraules.

Amb l’arribada del 2015 us anuncio que he posat en marxa un blog, pensalla.cat, on trobareu la recopilació dels articles que he fet per l’Internauta, així com els àudios i vídeos. El nom és el meu tribut al gran mestre de la comunicació i creador de l’Internauta, Jordi Vendrell.

I vaig pensar que una manera de veure com parlava de cada tema, quines paraules clau feia servir i com resumia tots els meus articles era fer un estudi de les paraules utilitzades.

Perquè un núvol de paraules és això: un resum estadístic i una representació visual de les paraules que ens descriu un contingut, en diferents mides de lletres que ens mostren la freqüència relativa i que ens poden donar enllaços per aconseguir més informació.

Aquest és el núvol de les paraules utilitzades en aquest article:

20150109 nuvol paraules_nuvol

i a aquesta pàgina hi trobareu, actualitzat, el núvol de totes les paraules dels articles de pensalla.cat:

Screenshot 2015-01-05 12.56.56

 

Com posar-ho al nostre blog?

A WordPress, i a tots els blogs, existeix el concepte núvol d’etiquetes, que fa referència, només, a les etiquetes que manualment hem volgut posat al nostre article i al conjunt dels articles del nostre blog. A cada article el creador assigna etiquetes rellevants i trobareu molts widgets que us les mostraran en forma de núvol. També podeu fer-ho amb les categories de WordPress.

Però com puc fer-ho amb les paraules?, si no us voleu complicar la vida l’opció més senzilla és Wordle que com la majoria de recomanacions que us faig, és gratuït i molt senzill de fer servir.

Aneu a l’opció ‘Create’ i enganxeu el test que vulgueu analitzar o bé poseu l’URL de la vostra pàgina. Wordle analitza el llenguatge en què està escrit l’article i elimina de l’estudi els articles, preposicions, conjuncions, números i d’altres paraules que no entren a l’estudi.

A partir del primer núvol creat podeu configurar-lo a les vostres necessitats o fer clic al botó ‘randomize’ per anar veient disposicions, si ho voleu configurar manualment al vostre gust, podeu fer que consideri els números, podeu fer que consideri totes les paraules en minúscula, o totes en majúscula, per no diferenciar WordPress de WordPress, podeu canviar el tipus de lletra (el programa en fa servir un d’aleatori), el tipus de disposició (rectangular o arrodonida) o com voleu que mostri les paraules (horitzontals, verticals, barreja, etc.) i, finalment, de quin color voleu el gràfic.

Una vegada el gràfic sigui del vostre gust, només heu d’agafar la imatge i incorporar-la al vostre blog, segurament la solució més simple serà fer una captura de la pantalla i retallar-la perquè surti al blog.

Hi ha d’altres sistemes més o menys automàtics, però cap amb la capacitat i senzillesa d’aquest, la simple feina de treure articles i d’altres paraules no significatives ja val la pena, però requereix Java i això fa que no funcioni en telèfons i tauletes, mireu l’apartat d’apps específiques per tauletes, així que si voleu fer proves amb altres programes …

Word it out, enganxeu un text i veureu el resultat, sense esborrar articles i d’altres paraules poc significatives.

ImageChef té gràfics de fons diferents, com p.ex. el trebol de la sort, però certament limitat a textos curts i tampoc permet treure les paraules poc significatives.

Tagul, requereix registre o fer servir el compte de Twitter o Facebook, però molt configurable a base de feina, podem decidir quines paraules no volem que surtin al gràfic a partir de la llista que ens treu de les que es fan servir, té molts i molt divertits perfils, podeu fer p.ex. un núvol amb la forma d’un llangardaix, i et permet que les paraules tinguin enllaços externs. Molt potent si hi dediqueu hores.

Tagxedo, també ens permet escollir quines paraules no volem que formin part del núvol, també a canvi de feina, però és força configurable i ens ofereix enllaços per cada paraula.

 

Apps per a tauletes

L’app gratuïta, almenys d’entrada, és Wordsalad encara que si voleu que no us surti el watermark, força emprenyador, haureu de passar per caixa. Té l’opció de reconeixement del català i, fàcilment, treure articles, preposicions, etc. sense feina per part nostra, val la pena. Té versió per IOS i Android.

Més barata és Word Collage li falta tractament del català i l’únic perfil és un cercle.

I TagCloud que també li falta tractament del català, però té una gran galeria d’imatges per fer núvols.

 

Anem per nota

Mai hem dit que explicaríem coses senzilles, així que, anem per nota …

Els núvols són una representació estadística, doncs anem a buscar quin és el programa estadístic més usat en el món acadèmic, R, l’estàndard per aquestes feines que podem fer servir per data mining, anàlisi predictiu o, exactament, visualització de dades com els núvols.

Per fer-ho més complicat, R és un programa que funciona per ordres de consola, no per interfície gràfica, però ja hem dit que no ens arrugàvem … Així que:

1- anem a r-project.org i baixeu-vos el programa (hi ha versions per windows, mac, linux, unix)

2- instal·leu, també, RStudio una interfície d’usuari que us simplificarà la vida.

3- creeu un text per analitzar i guardeu-lo a un directori, p.ex. temp

4- instal·leu els paquets que us faltin, segur que necessitareu ’tm’ i ‘wordcloud’ (text mining package i wordcloud package) i els que requereixin aquests paquets.

Sota la pestanya ‘Packages’ de Rstudio mireu si estan instal·lats i si no, Tools’>Install Packages i aneu instal·lant

5- si heu arribat fins aquí, seguiu el tutorial d’aquest blog Georeferenced i podreu configurar fins a l’infinit el vostre núvol particular.

 

Idees per fer

Els núvols no serveixen només pels nostres blogs, proveu-los per:

Si esteu buscant feina i teniu un currículum, feu-lo passar per un núvol de paraules per veure si el currículum representa fidelment el que voleu expressar.

Si treballeu l’anglès, la millor eina per anàlisi de paraules és la de VisualThesaurus perquè no només analitza i organitza per rellevància les paraules, sinó que les posa en context, et dóna significats per a cada paraula, et diu les definicions de cada paraula, els verbs, exemples del seu ús, una eina imprescindible pels que tracten l’idioma anglès.

En l’àmbit educatiu, penseu com els mestres podem aprofitar una eina estadística de paraules per millorar l’escriptura dels alumnes, per exemple, per fer veure la quantitat de vegades que una mateixa paraula es repeteix en un text, en lloc de sinònims o descripcions que diguin el mateix, feu la prova amb ‘bé’ o ‘malament’, mireu quantes vegades surten i quantes vegades es podrien substituir …

 

Mc Luhan deia, el medi és el missatge, avui hem descobert com convertir un grapat de paraules presentades com a “dibuixos” en infinitat de missatges relacionats entre si i que aporten el màxim d’informació possible.

 

 

Deixa un comentari

L'adreça electrònica no es publicarà.