Silloin tällöin näkee, että jotain aineistoa pyritään havainnollistamaan avainsanapilvellä. Nämä pilvet joko toimivat tai eivät toimi.
Hyödyllinen avainsanapilvi
Avainsanapilvet ovat hyödyllisiä, kun niillä luokitellaan sisältöä. Monessa blogissa kerrotaan avainsanapilvellä, mitkä ovat sivuston pääkategorioita.
Myös alussa linkkaamassani Wikipedian artikkelissa on osuva avainsanapilvi, jossa sanojen koot havainnollistavat maiden väkilukuja.
Hyödytön avainsanapilvi
Sen sijaan sellainen avainsanapilvi ei toimi, jolla yritetään tiivistää jonkin tekstiaineiston sisältö muka käteväksi annospaketiksi. Useimmiten avainsanapilvi on nimittäin vain antavinaan kuvan tekstikokonaisuudesta.
Nyt tulee tyly totuus: tekstistä ei kerro yhtään mitään se, mitkä sanat esiintyvät siinä eniten ja mitkä vähiten.
Väitteeni tietenkin vaatii perusteluja, koska avainsanapilviä käytetään usein kuvaamaan tietosisältöjä yhteenvedon tapaan.
1) Aineistosta ei useinkaan ole poistettu jo valmiiksi yleisiä sanoja.
Suomen kielen yleisimpiä sanoja ovat muun muassa ja, ei, se sekä olla-verbin eri muodot. Näillä sanoilla on vain kytkevä merkitys, joten ne pitäisi ensin karsia aineistosta pois. Monesti tätä ei ole tehty.
2) Avainsanapilvet eivät ota huomioon sanojen eri variantteja kuten johdoksia ja synonyymejä.
Kuvitellaanpa, että jossain tekstissä esiintyy sanoja seuraavasti:
- hyvä 9 kpl
- huono 2 kpl
- huonompi 3 kpl
- surkea 3 kpl
- surkeahko 2 kpl
- kelvoton 2 kpl
- kurja 2 kpl
Avainsanapilvestä saisi sen vaikutelman, että yleisimmin käytetty luonnehdinta on ”hyvä”, vaikka tosiasiassa negatiivisia ilmauksia on reilusti enemmän.
3) Avainsanapilvet eivät ota huomioon sanaparien ja sanaryhmien merkityseroja.
Poimitaan esimerkiksi sanapari ”ottaa päähän”. On aivan eri asia analysoida ne erikseen kuin yhdessä. Yhdessä ne merkitsevät samaa kuin ”kiukuttaa”, mutta avainsanapilvi ei tätä ymmärrä. Se luokittelee sanat erikseen, jolloin niiden yhteismerkitys hukkuu.
4) Avainsanapilvi ei tunnista sanojen taivutusmuotoja.
Suomen kielessä on ihanuus nimeltä taivutusmuodot. Avainsanapilvi ei tunnista näitä, joten se pitää sanoja kissa, kissallamme ja kissasta eri sanoina.
5) Jos kirjoittaja käyttää elävää kieltä ja laajaa sanavarastoa, mikään ei nouse avainsanapilvestä esille.
Avainsanapilvi ei toimi, jos kirjoittajan kieli on rikasta. Silloin kutakin sanaa on vain muutama esiintymä, eikä mikään nouse tekstistä esille.
* * *
Btw, johonkin avainsanapilvi sentään kelpaa. Kirjoitin kauan sitten Blogimarkkinointi-blogiin siitä, kuinka avainsanapilvellä voi testata tekstin laatua.
vainsanat voidaan jakaa mielestäni kahteen luokkaan. Eli niinkuin testissä sanottiin, niin tekstien kategorointi blogissa on ensimmäinen jako. Eli jaetaan tekstit pääluokiin, joiden alta löytyy samankaltaista asiaa.
Tagipilvi on toinen tapa luokitella tekstejä eli silloin luokitellaan tekstiä pääluokan sijaan tekstissä olevilla asioilla. Eli esimerkiksi sukkahousu tagi, saattaa liittyä tekteihin, joiden pääluokka voisi olla sukkahousut tai vaikkapa bloggaaminen. Eli tagien avulla määriteään luokan sijaan ne perusmuodossa olevat avainsanat, jotka liittyvät kyseisiin teksteihin. Eli sanapilvi toimii erilaisena luokitteluna kuin kategorioihin jako.
Sanapilven käytössä on ehkä suurin haaste se, että sitä ei voi louhia tekstistä vaan suomenkielessä se pitää luoda itsepäättämiensä sääntöjen mukaan. Esim. itse voisin kuvitella käyttäväni perusmuodossa olevia aihetta tarkasti kuvaavia käsitteitä.
Tekstistä suoraan louhittu sanapilvi on melkoisen turha, kun pohtii kuinka monella eri tavalla sanat taipuvat. Ja myös siksi, ettei sanapilven sanoihin saa mukaan semanttista merkitystä. Ja siksi käsin luotu sanapilvi on hyvä, koska silloin voi luoda eri käsitteille omat kuvaavat sanapilven sanat.
Kuhan pohdin, Kari…
Sanapilvellä on puutteensa, mutta hyvää siinä on se, että se on tuonut ajatuksen tekstien visualisoinnista suuren yleisön tietoisuuteen. Kirjoitin omaan blogiini asiasta (ja linkkasin tänne sieltä): http://www.instanssi.fi/puolustuspuhe-sanapilvelle/
Kiitos Camilla! Avainsanapilvellä tosiaan tarkoitetaan hyvää. Tiedon visualisointi on usein hyödyllistä.
Aina kun tekee sanapilviä suomalaisesta tekstistä, pitäisi ottaa huomioon sanojen sijamuotojen vaihtelu. Samoin pitäisi vertailla synonyymien määrät ja poistaa konjunktiot, pronominit, prepositiot ja postpositiot. Jos tämän esityön jaksaa tehdä, niin avainsanapilvi on hyödyllisempi.