Site icon Vaski-kirjastojen extranet

Vaskin asiasanat, jotka eivät ole YSAssa

Thesaurus 😉

Tekaisin pienen ohjelman, joka kävi läpi Vaskin aineistotietokannan ja listasi kaikki 652 -kentään merkityt asiasanat, jotka eivät ole peräisin Yleisestä suomalaisesta asiasanastosta YSA:sta, kuten FinMARC-formaatti edellyttää. Löysin 2409 eri termiä, ja niille yhteensä 4817 esiintymää. Eniten käytetyt YSAn ulkopuoliset sanat 652:ssa ovat:

202 sotaromaanit
108 Lieto-kokoelma
100 korjausoppaat
66 eräkirjat
38 matkakirjat

Vain yhdesti esiintyviä termejä on peräti 1761 kappaletta. Yksi selvä ryhmä ovat asiasanaketjut, joiden osia ei ole jaettu osakenttiin, vaan jotka on ilmaistu osakentässä ‡a peräkkäin välilyönnein ympäröidyllä kaksoispisteellä eroteltuna. Siis

652 ## ‡aensimmäinen termi : toinen termi

eikä

652 ## ‡aensimmäinen termi ‡btoinen termi

Listauksen termeistä, sekä tietueiden tunnisteet (001 -kentästä) voit ladata tästä Excel-taulukkona.

Tarkempi kertomus aiheesta, pohdiskelua sekä jokunen kommentti löytyy Riippumaton asiantuntija -blogistani. Myös kansallisella marc-listalla voi asiaa puida, en tiedä moniko meistä vaskilaisista kyseisellä listalla tosin on.

Ohjelmani on kirjoitettu Perlillä ja löytyy GitHubista jos sitä joku haluaa tarkastella, muokata tai kehittää. Työ perustuu Axiellilta talvella tilaamaamme Vaskin MARC-dumppiin, Perlin MARC::Batch -moduuliin sekä siihen, että YSA on saatavissa avoimena datana. Mainittakoot, että kaikki käyttämäni työvälineet ovat avointa lähdekoodia ja ilmaisia.

Vastaavilla tavoilla voi tehdä muunkinlaisia analyysejä Vaskin aineistosta (tai MARC-aineistoista yleensäkin) ja käyttää esim. laadunvalvontaan tai raportointiin. Kerron mielelläni lisää, jos jollakulla kiinnostusta tällaiseen on. Sähköpostini on mace.ojala@turku.fi, puhelin 044 907 5271 sekä lisäksi Facebook yms. Tai piipahda bürossani täällä Turun pääkirjaston 3. kerroksessa.

Yst. terv. Mace

Exit mobile version