Viittomakielen keskus julkaisi suomalaisen viittomakielen korpuksen
Suomen viittomakielten korpusprojektin ensimmäinen osakokonaisuus on nyt julkaistu FIN-CLARINin Kielipankissa*. Suomalaisen viittomakielen korpus sisältää yhteensä yli 14 tuntia videomateriaalia 21 viittojalta.
Jyväskylän yliopiston viittomakielen keskuksessa on koostettu ja käsitelty jo useamman vuoden ajan suurta tietokoneluettavaa videoaineistoa Suomessa käytetyistä viittomakielistä. Nyt julkaistu korpus on hyödyllinen apuväline suomalaisen ja suomenruotsalaisen viittomakielen kielellisten ja kulttuuristen piirteiden tutkimuksessa ja opetuksessa.
– Korpus avaa uudenlaisia, etenkin määrällisiä mahdollisuuksia selvittää esimerkiksi viittomakielen sanastoa, rakennetta ja variaatioita sekä kuurojen yhteisön tapoja ja normeja, projektitutkija Juhana Salonen kertoo.
Aineistokokonaisuudessa on videomateriaalia sekä materiaaleihin ajallisesti sidottuja koneluettavia merkintöjä ja metatietoja. Merkintöjen lisääminen eli annotointi kattaa viittomien tunnistamisen, niiden merkitysten ja muotojen erottamisen ja virketason käännökset.
– Annotoinnissa käytettiin ELAN-ohjelmaa sekä viittomakielen keskuksen ja Kuurojen Liiton yhdessä kehittämää Suomen Signbank -leksikkotietokantaa. Molempien alustojen yhteiskäyttö mahdollistaa viittomatason annotaatioiden yhdistämisen Signbankista ELAN-ohjelmaan verkkoyhteyden avulla. Lisäksi viittomille koodataan lisätietoja Signbankissa, Salonen jatkaa.
Jyväskylän yliopiston mukaan nyt julkaistulla korpuksella sekä lopullisella Suomen viittomakielten korpuksella tulee olemaan merkittävä vaikutus Suomen viittomakieliseen yhteisöön ja viittomakielten yhteiskunnalliseen asemaan. Korpusaineistoa tullaan myös hyödyntämään viittomakielen opettajille suunnatussa täydennyskoulutushankkeessa.
*FIN-CLARIN on suomalaisten yliopistojen, CSC:n ja Kotimaisten kielten keskuksen muodostama konsortio, joka auttaa eri alojen tutkijoita käyttämään, jalostamaan, säilyttämään ja jakamaan kieliaineistoja. Kielipankki on FIN-CLARIN-konsortion keskeinen palvelukokonaisuus, jonka kautta kieliaineistot ja niiden käsittelyyn sopivat työkalut tuodaan tutkijoiden saataville.