Perspectives on the utility of linguistic knowledge in English word prediction, Acta Universitatis Ouluensis B Humaniora 67

Työssä tutkittiin lingvistisen tiedon hyödyllisyyttä kieliteknologian yhdellä sovellusalueella eli sanan ennakointia englannin kielessä. Sovellus pyrkii ennakoimaan sanan, jota käyttäjä kirjoittaa parhaillaan tai aikoo kirjoittaa seuraavaksi. Nämä sovellukset ovat hyödyllisiä esim. pienissä päätelaitteissa, joissa tekstin tuottaminen on hankalaa. Eräs kieliteknologiasovellusten tärkeimmistä ominaisuuksista on niiden tehokas toiminta ja suorituskyky, jonka tulisi olla kvantitatiivisesti mitattavissa. Oleellisin tutkimuskysymys on: (1) miten käytännön kieliteknologiasovellusten suorituskykyä voidaan parantaa merkittävästi lingvistisen tiedon avulla ja (2) mitä tämä vaatii käytännössä? Yleisellä tasolla tutkimuksen tärkeimmät tulokset ovat seuraavat: lingvistisen tiedon käytännön hyödyllisyyttä pitäisi arvioida ainakin kolmesta näkökulmasta, jotka ovat: (1) kielen näkökulma, (2) teknologian näkökulma ja (3) sovelluksen käyttäjän näkökulma. Näiden kolmen näkökulman avulla voidaan määrittää joukko tekijöitä, jotka joko lisäävät tai vähentävät lingvistisen tiedon hyödyllisyyttä käytännön kieliteknologiasovelluksissa. Työn empiirisessä osassa kehitettiin tilastollinen sananennakointisovellus englannin kieleen hyödyntäen parhaiten toimivia ennakointitekniikoita yhdessä ja samassa järjestelmässä. Kehitetyssä järjestelmässä suorituskyky vastaa täysin aiempien järjestelmien suorituskykyä. Työssä testattiin myös joitakin uusia, lingvististä tietoa hyödyntäviä ennakointitekniikoita, joiden suorituskyky vastasi tiettyjen tilastollisten ennakointimenetelmien suorituskykyä. Tutkimuksen tuloksista voidaan päätellä muun muassa, että sananennakointi-sovellusten suorituskykyä voidaan parantaa merkittävästi lingvistisen tiedon avulla vain käyttämällä samanaikaisesti useita lingvistisen tiedon lähteitä. Tämä taas saattaa hidastaa sovelluksen reaaliaikaista toimintaa ja vaikuttaa sovelluksen suorituskykyyn silloin kun se mitataan näppäinsäästönä merkkisäästön asemesta.

ISBN-10:
951-42-7849-6
Kieli:
ENGL
Tekijät:
Väyrynen Pertti
Tuotekoodi 013563
20,00 €