Linguistics and NLP Terms in Finnish

This is a list of terms used in natural language processing from the University of Helsinki Department of General Linguistics. Terms are translated into five languages (English, Finnish, Swedish, German, and French). Here is a link to the original list.

Terms and concepts of language technology

English (eng) Finnish (fin) Swedish (swe) German (deu) French (fra)
Suomi Svensk Deutsch français
active chart parsing aktiivinen taulukkojäsennys
active edge aktiivinen kaari
acyclic graph syklitön verkko, (syklitön graafi)
adjective adjektiivi adjektiv Adjektiv adjectif
affix affiksi affix Affix affixe
agenda jäljellä olevien tehtävien luettelo
agglutinating language agglutinoiva kieli agglutinerande språk agglutinierende Sprache langue agglutinante
alignment kohdistus
allomorph allomorfi allomorf Allomorph allomorphe
alphabet aakkosto alfabet Alphabet alphabet
ambiguity moniselitteisyys mångtydighet, flertydighet, ambiguitet, dubbeltydighet, tvetydighet Mehrdeutigkeit ambiguïté
annotation annotointi, varustaminen (kieliopillisilla) koodeilla annotering
any symbol mikä tahansa merkki
application sovellus tillämpning, applikation
assisted avusteinen stödd assisté par
attribute attribuutti, ominaisuus
attribute value pair attribuutti – arvo pari
augmented transition network (ATN) täydennetty rekursiivinen tilasiirtymäverkko
authorship attribution kirjoittajan tunnistaminen
backtracking peruutus
bleeding vuotaminen
bottom-up parsing kokoava jäsentäminen
bound morpheme sidonnainen morfeemi bundet morfem gebundenes Morphem morphème lié
breadth-first (search or parsing) leveyssuuntainen (haku tai jäsennys)
cartesian product karteesinen tulo kartesisk produkt Kartesisches Produkt produit cartésien
case sija kasus Kasus cas
categorial grammar kategoriakielioppi
category kategoria
chart taulukko
chart parsing taulukkojäsennys
Chomsky hierarchy Chomskyn hierarkia
chunk pätkä
chunk parsing pätkäjäsennys
circumfix sirkumfiksi cirkumfix circumfixe
clause lause sats proposition
clitic particle liitepartikkeli enklitisk partikel particule enclitique
closed class, closed category umpiluokka
cluster ryväs
clusterning ryvästys, ryhmittely
collocation myötäesiintymä, kollokaatio kollokation
competence kompetenssi kompetens, förmåga
complement komplementti komplement, fyllnadsled
composition (of transducers) yhdistäminen (transduktorien yhdistäminen)
compositionality kompositionaalisuus
compound word yhdyssana
computational complexity laskennallinen vaativuus, laskennallinen kompleksisuus
computational linguistics tietokonelingvistiikka datalingvistik, datorlingvistik
computer tietokone dator ordinateur
computer-assisted language learning, CALL tietokoneavusteinen kielen oppiminen datorstödd språkinlärning enseignement assistée par ordinateur
concatenation peräkkäinasettelu, (konkatenaatio)
concordance konkordanssi
conjunction konjunktio
consonant konsonantti
context ympäristö
context-free grammar yhteydetön kielioppi, (kontekstista riippumaton kielioppi), (yhteydestä riippumaton kielioppi)
context-sensitive grammar yhteysherkkä kielioppi, (kontekstista riippuva kielioppi)
coordination rinnastus, koordinaatio
corpus korpus
crowdsourcing talkoistaminen
data structure tietorakenne
default value oletusarvo
definite clause grammar (DCG) DCG-kielioppi
dependency grammar dependenssikielioppi
depth-first (search or parsing) syvyyssuuntainen (haku tai jäsennys)
determinism determinismi
deterministic finite-state automaton (FSA), deterministic finite-state machine (FSM) deterministinen äärellinen automaatti ändlig automat
determinization (of an automaton) determinisointi (automaatin determinisointi)
dialect murre dialekt Dialekt dialecte
dialogue keskustelu, dialogi dialog Dialog dialogue
dictionary sanakirja
digit numeromerkki sifferkod
directed acyclic graph (DAG) suunnattu syklitön verkko (DAG)
directed graph suunnattu verkko, (suunnattu graafi)
disambiguation yksiselitteistäminen disambiguering désambiguïsation
discovery procedure keksimismenetelmä upptäcktsprocedur procédure de découverte
distance etäisyys
document classification dokumenttien luokittelu dokumentklassificering
dotted rule pisteellä varustettu toisinkirjoitussääntö
dynamic programming dynaaminen optimointi
edge kaari
element alkio element Element élément
empty set, void set tyhjä joukko tom mängd leere Menge ensemble vide
entry merkintä
epsilon-transition epsilon-siirtymä, tyhjä siirtymä
expert system asiantuntijajärjestelmä
expression (in a formal system) lauseke (formaalissa järjestelmässä)
expression (in natural language) ilmaus
feeding syöttäminen
final state lopputila
finite state machine, FSM äärellinen automaatti
finite state transducer, FST äärellinen transduktori finit transduktor
formal language formaali kieli formellt språk langage formel
free morpheme vapaa morfeemi fritt morfem morphème libre
functionality funktionaalisuus
gender suku
generalization generalisaatio
generation generointi, tuottaminen
GPSG, generalized phrase structure grammar GPSG, yleistetty lausekerakennekielioppi
grammar checking kieliopillisuuden tarkistaminen
grammatical word kieliopillinen sana formord, funktionsord, grammatiskt ord
graph verkko
head pääsana, pääkonstituentti
hidden Markov model, HMM Markovin piilomalli dold Markovmodell modèle de Markov caché
hyperonyme hyperonyymi, yläkäsite
hypertext hyperteksti
hyphenation tavutus avstavning
hyponyme hyponyymi, alakäsite
idiolect idiolekti
index term indeksitermi indexterm
indexing indeksointi indexering
inference inferenssi, päättely
infix infiksi infix infixe
inflection taipuminen, taivutus böjning flexion
information extraction, IE tiedon eristäminen
information retrieval tiedonhaku informationssökning
inheritance periminen
input syöte
interactive vuorovaikutteinen interaktiv interactif
intersection leikkaus intersektion, skärningspunkt Durchschnitt
intonation intonaatio, sävelkulku
isolating language isoloiva kieli analytiskt språk, isolerande språk isolierende Sprache langue analytique
iteration toisto
Kleene star Kleenen tähti Kleene-stjärna Kleene-Stern étoile de Kleene
Kleene-plus Kleenen plus
knowledge tietämys
language acquisition kielenoppiminen språkinlärning
language planning and maintenance kielenhuolto språkvård
language resource kielivarat
language technology, human language technology kieliteknologia språkteknologi
lattice hila
left recursive rule vasemmalle rekusriivinen sääntö
lemma lemma lemma Lemma lemme
lexeme hakusana, lekseemi lexem Lexeme lexème
lexicon leksikko
loan word lainasana lånord
machine translation, MT konekäännös
machine-aided translation tietokoneavusteinen kielen kääntäminen
mapping, function kuvaus, funktio mappning
mark-up merkkaus uppmärkning
Markov model Markovin malli Markovmodell Markovmodell modèle de Markov
meaning merkitys
measure mitta mått
minimization (of an automaton) minimointi (automaatin mimimointi)
modify määrittää
morph morfi morf Morph morphe
morpheme morfeemi morfem Morphem morphème
morphophoneme morfofoneemi morfofonem Morphophonem Morphophonème
morphophonemic representation morfofoneeminen esitysmuoto
morphotactics morfotaksi morfotax
multilingual monikielinen flerspråkig multilingue, plurilingue
mutual information keskinäinen informaatio
named entity nimetty kohde
natural number luonnollinen luku naturligt tal natürliche Zahl nombre naturel
neologism uudissana
network verkko
node, vertex solmu
nondeterministic automaton epädeterministinen automaatti icke-deterministisk automat
nonterminal symbol, meta symbol välikesymboli
noun substantiivi substantiv Substantiv nom
null string, epsilon tyhjä merkkijono, epsilon tom sträng, epsilon
number luku numerus nombre
operator operaattori
optimization, programming(2) optimointi
other symbol muu merkki
outlier poikkeava havainto
output tuloste
overgeneration yligenerointi
paradigm muotosarja, paradigma paradigm paradigme
parser jäsennin parser parseur
parsing jäsentäminen parsning analyse, parsage
part of speech sanaluokka
part of speech tag sanaluokkakoodi, sanaluokkaleima
part of speech tagging sanaluokkajäsennys
pause tauko
phoneme foneemi
phrase lauseke
pitch äänenkorkeus
polysynthetic language, incorporating language polysynteettinen kieli, inkorporoiva kieli polysyntetiskt språk langue incorporante, langue polysynthétique
possessive suffix omistusliite, possessiivisuffiksi possessivsuffix suffixe possessif
postposition postpositio
precision tarkkuus precision
prefix prefiksi, etuliite förstavelse, prefix préfixe
preposition prepositio
pushdown automaton pinoautomaatti
recall saanti täckning
recognition tunnistaminen igenkänning
recognize tunnistaa
recursive rekursiivinen
recursive transition network rekursiivinen tilasiirtymäverkko
regular expression säännöllinen lauseke regulärt uttryck expression rationelle, expression régulière
regular grammar säännöllinen kielioppi
regular set, regular language säännöllinen joukko, säännöllinen kieli
relation relaatio relation relation
representation esitysmuoto
rewrite grammar toisinkirjoituskielioppi
rewrite rule toisinkirjoitussääntö omskrivningsregel
robust robusti, vakaa, (vankka?) robust
root morpheme, root juurimorfeemi, juuri rotmorfem, rot
rounded vowel pyöreä vokaali rundad vokal voyelle arrondie, voyelle labialisée
script komentosarja
search stem hakuvartalo
sense alamerkitys betydelse
sentence virke mening phrase
sequentiality sekventiaalisuus
set joukko mängd ensemble
source language lähtökieli
space välilyönti
spectrogram spektrogrammi
spectrum spektri
speech puhe tal parole
speech interface puhekäyttöliittymä talgränssnitt
speech recognition puheentunnistus taligenkänning Spracherkennung reconnaissance vocale
speech synthesis, text-to-speech puhesynteesi talsyntes Sprachsynthese synthèse de la parole
spelling checking oikeinkirjoituksen tarkistus stavningskontroll
spelling correction oikeinkirjoituksen korjaus
spoken language puhuttu kieli
start state alkutila starttillstånd
state tila tillstånd
stem (of a word) vartalo, (sanan vartalo) ordstam radical
stem, truncated word tyvi
stemming typistäminen trunkering, stemming
stop word hukkasana
stress paino
string merkkijono sträng
subject subjekti
suffix suffiksi, pääte suffix, ändelse suffixe
summary tiivistelmä sammanfattning, sammandrag
surface character pintamerkki
surface form pintamuoto
synonym synonyymi
synonym set; synset synonyymiryhmä
syntactic parser lauseenjäsennin, syntaktinen jäsennin
tag tarra tagg
tag merkki; leima tagg
target language kohdekieli
template malline, sapluuna mall
term termi term terme
terminal symbol päätesymboli
terminology terminologia
text teksti
tokenise saneistaa tokenisera
top-down parsing produsoiva jäsentäminen
transfer model transfer-malli
transition siirtymä, tilasiirtymä övergång
translation kääntäminen (kielen k.) översättning traduction
translation memory käännösmuisti
translator kääntäjä översättare traducteur
two-level morphology kaksitasomorfologia tvånivåmorfologi
two-level rule kaksitasosääntö tvånivåregel
unambiguous yksiselitteinen entydig, otvetydig
unification unifikaatio, samaistus
union yhdiste, unioni föreningsmängd, union
unrestricted rewrite grammar rajoittamaton toisinkirjoituskielioppi
user interface käyttöliittymä användargränssnitt Benutzeroberfläche interface utilisateur, interface opérateur
verb verbi, teonsana verb Verb verbe
vertex solmu
vocabulary sanasto
voice interface puhekäyttöliittymä
vowel vokaali vokal Vokal voyelle
word derivation sananjohto
word sense sanan alamerkitys
word sense disambiguation saneiden alamerkitysten yksiselitteistäminen
word token sane, sananmuodon esiintymä
word-form sananmuoto ordform
WordNet sanaverkko, wordnet
world knowledge arkitietämys
written language kirjoitettu kieli