Comp Ling Terms

This is a list of terms used in natural language processing from the University of Helsinki Department of General Linguistics. Terms are translated into five languages (English, Finnish, Swedish, German, and French). Here is a link to the original list.

Terms and concepts of language technology

English (eng)Finnish (fin)Swedish (swe)German (deu)French (fra)
 SuomiSvenskDeutschfrançais
active chart parsing aktiivinen taulukkojäsennys      
active edge aktiivinen kaari      
acyclic graph syklitön verkko, (syklitön graafi)      
adjective adjektiivi adjektiv Adjektiv adjectif
affix affiksi affix Affix affixe
agenda jäljellä olevien tehtävien luettelo      
agglutinating language agglutinoiva kieli agglutinerande språk agglutinierende Sprache langue agglutinante
alignment kohdistus      
allomorph allomorfi allomorf Allomorph allomorphe
alphabet aakkosto alfabet Alphabet alphabet
ambiguity moniselitteisyys mångtydighet, flertydighet, ambiguitet, dubbeltydighet, tvetydighet Mehrdeutigkeit ambiguïté
annotation annotointi, varustaminen (kieliopillisilla) koodeilla annotering    
any symbol mikä tahansa merkki      
application sovellus tillämpning, applikation    
assisted avusteinen stödd   assisté par
attribute attribuutti, ominaisuus      
attribute value pair attribuutti - arvo pari      
augmented transition network (ATN) täydennetty rekursiivinen tilasiirtymäverkko      
authorship attribution kirjoittajan tunnistaminen      
backtracking peruutus      
bleeding vuotaminen      
bottom-up parsing kokoava jäsentäminen      
bound morpheme sidonnainen morfeemi bundet morfem gebundenes Morphem morphème lié
breadth-first (search or parsing) leveyssuuntainen (haku tai jäsennys)      
cartesian product karteesinen tulo kartesisk produkt Kartesisches Produkt produit cartésien
case sija kasus Kasus cas
categorial grammar kategoriakielioppi      
category kategoria      
chart taulukko      
chart parsing taulukkojäsennys      
Chomsky hierarchy Chomskyn hierarkia      
chunk pätkä      
chunk parsing pätkäjäsennys      
circumfix sirkumfiksi cirkumfix   circumfixe
clause lause sats   proposition
clitic particle liitepartikkeli enklitisk partikel   particule enclitique
closed class, closed category umpiluokka      
cluster ryväs      
clusterning ryvästys, ryhmittely      
collocation myötäesiintymä, kollokaatio kollokation    
competence kompetenssi kompetens, förmåga    
complement komplementti komplement, fyllnadsled    
composition (of transducers) yhdistäminen (transduktorien yhdistäminen)      
compositionality kompositionaalisuus      
compound word yhdyssana      
computational complexity laskennallinen vaativuus, laskennallinen kompleksisuus      
computational linguistics tietokonelingvistiikka datalingvistik, datorlingvistik    
computer tietokone dator   ordinateur
computer-assisted language learning, CALL tietokoneavusteinen kielen oppiminen datorstödd språkinlärning   enseignement assistée par ordinateur
concatenation peräkkäinasettelu, (konkatenaatio)      
concordance konkordanssi      
conjunction konjunktio      
consonant konsonantti      
context ympäristö      
context-free grammar yhteydetön kielioppi, (kontekstista riippumaton kielioppi), (yhteydestä riippumaton kielioppi)      
context-sensitive grammar yhteysherkkä kielioppi, (kontekstista riippuva kielioppi)      
coordination rinnastus, koordinaatio      
corpus korpus      
crowdsourcing talkoistaminen      
data structure tietorakenne      
default value oletusarvo      
definite clause grammar (DCG) DCG-kielioppi      
dependency grammar dependenssikielioppi      
depth-first (search or parsing) syvyyssuuntainen (haku tai jäsennys)      
determinism determinismi      
deterministic finite-state automaton (FSA), deterministic finite-state machine (FSM) deterministinen äärellinen automaatti ändlig automat    
determinization (of an automaton) determinisointi (automaatin determinisointi)      
dialect murre dialekt Dialekt dialecte
dialogue keskustelu, dialogi dialog Dialog dialogue
dictionary sanakirja      
digit numeromerkki sifferkod    
directed acyclic graph (DAG) suunnattu syklitön verkko (DAG)      
directed graph suunnattu verkko, (suunnattu graafi)      
disambiguation yksiselitteistäminen disambiguering   désambiguïsation
discovery procedure keksimismenetelmä upptäcktsprocedur   procédure de découverte
distance etäisyys      
document classification dokumenttien luokittelu dokumentklassificering    
dotted rule pisteellä varustettu toisinkirjoitussääntö      
dynamic programming dynaaminen optimointi      
edge kaari      
element alkio element Element élément
empty set, void set tyhjä joukko tom mängd leere Menge ensemble vide
entry merkintä      
epsilon-transition epsilon-siirtymä, tyhjä siirtymä      
expert system asiantuntijajärjestelmä      
expression (in a formal system) lauseke (formaalissa järjestelmässä)      
expression (in natural language) ilmaus      
feeding syöttäminen      
final state lopputila      
finite state machine, FSM äärellinen automaatti      
finite state transducer, FST äärellinen transduktori finit transduktor    
formal language formaali kieli formellt språk   langage formel
free morpheme vapaa morfeemi fritt morfem   morphème libre
functionality funktionaalisuus      
gender suku      
generalization generalisaatio      
generation generointi, tuottaminen      
GPSG, generalized phrase structure grammar GPSG, yleistetty lausekerakennekielioppi      
grammar checking kieliopillisuuden tarkistaminen      
grammatical word kieliopillinen sana formord, funktionsord, grammatiskt ord    
graph verkko      
head pääsana, pääkonstituentti      
hidden Markov model, HMM Markovin piilomalli dold Markovmodell   modèle de Markov caché
hyperonyme hyperonyymi, yläkäsite      
hypertext hyperteksti      
hyphenation tavutus avstavning    
hyponyme hyponyymi, alakäsite      
idiolect idiolekti      
index term indeksitermi indexterm    
indexing indeksointi indexering    
inference inferenssi, päättely      
infix infiksi infix   infixe
inflection taipuminen, taivutus böjning   flexion
information extraction, IE tiedon eristäminen      
information retrieval tiedonhaku informationssökning    
inheritance periminen      
input syöte      
interactive vuorovaikutteinen interaktiv   interactif
intersection leikkaus intersektion, skärningspunkt Durchschnitt  
intonation intonaatio, sävelkulku      
isolating language isoloiva kieli analytiskt språk, isolerande språk isolierende Sprache langue analytique
iteration toisto      
Kleene star Kleenen tähti Kleene-stjärna Kleene-Stern étoile de Kleene
Kleene-plus Kleenen plus      
knowledge tietämys      
language acquisition kielenoppiminen språkinlärning    
language planning and maintenance kielenhuolto språkvård    
language resource kielivarat      
language technology, human language technology kieliteknologia språkteknologi    
lattice hila      
left recursive rule vasemmalle rekusriivinen sääntö      
lemma lemma lemma Lemma lemme
lexeme hakusana, lekseemi lexem Lexeme lexème
lexicon leksikko      
loan word lainasana lånord    
machine translation, MT konekäännös      
machine-aided translation tietokoneavusteinen kielen kääntäminen      
mapping, function kuvaus, funktio mappning    
mark-up merkkaus uppmärkning    
Markov model Markovin malli Markovmodell Markovmodell modèle de Markov
meaning merkitys      
measure mitta mått    
minimization (of an automaton) minimointi (automaatin mimimointi)      
modify määrittää      
morph morfi morf Morph morphe
morpheme morfeemi morfem Morphem morphème
morphophoneme morfofoneemi morfofonem Morphophonem Morphophonème
morphophonemic representation morfofoneeminen esitysmuoto      
morphotactics morfotaksi morfotax    
multilingual monikielinen flerspråkig   multilingue, plurilingue
mutual information keskinäinen informaatio      
named entity nimetty kohde      
natural number luonnollinen luku naturligt tal natürliche Zahl nombre naturel
neologism uudissana      
network verkko      
node, vertex solmu      
nondeterministic automaton epädeterministinen automaatti icke-deterministisk automat    
nonterminal symbol, meta symbol välikesymboli      
noun substantiivi substantiv Substantiv nom
null string, epsilon tyhjä merkkijono, epsilon tom sträng, epsilon    
number luku numerus   nombre
operator operaattori      
optimization, programming(2) optimointi      
other symbol muu merkki      
outlier poikkeava havainto      
output tuloste      
overgeneration yligenerointi      
paradigm muotosarja, paradigma paradigm   paradigme
parser jäsennin parser   parseur
parsing jäsentäminen parsning   analyse, parsage
part of speech sanaluokka      
part of speech tag sanaluokkakoodi, sanaluokkaleima      
part of speech tagging sanaluokkajäsennys      
pause tauko      
phoneme foneemi      
phrase lauseke      
pitch äänenkorkeus      
polysynthetic language, incorporating language polysynteettinen kieli, inkorporoiva kieli polysyntetiskt språk   langue incorporante, langue polysynthétique
possessive suffix omistusliite, possessiivisuffiksi possessivsuffix   suffixe possessif
postposition postpositio      
precision tarkkuus precision    
prefix prefiksi, etuliite förstavelse, prefix   préfixe
preposition prepositio      
pushdown automaton pinoautomaatti      
recall saanti täckning    
recognition tunnistaminen igenkänning    
recognize tunnistaa      
recursive rekursiivinen      
recursive transition network rekursiivinen tilasiirtymäverkko      
regular expression säännöllinen lauseke regulärt uttryck   expression rationelle, expression régulière
regular grammar säännöllinen kielioppi      
regular set, regular language säännöllinen joukko, säännöllinen kieli      
relation relaatio relation   relation
representation esitysmuoto      
rewrite grammar toisinkirjoituskielioppi      
rewrite rule toisinkirjoitussääntö omskrivningsregel    
robust robusti, vakaa, (vankka?) robust    
root morpheme, root juurimorfeemi, juuri rotmorfem, rot    
rounded vowel pyöreä vokaali rundad vokal   voyelle arrondie, voyelle labialisée
script komentosarja      
search stem hakuvartalo      
sense alamerkitys betydelse    
sentence virke mening   phrase
sequentiality sekventiaalisuus      
set joukko mängd   ensemble
source language lähtökieli      
space välilyönti      
spectrogram spektrogrammi      
spectrum spektri      
speech puhe tal   parole
speech interface puhekäyttöliittymä talgränssnitt    
speech recognition puheentunnistus taligenkänning Spracherkennung reconnaissance vocale
speech synthesis, text-to-speech puhesynteesi talsyntes Sprachsynthese synthèse de la parole
spelling checking oikeinkirjoituksen tarkistus stavningskontroll    
spelling correction oikeinkirjoituksen korjaus      
spoken language puhuttu kieli      
start state alkutila starttillstånd    
state tila tillstånd    
stem (of a word) vartalo, (sanan vartalo) ordstam   radical
stem, truncated word tyvi      
stemming typistäminen trunkering, stemming    
stop word hukkasana      
stress paino      
string merkkijono sträng    
subject subjekti      
suffix suffiksi, pääte suffix, ändelse   suffixe
summary tiivistelmä sammanfattning, sammandrag    
surface character pintamerkki      
surface form pintamuoto      
synonym synonyymi      
synonym set; synset synonyymiryhmä      
syntactic parser lauseenjäsennin, syntaktinen jäsennin      
tag tarra tagg    
tag merkki; leima tagg    
target language kohdekieli      
template malline, sapluuna mall    
term termi term   terme
terminal symbol päätesymboli      
terminology terminologia      
text teksti      
tokenise saneistaa tokenisera    
top-down parsing produsoiva jäsentäminen      
transfer model transfer-malli      
transition siirtymä, tilasiirtymä övergång    
translation kääntäminen (kielen k.) översättning   traduction
translation memory käännösmuisti      
translator kääntäjä översättare   traducteur
two-level morphology kaksitasomorfologia tvånivåmorfologi    
two-level rule kaksitasosääntö tvånivåregel    
unambiguous yksiselitteinen entydig, otvetydig    
unification unifikaatio, samaistus      
union yhdiste, unioni föreningsmängd, union    
unrestricted rewrite grammar rajoittamaton toisinkirjoituskielioppi      
user interface käyttöliittymä användargränssnitt Benutzeroberfläche interface utilisateur, interface opérateur
verb verbi, teonsana verb Verb verbe
vertex solmu      
vocabulary sanasto      
voice interface puhekäyttöliittymä      
vowel vokaali vokal Vokal voyelle
word derivation sananjohto      
word sense sanan alamerkitys      
word sense disambiguation saneiden alamerkitysten yksiselitteistäminen      
word token sane, sananmuodon esiintymä      
word-form sananmuoto ordform    
WordNet sanaverkko, wordnet      
world knowledge arkitietämys      
written language kirjoitettu kieli