This is a list of terms used in natural language processing from the University of Helsinki Department of General Linguistics. Terms are translated into five languages (English, Finnish, Swedish, German, and French). Here is a link to the original list.
Terms and concepts of language technology
English (eng) | Finnish (fin) | Swedish (swe) | German (deu) | French (fra) |
---|---|---|---|---|
Suomi | Svensk | Deutsch | français | |
active chart parsing | aktiivinen taulukkojäsennys | |||
active edge | aktiivinen kaari | |||
acyclic graph | syklitön verkko, (syklitön graafi) | |||
adjective | adjektiivi | adjektiv | Adjektiv | adjectif |
affix | affiksi | affix | Affix | affixe |
agenda | jäljellä olevien tehtävien luettelo | |||
agglutinating language | agglutinoiva kieli | agglutinerande språk | agglutinierende Sprache | langue agglutinante |
alignment | kohdistus | |||
allomorph | allomorfi | allomorf | Allomorph | allomorphe |
alphabet | aakkosto | alfabet | Alphabet | alphabet |
ambiguity | moniselitteisyys | mångtydighet, flertydighet, ambiguitet, dubbeltydighet, tvetydighet | Mehrdeutigkeit | ambiguïté |
annotation | annotointi, varustaminen (kieliopillisilla) koodeilla | annotering | ||
any symbol | mikä tahansa merkki | |||
application | sovellus | tillämpning, applikation | ||
assisted | avusteinen | stödd | assisté par | |
attribute | attribuutti, ominaisuus | |||
attribute value pair | attribuutti – arvo pari | |||
augmented transition network (ATN) | täydennetty rekursiivinen tilasiirtymäverkko | |||
authorship attribution | kirjoittajan tunnistaminen | |||
backtracking | peruutus | |||
bleeding | vuotaminen | |||
bottom-up parsing | kokoava jäsentäminen | |||
bound morpheme | sidonnainen morfeemi | bundet morfem | gebundenes Morphem | morphème lié |
breadth-first (search or parsing) | leveyssuuntainen (haku tai jäsennys) | |||
cartesian product | karteesinen tulo | kartesisk produkt | Kartesisches Produkt | produit cartésien |
case | sija | kasus | Kasus | cas |
categorial grammar | kategoriakielioppi | |||
category | kategoria | |||
chart | taulukko | |||
chart parsing | taulukkojäsennys | |||
Chomsky hierarchy | Chomskyn hierarkia | |||
chunk | pätkä | |||
chunk parsing | pätkäjäsennys | |||
circumfix | sirkumfiksi | cirkumfix | circumfixe | |
clause | lause | sats | proposition | |
clitic particle | liitepartikkeli | enklitisk partikel | particule enclitique | |
closed class, closed category | umpiluokka | |||
cluster | ryväs | |||
clusterning | ryvästys, ryhmittely | |||
collocation | myötäesiintymä, kollokaatio | kollokation | ||
competence | kompetenssi | kompetens, förmåga | ||
complement | komplementti | komplement, fyllnadsled | ||
composition (of transducers) | yhdistäminen (transduktorien yhdistäminen) | |||
compositionality | kompositionaalisuus | |||
compound word | yhdyssana | |||
computational complexity | laskennallinen vaativuus, laskennallinen kompleksisuus | |||
computational linguistics | tietokonelingvistiikka | datalingvistik, datorlingvistik | ||
computer | tietokone | dator | ordinateur | |
computer-assisted language learning, CALL | tietokoneavusteinen kielen oppiminen | datorstödd språkinlärning | enseignement assistée par ordinateur | |
concatenation | peräkkäinasettelu, (konkatenaatio) | |||
concordance | konkordanssi | |||
conjunction | konjunktio | |||
consonant | konsonantti | |||
context | ympäristö | |||
context-free grammar | yhteydetön kielioppi, (kontekstista riippumaton kielioppi), (yhteydestä riippumaton kielioppi) | |||
context-sensitive grammar | yhteysherkkä kielioppi, (kontekstista riippuva kielioppi) | |||
coordination | rinnastus, koordinaatio | |||
corpus | korpus | |||
crowdsourcing | talkoistaminen | |||
data structure | tietorakenne | |||
default value | oletusarvo | |||
definite clause grammar (DCG) | DCG-kielioppi | |||
dependency grammar | dependenssikielioppi | |||
depth-first (search or parsing) | syvyyssuuntainen (haku tai jäsennys) | |||
determinism | determinismi | |||
deterministic finite-state automaton (FSA), deterministic finite-state machine (FSM) | deterministinen äärellinen automaatti | ändlig automat | ||
determinization (of an automaton) | determinisointi (automaatin determinisointi) | |||
dialect | murre | dialekt | Dialekt | dialecte |
dialogue | keskustelu, dialogi | dialog | Dialog | dialogue |
dictionary | sanakirja | |||
digit | numeromerkki | sifferkod | ||
directed acyclic graph (DAG) | suunnattu syklitön verkko (DAG) | |||
directed graph | suunnattu verkko, (suunnattu graafi) | |||
disambiguation | yksiselitteistäminen | disambiguering | désambiguïsation | |
discovery procedure | keksimismenetelmä | upptäcktsprocedur | procédure de découverte | |
distance | etäisyys | |||
document classification | dokumenttien luokittelu | dokumentklassificering | ||
dotted rule | pisteellä varustettu toisinkirjoitussääntö | |||
dynamic programming | dynaaminen optimointi | |||
edge | kaari | |||
element | alkio | element | Element | élément |
empty set, void set | tyhjä joukko | tom mängd | leere Menge | ensemble vide |
entry | merkintä | |||
epsilon-transition | epsilon-siirtymä, tyhjä siirtymä | |||
expert system | asiantuntijajärjestelmä | |||
expression (in a formal system) | lauseke (formaalissa järjestelmässä) | |||
expression (in natural language) | ilmaus | |||
feeding | syöttäminen | |||
final state | lopputila | |||
finite state machine, FSM | äärellinen automaatti | |||
finite state transducer, FST | äärellinen transduktori | finit transduktor | ||
formal language | formaali kieli | formellt språk | langage formel | |
free morpheme | vapaa morfeemi | fritt morfem | morphème libre | |
functionality | funktionaalisuus | |||
gender | suku | |||
generalization | generalisaatio | |||
generation | generointi, tuottaminen | |||
GPSG, generalized phrase structure grammar | GPSG, yleistetty lausekerakennekielioppi | |||
grammar checking | kieliopillisuuden tarkistaminen | |||
grammatical word | kieliopillinen sana | formord, funktionsord, grammatiskt ord | ||
graph | verkko | |||
head | pääsana, pääkonstituentti | |||
hidden Markov model, HMM | Markovin piilomalli | dold Markovmodell | modèle de Markov caché | |
hyperonyme | hyperonyymi, yläkäsite | |||
hypertext | hyperteksti | |||
hyphenation | tavutus | avstavning | ||
hyponyme | hyponyymi, alakäsite | |||
idiolect | idiolekti | |||
index term | indeksitermi | indexterm | ||
indexing | indeksointi | indexering | ||
inference | inferenssi, päättely | |||
infix | infiksi | infix | infixe | |
inflection | taipuminen, taivutus | böjning | flexion | |
information extraction, IE | tiedon eristäminen | |||
information retrieval | tiedonhaku | informationssökning | ||
inheritance | periminen | |||
input | syöte | |||
interactive | vuorovaikutteinen | interaktiv | interactif | |
intersection | leikkaus | intersektion, skärningspunkt | Durchschnitt | |
intonation | intonaatio, sävelkulku | |||
isolating language | isoloiva kieli | analytiskt språk, isolerande språk | isolierende Sprache | langue analytique |
iteration | toisto | |||
Kleene star | Kleenen tähti | Kleene-stjärna | Kleene-Stern | étoile de Kleene |
Kleene-plus | Kleenen plus | |||
knowledge | tietämys | |||
language acquisition | kielenoppiminen | språkinlärning | ||
language planning and maintenance | kielenhuolto | språkvård | ||
language resource | kielivarat | |||
language technology, human language technology | kieliteknologia | språkteknologi | ||
lattice | hila | |||
left recursive rule | vasemmalle rekusriivinen sääntö | |||
lemma | lemma | lemma | Lemma | lemme |
lexeme | hakusana, lekseemi | lexem | Lexeme | lexème |
lexicon | leksikko | |||
loan word | lainasana | lånord | ||
machine translation, MT | konekäännös | |||
machine-aided translation | tietokoneavusteinen kielen kääntäminen | |||
mapping, function | kuvaus, funktio | mappning | ||
mark-up | merkkaus | uppmärkning | ||
Markov model | Markovin malli | Markovmodell | Markovmodell | modèle de Markov |
meaning | merkitys | |||
measure | mitta | mått | ||
minimization (of an automaton) | minimointi (automaatin mimimointi) | |||
modify | määrittää | |||
morph | morfi | morf | Morph | morphe |
morpheme | morfeemi | morfem | Morphem | morphème |
morphophoneme | morfofoneemi | morfofonem | Morphophonem | Morphophonème |
morphophonemic representation | morfofoneeminen esitysmuoto | |||
morphotactics | morfotaksi | morfotax | ||
multilingual | monikielinen | flerspråkig | multilingue, plurilingue | |
mutual information | keskinäinen informaatio | |||
named entity | nimetty kohde | |||
natural number | luonnollinen luku | naturligt tal | natürliche Zahl | nombre naturel |
neologism | uudissana | |||
network | verkko | |||
node, vertex | solmu | |||
nondeterministic automaton | epädeterministinen automaatti | icke-deterministisk automat | ||
nonterminal symbol, meta symbol | välikesymboli | |||
noun | substantiivi | substantiv | Substantiv | nom |
null string, epsilon | tyhjä merkkijono, epsilon | tom sträng, epsilon | ||
number | luku | numerus | nombre | |
operator | operaattori | |||
optimization, programming(2) | optimointi | |||
other symbol | muu merkki | |||
outlier | poikkeava havainto | |||
output | tuloste | |||
overgeneration | yligenerointi | |||
paradigm | muotosarja, paradigma | paradigm | paradigme | |
parser | jäsennin | parser | parseur | |
parsing | jäsentäminen | parsning | analyse, parsage | |
part of speech | sanaluokka | |||
part of speech tag | sanaluokkakoodi, sanaluokkaleima | |||
part of speech tagging | sanaluokkajäsennys | |||
pause | tauko | |||
phoneme | foneemi | |||
phrase | lauseke | |||
pitch | äänenkorkeus | |||
polysynthetic language, incorporating language | polysynteettinen kieli, inkorporoiva kieli | polysyntetiskt språk | langue incorporante, langue polysynthétique | |
possessive suffix | omistusliite, possessiivisuffiksi | possessivsuffix | suffixe possessif | |
postposition | postpositio | |||
precision | tarkkuus | precision | ||
prefix | prefiksi, etuliite | förstavelse, prefix | préfixe | |
preposition | prepositio | |||
pushdown automaton | pinoautomaatti | |||
recall | saanti | täckning | ||
recognition | tunnistaminen | igenkänning | ||
recognize | tunnistaa | |||
recursive | rekursiivinen | |||
recursive transition network | rekursiivinen tilasiirtymäverkko | |||
regular expression | säännöllinen lauseke | regulärt uttryck | expression rationelle, expression régulière | |
regular grammar | säännöllinen kielioppi | |||
regular set, regular language | säännöllinen joukko, säännöllinen kieli | |||
relation | relaatio | relation | relation | |
representation | esitysmuoto | |||
rewrite grammar | toisinkirjoituskielioppi | |||
rewrite rule | toisinkirjoitussääntö | omskrivningsregel | ||
robust | robusti, vakaa, (vankka?) | robust | ||
root morpheme, root | juurimorfeemi, juuri | rotmorfem, rot | ||
rounded vowel | pyöreä vokaali | rundad vokal | voyelle arrondie, voyelle labialisée | |
script | komentosarja | |||
search stem | hakuvartalo | |||
sense | alamerkitys | betydelse | ||
sentence | virke | mening | phrase | |
sequentiality | sekventiaalisuus | |||
set | joukko | mängd | ensemble | |
source language | lähtökieli | |||
space | välilyönti | |||
spectrogram | spektrogrammi | |||
spectrum | spektri | |||
speech | puhe | tal | parole | |
speech interface | puhekäyttöliittymä | talgränssnitt | ||
speech recognition | puheentunnistus | taligenkänning | Spracherkennung | reconnaissance vocale |
speech synthesis, text-to-speech | puhesynteesi | talsyntes | Sprachsynthese | synthèse de la parole |
spelling checking | oikeinkirjoituksen tarkistus | stavningskontroll | ||
spelling correction | oikeinkirjoituksen korjaus | |||
spoken language | puhuttu kieli | |||
start state | alkutila | starttillstånd | ||
state | tila | tillstånd | ||
stem (of a word) | vartalo, (sanan vartalo) | ordstam | radical | |
stem, truncated word | tyvi | |||
stemming | typistäminen | trunkering, stemming | ||
stop word | hukkasana | |||
stress | paino | |||
string | merkkijono | sträng | ||
subject | subjekti | |||
suffix | suffiksi, pääte | suffix, ändelse | suffixe | |
summary | tiivistelmä | sammanfattning, sammandrag | ||
surface character | pintamerkki | |||
surface form | pintamuoto | |||
synonym | synonyymi | |||
synonym set; synset | synonyymiryhmä | |||
syntactic parser | lauseenjäsennin, syntaktinen jäsennin | |||
tag | tarra | tagg | ||
tag | merkki; leima | tagg | ||
target language | kohdekieli | |||
template | malline, sapluuna | mall | ||
term | termi | term | terme | |
terminal symbol | päätesymboli | |||
terminology | terminologia | |||
text | teksti | |||
tokenise | saneistaa | tokenisera | ||
top-down parsing | produsoiva jäsentäminen | |||
transfer model | transfer-malli | |||
transition | siirtymä, tilasiirtymä | övergång | ||
translation | kääntäminen (kielen k.) | översättning | traduction | |
translation memory | käännösmuisti | |||
translator | kääntäjä | översättare | traducteur | |
two-level morphology | kaksitasomorfologia | tvånivåmorfologi | ||
two-level rule | kaksitasosääntö | tvånivåregel | ||
unambiguous | yksiselitteinen | entydig, otvetydig | ||
unification | unifikaatio, samaistus | |||
union | yhdiste, unioni | föreningsmängd, union | ||
unrestricted rewrite grammar | rajoittamaton toisinkirjoituskielioppi | |||
user interface | käyttöliittymä | användargränssnitt | Benutzeroberfläche | interface utilisateur, interface opérateur |
verb | verbi, teonsana | verb | Verb | verbe |
vertex | solmu | |||
vocabulary | sanasto | |||
voice interface | puhekäyttöliittymä | |||
vowel | vokaali | vokal | Vokal | voyelle |
word derivation | sananjohto | |||
word sense | sanan alamerkitys | |||
word sense disambiguation | saneiden alamerkitysten yksiselitteistäminen | |||
word token | sane, sananmuodon esiintymä | |||
word-form | sananmuoto | ordform | ||
WordNet | sanaverkko, wordnet | |||
world knowledge | arkitietämys | |||
written language | kirjoitettu kieli |