The Lacunae of Danish Natural Language Processing

Andreas Søeborg Kirkedal, Barbara Plank, Leon Derczynski, Natalie Schluter

Publikation: Konference artikel i Proceeding eller bog/rapport kapitelKonferencebidrag i proceedingsForskningpeer review

Abstract

Danish is a North Germanic language spoken principally in Denmark, a country with a long tradition of technological and scientific innovation. However, the language has received relatively little attention from a technological perspective. In this paper, we review Natural Language Processing (NLP) research, digital resources and tools which have been developed for Danish. We find that availability of models and tools is limited, which calls for work that lifts Danish NLP a step closer to the privileged languages. Dansk abstrakt: Dansk er et nordgermansk sprog, talt primært i kongeriget Danmark, et land med stærk tradition for teknologisk og videnskabelig innovation. Det danske sprog har imidlertid været genstand for relativt begrænset opmærksomhed, teknologisk set. I denne artikel gennemgår vi sprogteknologi-forskning, -ressourcer og -værktøjer udviklet for dansk. Vi konkluderer at der eksisterer et fåtal af modeller og værktøjer, hvilket indbyder til forskning som løfter dansk sprogteknologi i niveau med mere priviligerede sprog.
OriginalsprogEngelsk
TitelProceedings of the Nordic Conference of Computational Linguistics (2019)
ForlagLinköping University Electronic Press
Publikationsdato2019
Sider356–362
ISBN (Elektronisk)978-91-7929-995-8
StatusUdgivet - 2019
NavnNEALT (Northern European Association of Language Technology) Proceedings Series
ISSN1736-6305

Emneord

  • Danish language
  • Natural Language Processing (NLP)
  • digital resources
  • technological innovation
  • linguistic tools

Fingeraftryk

Dyk ned i forskningsemnerne om 'The Lacunae of Danish Natural Language Processing'. Sammen danner de et unikt fingeraftryk.

Citationsformater