Pressemeddelelse

tir, 21 mar 2023

Nyt storstilet projekt skal bringe dansk taleteknologi i front

Nyt storstilet projekt skal bringe dansk taleteknologi i front

Pressemeddelelse

21.3.2023 09:08:23 CET | Alexandra Instituttet

Teknologi, der kan forstå og gengive talt sprog, er i voldsom vækst, men det danske sprog er for småt et marked til, at private virksomheder alene kan drive udviklingen af teknologien. Derfor bevilliger Innovationsfonden 14 mio. kroner til et projekt, der skal bringe dansk taleteknologi op på internationalt niveau i løbet af de næste to år.

Det globale marked for taleteknologi vil vokse med 16-19 procent årligt de næste fem år, viser undersøgelser fra blandt andet Fortune Business Insights. Desværre halter det danske marked i øjeblikket bagud, fordi det er for ressourcekrævende at udvikle dansk taleteknologi for den enkelte virksomhed. 

Det er ærgerligt, fordi dansk erhvervsliv går glip af god forretning, og samfundet snydes for innovative løsninger, der for eksempel kan anvendes i hjælpemidler til ældre og borgere med synshandicap eller effektiviseringer i det offentlige. Det skal et nyt forsknings- og innovationssamarbejde mellem Alvenir, Corti, Digitaliseringsstyrelsen, Københavns Universitet og Alexandra Instituttet nu rette op på.

Taleteknologi skal gøres tilgængelig for alle 

Projektet skal udvikle et taledatasæt med navnet Danish Conversational and read-aloud speech dataset (CoRal). Datasættet vil indeholde 1000-1500 timers samtale og oplæst tale fra et bredt og repræsentativt udsnit af befolkningen i forhold til køn, alder, danske dialekter og udenlandske accenter. Samtidig skal der udvikles sprogmodeller, der kan genkende dansk tale og læse dansk tekst højt.

I øjeblikket har dansk taleteknologi nemlig svært ved at forstå kvinder, ældre, dialekter og accenter. Og for at taleteknologi kan bruges i for eksempel voicebots og stemmestyrede hjælpemidler, er det nødvendigt, at det virker for alle borgere. Det er således ikke kun et økonomisk potentiale, der skal indfris; det er også et demokratisk deficit, der skal indhentes.

Open source gavner virksomheder og samfundet

”Taleteknologi kan skabe enorm værdi, både for dansk erhvervsliv og for vores samfund som helhed,” spår Jens Kaas Benner, Head of AI and Data Analytics Lab på Alexandra Instituttet. 

”Når vi gør danske datasæt og sprogmodeller gratis tilgængelige, bliver det pludselig let for virksomhederne at komme i gang med at udvikle og bruge løsninger, der ’forstår’ talesprog. Og det offentlige kan blive aflastet, når for eksempel dokumentation og sundhedsjournaler kan automatiseres,” siger han.

Alle data og modeller bliver testet og offentliggjort løbende, så udviklere, virksomheder og offentlige institutioner kan drage nytte af dem fra start. Alexandra Instituttet står sammen med Digitaliseringsstyrelsen i første omgang for rekrutteringen af talere fra hele landet og opfordrer især kvinder, ældre og borgere, der taler med accent eller dialekt til at melde sig. Bred rekruttering af talere er nemlig en forudsætning for projektets succes.

Fakta: Hvad kan træfsikker dansk taleteknologi bruges til?

  • Stemmestyrede hjælpemidler til f.eks. ældre, borgere med synshandicap eller særlige behov
  • Diktat af sundhedsjournaler eller automatisk dokumentation af samtaler med borgere/kunder
  • Voice-/chatbots til bl.a. it-hjælp som nulstilling af passwords, navigation på hjemmesider, etc. 
  • Bedre maskinoversættelse mellem dansk og andre sprog
  • Bedre digital oplæsning i f.eks. GPS eller i offentlig transport
  • Beslutningsstøtte med relevant viden til medarbejdere

Om partnerne

Alexandra Instituttet er Danmarks eneste Godkendte Teknologiske Service-institut specialiseret i IT og digitalisering. Instituttet er sat i verden for at sikre, at de nyeste digitale teknologier bliver gjort tilgængelige for dansk erhvervsliv og det danske samfund som helhed.

Alvenir er en dansk spin-out virksomhed fra DTU som arbejder domænespecialiseret talegenkendelse til b.la. dokumentation af finansielle rådgivningssamtaler. Derudover spiller Alvenir en aktiv rolle i det danske open-source-miljø, og har siden virksomhedens stiftelse bidraget med både sprogmodeller og dataressourcer. 

Corti er en dansk virksomhed, der har udviklet tale-, lyd-, og tekstbaseret AI-software til at assistere patientbehandling og dokumentation i sundhedssektoren. Med den banebrydende AI-software nedbringer Corti tiden samt højner kvaliteten af den enkelte patientinteraktion. Cortis software nærmer sig 100 millioner interaktioner om året i Skandinavien og engelsktalende lande, primært USA.

Datalogisk Institut på Københavns Universitet (DIKU) er Danmarks ældste og førende datalogiske institut. DIKU forsker og underviser inden for de tre hjørner af datalogi – algoritmer, mennesker og data – og instituttet deltager aktivt i udviklingen af teknologisk innovation i samfundet gennem en lang række samarbejder.

Digitaliseringsstyrelsen udformer og implementerer digitaliseringsinitiativer i den offentlige sektor. Styrelsen understøtter effektivitet og fleksible digitale services via løsninger til borgere, private virksomheder og offentlige myndigheder. For at understøtte udviklingen af danske sprogteknologiske løsninger, så har regeringen, KL og Danske Regioner udviklet sprogteknologi.dk, som skal give let adgang til danske sprogressourcer.  

Andre læser også

Over 50.000 har besvaret spørgeskema om nye pengesedler Frem til 2. juni kan danskerne vurdere de udvalgte motiver til ny seddelserie og... Læs mere
Støjberg og Løkke bruges som es på EU-plakater Danmarksdemokraterne og Moderaterne bruger deres ledere i jagten på vælgere ti... Læs mere
Midt i sponsorflugt holder 7-Eleven fast i støtte til Pride på 11. år Fredag har Copenhagen Pride offentliggjort den første runde partnerskaber for i... Læs mere
Forsker: Troldefabrikker er nem politisk kommunikation Svensk parti beskyldes for at sprede misinformation via sociale profiler. Nem og... Læs mere
Minister om nej til fængsel i Kosovo: Et lille bump på vejen Regeringen i Kosovo må få sikret flertal for aftale om dansk leje af fængsels... Læs mere