Nu kommer AI-n som förstår skånska och gotländska

Att förstå svenska dialekter och skriva ut det som sägs har varit en utmaning för så kallad taligenkänning baserad på AI. Men nu finns en ny AI-modell, specialtränad på svenska. Lyssna på alla avsnitt i Sveriges Radio Play. Den nya taligenkänningsmodellen, som kallas KB-Whisper, har fått träna på 50 000 timmar inspelat svenskt tal som det finns text till. Inspelningarna kommer från riksdagen, SVT och Institutet för språk och folkminnen, ISOF, och innehåller både ett antal dialekter och knepiga termer.Leonora Vesterbacka, senior data scientist på KBLab på Kungliga biblioteket har varit med och tagit fram den nya modellen, och med hennes hjälp testar vi hur bra den fungerar på svenska dialekter. Hon berättar också vad AI:n än så länge har svårt att klara av.Medverkande: Leonora Vesterbacka, senior data scientist på KBLab på Kungliga biblioteket; Anette Torensjö, chef för avdelningen för arkiv och forskning på Institutet för språk och folkminnen, ISOF.Här går KB-Whisper att ladda ner. Obs att den kräver viss förkunskap för att använda.Här är ISOF:s arkiv Folke med ljudinspelningar och nedskrifter från hela landet.Här finns några av de dialektinspelningar som hörs i programmet och många andra.Reporter: Björn Gunérbjorn.guner@sr.seProducent: Lars Broströmlars.broström@sr.se

Om Podcasten

Upptäck ny forskning och fascinerande program om vetenskap med Sveriges Radios skarpaste vetenskapsjournalister. 20 minuter – varje vardag. Lyssna på alla avsnitt i Sveriges Radio Play. Ansvarig utgivare: Magnus Gylje