Swe-Clarins katalog

Du är här

Hem / Swe-Clarins katalog

Resurser för automatisk taligenkänning

  • Detta är en samling akustiska modeller och språkmodeller för svensk taligenkänning samt ett WaveSurfer-plugin för automatisk taligenkänning.

BirdQuest-dialoger

  • Dialogkorpus mellan användare och systemet BirdQuest, med en databas om fåglar. Finns både skriftligt och i ljudformat.

Blacklist Classifier

  • Blacklist Classifier är ett enkelt verktyg för att skilja mellan besläktade språk. Det använder en lista (= 'Blacklist') med ord som kan tränas på jämförbara korpusar. Samlingen innehåller listor för bosniska, kroatiska och serbiska.

Blast

  • BLAST är ett verktyg som förenklar annotatering av fel som uppstår efter maskinöversättning.

Car and Travel

  • Dialogkorpus insamlad med Wizard of Oz-tekniker. Två olika domäner, bilförsäljning och turistinformation.

Docent

  • Docent är en dekoder för frasbaserad statistisk maskinöversättning (SMT). Till skillnad från de flesta andra dekodrar översätter Docent hela dokumentet som en enhet i stället för att översätta varje mening för sig. Docent tillåter användning av information utöver meningsgränsen för att förenkla utvecklingen av diskursbaserade modeller för SMT.

Friendly Reader

  • Ett system för att skapa textsammanfattningar av varierande omfattning.

Gold standard for English-Swedish Europarl data (GES)

  • En referenskorpus för ordlänkning uppdelad på tränings- och testdata. Meningarna är hämtade från Europarl engelska respektive svenska delar.

Gold Standard för textsammanfattningar

  • En referenskorpus för textsammanfattningar.

Lingua-Align

  • Lingua-Align är en samling av verktyg för automatisk länkning av träd och ord i parallela korpusar.

Sidor