Swe-Clarins katalog

Du är här

Hem / Linköpings universitet / Swe-Clarins katalog

I*Link [länkningsverktyg för parallella texter]

  • I*Link är ett verktyg för att skapa länkar mellan korresponderande segment i parallella texter. Det är särskilt tänkt att användas för korrespondenser mellan ord och fraser i en källtext och deras motsvarigheter i en översättning. Systemet förutsätter att texterna delats upp i korresponderande segment av mindre storlek, lämpligen mening för mening.

BirdQuest-dialoger

  • Dialogkorpus mellan användare och systemet BirdQuest, med en databas om fåglar. Finns både skriftligt och i ljudformat.

Car and Travel

  • Dialogkorpus insamlad med Wizard of Oz-tekniker. Två olika domäner, bilförsäljning och turistinformation.

Friendly Reader

  • Ett system för att skapa textsammanfattningar av varierande omfattning.

Gold standard for English-Swedish Europarl data (GES)

  • En referenskorpus för ordlänkning uppdelad på tränings- och testdata. Meningarna är hämtade från Europarl engelska respektive svenska delar.

Gold Standard för textsammanfattningar

  • En referenskorpus för textsammanfattningar.

Linköping English-Swedish Parallel Treebank (LinES)

  • Parallellställd trädbank med dependensanalyser, delvis baserad på Linköping Translation Corpus. Meningarna är hämtade från sju olika källor, inkluderande hjälptexter, Europarl och skönlitterära texter.

Linköping Translation Corpus (LTC)

  • Parallellställd korpus med engelsk-svenska texter från olika domäner, inklusive hjälptexter och skönlitteratur.

PAT-PAR-korpus

  • En parallellkorpus bestående av patentansökningar på engelska och svenska från fem olika patentklasser.

En parallelställd korpus av lättlästa och standardsvenska myndighetstexter

  • En korpus av svenska myndighetstexter parallellställda med tre olika metoder