Swe-Clarins katalog

Du är här

Hem / Swe-Clarins katalog

Svensk teckenspråkskorpus

  • 24 timmar video med 42 talare. Av totalt 300 filer är drygt 70 redigerade och har glosor samt (eventuellt) svensk översättning. Dialog och monolog (berättelser). 

Svenskt teckenspråkslexikon

  • 15 200 tecken med svenskt ord, video och ämnesuppdelningar.

Swedish Internet Corpus

  • En korpus med text från svenska bloggar, manuellt annoterad med ordklasstaggar och namninformation (named entities), cirka 12 000 ord.

Swedish Blog Sentences

  • En (av upphovsrättsliga skäl) omkastad mängd meningar från svenska bloggar, automatiskt annoterad med ordklasser och namninformation (named entities). Cirka 2.7 miljarder ord totalt.

SLME

  • Språkmodell som använder Googles n-gramskorpusar, speciellt konstruerad för att effektivt kunna beräkna ordfördelningens entropi.

Automated Essay Scoring

  • Verktyg för att sätta betyg på uppsatser i svenska.

efmaral

  • Verktyg för att mycket snabbt länka ihop ord i parallella texter.

Spacos

  • Verktyg för att länka ihop ord och föra över ordklassannotation i parallella texter.

LONG-MINGLE

  • Longitudienell korpus med barnriktat tal, insamlad i en miljö med sessioner av fri lek. Korpusen består av video och ortografiska transkriptioner av audion.

Sidor