Swe-Clarins katalog

Du är här

Hem / Kungliga tekniska högskolan (KTH) / Swe-Clarins katalog

IrisTK

  • Java-baserat ramverk för att utveckla multimodala dialogsystem.

Spontal-Multimodal databas över spontant tal i dialog

  • Högkvalitativa ljud- och videoinspelningar av fri dialog med motion capture (120 dialoger på 30 minuter var).

Higgins Annotation Tool (HAT)

  • Higgins Annotation Tool används för att transkribera och märka upp tal med ett eller flera ljudspår (exempelvis dialog).

Resurser för automatisk taligenkänning

  • Detta är en samling akustiska modeller och språkmodeller för svensk taligenkänning samt ett WaveSurfer-plugin för automatisk taligenkänning.

Snack Sound Toolkit

  • Snack Sound Toolkit är byggt för att användas med ett skriptspråk som Tcl/Tk eller Python. Med hjälp av Snack kan du skapa kraftfulla audioprogram för flera plattformar med bara några få rader kod. Snack har kommandon för grundläggande ljudbehandling, exempelvis ljudkort och disk I/O. Viss visualisering stöds också, exempelvis vågformer och spektrogram. Verktyget är utvecklat i första hand för att hantera digitala inspelningar av tal men fungerar lika väl för ljud i allmänhet.

WaveSurfer

  • WaveSurfer är ett open-source-verktyg för visualisering och manipulation av ljud.