Werfen Sie einen Blick auf die neuen Features der Version 4.0.

ParTree - Parallel Treebanks: A multilingual corpus of movie subtitles.

Ref. 2253

Datensatzübersicht

Datensatz-Titel

ParTree - Parallel Treebanks: A multilingual corpus of movie subtitles.

Kanonischer DOI

Ermöglicht das Zitieren des gesamten Datensatzes, unabhängig von Versionen.

https://doi.org/10.48656/zjzp-gj69

DOI

Ermöglicht das Zitieren einer spezifischen Datensatzversion.

https://doi.org/10.48656/5mz4-x435

Sprache der Datensatzbeschreibung

Englisch

Datensatz URL

-

Verfügbarkeit der Daten

-

Datensatzbeschreibung

A multilingual corpus of movie subtitles aligned on the sentence-level. Contains data on more than 50 languages with a focus on the Indo-European language family. Morphosyntactic annotation (part-of-speech, features, dependencies) in Universal Dependency-style is available for 47 languages.

Bemerkungen zur Dokumentation

-

Versionsnummer

1.0

Enddatum des Embargos

31.12.2023

Publikationsdatum

21.03.2023

Hinweise zur Version

-

Bibliografische Zitierung

Ebert, C., Levshina, N., & Widmer, P. (2023). ParTree - Parallel Treebanks: A multilingual corpus of movie subtitles. (Version 1.0.0) [Data set]. LaRS - Language Repository of Switzerland. https://doi.org/10.48656/5mz4-x435

MD5-Hash des DIP

4ad59f799658261db407bf7c62c92422

Inhalt des Datensatzes

swissubase_2253_1_0.zip
documentation.pdf