Découvrez les nouvelles fonctionnalités de la version 4.0.

ParTree - Parallel Treebanks: A multilingual corpus of movie subtitles.

Ref. 2253

Aperçu du jeu de données

Titre du jeu de données

ParTree - Parallel Treebanks: A multilingual corpus of movie subtitles.

DOI canonique

Permet de citer l’ensemble du jeu de données, peu importe les mises à jour.

https://doi.org/10.48656/zjzp-gj69

DOI

Permet de citer une version spécifique du jeu de données.

https://doi.org/10.48656/5mz4-x435

Langue de description du jeu de données

Anglais

URL du jeu de données

-

Disponibilité des données

-

Description du jeu de données

A multilingual corpus of movie subtitles aligned on the sentence-level. Contains data on more than 50 languages with a focus on the Indo-European language family. Morphosyntactic annotation (part-of-speech, features, dependencies) in Universal Dependency-style is available for 47 languages.

Remarques sur la documentation

-

Numéro de la version

1.0

Date de fin de l’embargo

31.12.2023

Date de publication

21.03.2023

Notes sur la version

-

Citation bibliographique

Ebert, C., Levshina, N., & Widmer, P. (2023). ParTree - Parallel Treebanks: A multilingual corpus of movie subtitles. (Version 1.0.0) [Data set]. LaRS - Language Repository of Switzerland. https://doi.org/10.48656/5mz4-x435

Hash MD5 du DIP

4ad59f799658261db407bf7c62c92422

Contenu du jeu de données

swissubase_2253_1_0.zip
documentation.pdf