What's New, Switzerland? Corpus

Ref. 2579

Aperçu du jeu de données

Titre du jeu de données

What's New, Switzerland? Corpus

DOI canonique

Permet de citer l’ensemble du jeu de données, peu importe les mises à jour.

https://doi.org/10.48656/1sbx-qr60

DOI

Permet de citer une version spécifique du jeu de données.

https://doi.org/10.48656/pa3t-xh52

Langue de description du jeu de données

Anglais

URL du jeu de données

-

Disponibilité des données

-

Description du jeu de données

The What's New, Switzerland? Corpus is a dataset of 72 authentic WhatsApp chats between 118 French-speaking users in Switzerland, collected in the framework of the "Evolving Language" NCCR. Chats were donated by users between August and October 2022. The data have been de-identified using a partly automated and partly manual workflow. Each chat is provided in two versions: an XML-TEI version (which includes extensive metadata about chats, users, and messages) and a plain text version. The dataset is available on demand for research purposes, under a restricted license contract.

Remarques sur la documentation

The documentation is included in the dataset archive both in PDF format (README.pdf) and markdown format (README.md).

Numéro de la version

1.0

Date de fin de l’embargo

-

Date de publication

19.04.2024

Notes sur la version

Version 1.0

Citation bibliographique

Xanthos, A., Gupta, P., Benkais, L., Doudot, L., & Grütter, A. (2024). What's New, Switzerland? Corpus (Version 1.0.0) [Data set]. LaRS - Language Repository of Switzerland. https://doi.org/10.48656/pa3t-xh52

Hash MD5 du DIP

c0c3bfa19c742dae5ea2f3cb717eb6f8

Contenu du jeu de données

swissubase_2579_1_0.zip
metadata.yaml