- Descriptif :
Ressources de modélisation du langage à utiliser conjointement avec le corpus LibriSpeech ASR.
Page d'accueil : http://www.openslr.org/11
Code source :
tfds.datasets.librispeech_lm.Builder
Versions :
-
0.1.0
(par défaut) : aucune note de version.
-
Taille du téléchargement :
1.40 GiB
Taille du jeu de données :
4.62 GiB
Mise en cache automatique ( documentation ): Non
Fractionnements :
Diviser | Exemples |
---|---|
'train' | 40 418 260 |
- Structure des fonctionnalités :
FeaturesDict({
'text': Text(shape=(), dtype=string),
})
- Documentation des fonctionnalités :
Caractéristique | Classer | Forme | Dtype | La description |
---|---|---|---|---|
FonctionnalitésDict | ||||
texte | Texte | chaîne de caractères |
Touches supervisées (Voir
as_supervised
doc ):('text', 'text')
Figure ( tfds.show_examples ) : non pris en charge.
Exemples ( tfds.as_dataframe ):
- Citation :
@inproceedings{panayotov2015librispeech,
title={Librispeech: an ASR corpus based on public domain audio books},
author={Panayotov, Vassil and Chen, Guoguo and Povey, Daniel and Khudanpur, Sanjeev},
booktitle={Acoustics, Speech and Signal Processing (ICASSP), 2015 IEEE International Conference on},
pages={5206--5210},
year={2015},
organization={IEEE}
}