librispeech_lm

Descriptif :

Ressources de modélisation du langage à utiliser conjointement avec le corpus LibriSpeech ASR.

Page d'accueil : http://www.openslr.org/11
Code source : tfds.datasets.librispeech_lm.Builder
Versions :
- 0.1.0 (par défaut) : aucune note de version.
Taille du téléchargement : 1.40 GiB
Taille du jeu de données : 4.62 GiB
Mise en cache automatique ( documentation ): Non
Fractionnements :

Diviser	Exemples
`'train'`	40 418 260

Structure des fonctionnalités :

FeaturesDict({
    'text': Text(shape=(), dtype=string),
})

Documentation des fonctionnalités :

Caractéristique	Classer	Forme	Dtype	La description
	FonctionnalitésDict
texte	Texte		chaîne de caractères

Touches supervisées (Voir as_supervised doc ): ('text', 'text')
Figure ( tfds.show_examples ) : non pris en charge.
Exemples ( tfds.as_dataframe ):

Citation :

@inproceedings{panayotov2015librispeech,
  title={Librispeech: an ASR corpus based on public domain audio books},
  author={Panayotov, Vassil and Chen, Guoguo and Povey, Daniel and Khudanpur, Sanjeev},
  booktitle={Acoustics, Speech and Signal Processing (ICASSP), 2015 IEEE International Conference on},
  pages={5206--5210},
  year={2015},
  organization={IEEE}
}