History

No need to load_audio. alimeeting audio data is wav format, default export_to_webdataset uses "flac".  If load_audio uses default (True), webdataset would show "[Suppressed TypeError] Error message: save() got an unexpected keyword argument 'format'" during write

2022-08-31 13:12:28 +08:00

local

Check that read_manifests_if_cached returns a non-empty dict. (#555 )

2022-08-28 11:50:11 +08:00

pruned_transducer_stateless2

Very minor change in alimeeting recipe

2022-08-31 13:12:28 +08:00

prepare.sh

minor changes for correct path names && import module text2segments.py (#552 )

2022-08-27 17:23:45 +08:00

README.md

[Ready to merge] Pruned_transducer_stateless2 for alimeeting dataset (#378 )

2022-06-04 13:47:46 +08:00

RESULTS.md

[Ready to merge] Pruned_transducer_stateless2 for alimeeting dataset (#378 )

2022-06-04 13:47:46 +08:00

shared

[Ready to merge] Pruned_transducer_stateless2 for alimeeting dataset (#378 )

2022-06-04 13:47:46 +08:00

README.md

Introduction

This recipe includes some different ASR models trained with Alimeeting (far).

./RESULTS.md contains the latest results.

Transducers

There are various folders containing the name transducer in this folder. The following table lists the differences among them.

	Encoder	Decoder	Comment
`pruned_transducer_stateless2`	Conformer(modified)	Embedding + Conv1d	Using k2 pruned RNN-T loss

The decoder in transducer_stateless is modified from the paper Rnn-Transducer with Stateless Prediction Network. We place an additional Conv1d layer right after the input embedding layer.