Don't use a lambda for dataloader's worker_init_fn. (#284)

* Don't use a lambda for dataloader's worker_init_fn.
2025-08-09 01:52:41 +00:00 · 2022-03-31 20:32:00 +08:00 · 2022-03-31 20:32:00 +08:00 · e7493ede90
commit e7493ede90
parent 9a11808ed3
2 changed files with 18 additions and 6 deletions
--- a/egs/librispeech/ASR/tdnn_lstm_ctc/asr_datamodule.py
+++ b/egs/librispeech/ASR/tdnn_lstm_ctc/asr_datamodule.py
@ -41,6 +41,14 @@ from torch.utils.data import DataLoader
 from icefall.utils import str2bool
 class _SeedWorkers:
    def __init__(self, seed: int):
        self.seed = seed
    def __call__(self, worker_id: int):
        fix_random_seed(self.seed + worker_id)
 class LibriSpeechAsrDataModule:
    """
    DataModule for k2 ASR experiments.
@ -306,9 +314,7 @@ class LibriSpeechAsrDataModule:
        # 'seed' is derived from the current random state, which will have
        # previously been set in the main process.
        seed = torch.randint(0, 100000, ()).item()
-
+        worker_init_fn = _SeedWorkers(seed)
        def worker_init_fn(worker_id: int):
            fix_random_seed(seed + worker_id)
        train_dl = DataLoader(
            train,
--- a/egs/librispeech/ASR/transducer_stateless_multi_datasets/asr_datamodule.py
+++ b/egs/librispeech/ASR/transducer_stateless_multi_datasets/asr_datamodule.py
@ -41,6 +41,14 @@ from torch.utils.data import DataLoader
 from icefall.utils import str2bool
 class _SeedWorkers:
    def __init__(self, seed: int):
        self.seed = seed
    def __call__(self, worker_id: int):
        fix_random_seed(self.seed + worker_id)
 class AsrDataModule:
    def __init__(self, args: argparse.Namespace):
        self.args = args
@ -259,9 +267,7 @@ class AsrDataModule:
        # 'seed' is derived from the current random state, which will have
        # previously been set in the main process.
        seed = torch.randint(0, 100000, ()).item()
-
+        worker_init_fn = _SeedWorkers(seed)
        def worker_init_fn(worker_id: int):
            fix_random_seed(seed + worker_id)
        train_dl = DataLoader(
            train,