disable fp16 when computing ctc loss

2023-02-16 15:27:23 +08:00 · 2023-02-16 15:27:23 +08:00 · cc74ba574e
commit cc74ba574e
parent 20207f0e4e
2 changed files with 28 additions and 26 deletions
--- a/egs/librispeech/ASR/conformer_ctc3/train.py
+++ b/egs/librispeech/ASR/conformer_ctc3/train.py
@ -601,20 +601,21 @@ def compute_loss(
    else:
        raise ValueError(f"Unsupported type of graph compiler: {type(graph_compiler)}")

-    dense_fsa_vec = k2.DenseFsaVec(
-        nnet_output,
-        supervision_segments,
-        allow_truncate=params.subsampling_factor - 1,
-    )
+    with torch.cuda.amp.autocast(enabled=False):
+        dense_fsa_vec = k2.DenseFsaVec(
+            nnet_output.float(),
+            supervision_segments,
+            allow_truncate=params.subsampling_factor - 1,
+        )
+        ctc_loss = k2.ctc_loss(
+            decoding_graph=decoding_graph,
+            dense_fsa_vec=dense_fsa_vec,
+            output_beam=params.beam_size,
+            delay_penalty=params.delay_penalty if warmup >= 1.0 else 0.0,
+            reduction=params.reduction,
+            use_double_scores=params.use_double_scores,
+        )

-    ctc_loss = k2.ctc_loss(
-        decoding_graph=decoding_graph,
-        dense_fsa_vec=dense_fsa_vec,
-        output_beam=params.beam_size,
-        delay_penalty=params.delay_penalty if warmup >= 1.0 else 0.0,
-        reduction=params.reduction,
-        use_double_scores=params.use_double_scores,
-    )
    ctc_loss_is_finite = torch.isfinite(ctc_loss)
    if not torch.all(ctc_loss_is_finite):
        logging.info("Not all losses are finite!\n" f"ctc_loss: {ctc_loss}")
--- a/egs/librispeech/ASR/pruned_transducer_stateless4_ctc/train.py
+++ b/egs/librispeech/ASR/pruned_transducer_stateless4_ctc/train.py
@ -710,20 +710,21 @@ def compute_loss(

    # Works with a BPE model
    decoding_graph = k2.ctc_graph(token_ids, modified=False, device=device)
-    dense_fsa_vec = k2.DenseFsaVec(
-        ctc_output,
-        supervision_segments,
-        allow_truncate=params.subsampling_factor - 1,
-    )
+    with torch.cuda.amp.autocast(enabled=False):
+        dense_fsa_vec = k2.DenseFsaVec(
+            ctc_output.float(),
+            supervision_segments,
+            allow_truncate=params.subsampling_factor - 1,
+        )
+        ctc_loss = k2.ctc_loss(
+            decoding_graph=decoding_graph,
+            dense_fsa_vec=dense_fsa_vec,
+            output_beam=params.beam_size,
+            delay_penalty=params.ctc_delay_penalty if warmup >= 1.0 else 0.0,
+            reduction="none",
+            use_double_scores=params.use_double_scores,
+        )

-    ctc_loss = k2.ctc_loss(
-        decoding_graph=decoding_graph,
-        dense_fsa_vec=dense_fsa_vec,
-        output_beam=params.beam_size,
-        delay_penalty=params.ctc_delay_penalty if warmup >= 1.0 else 0.0,
-        reduction="none",
-        use_double_scores=params.use_double_scores,
-    )
    ctc_loss_is_finite = torch.isfinite(ctc_loss)
    if not torch.all(ctc_loss_is_finite):
        logging.info("Not all losses are finite!\n" f"ctc_loss: {ctc_loss}")