From 57040e382af0b4fcdd7b4c1433adda00cf2bc890 Mon Sep 17 00:00:00 2001
From: Daniel Povey <dpovey@gmail.com>
Date: Tue, 13 Dec 2022 19:25:08 +0800
Subject: [PATCH] Set all aux-loss probs to zero.

---
 .../ASR/pruned_transducer_stateless7/zipformer.py         | 8 +++++---
 1 file changed, 5 insertions(+), 3 deletions(-)

diff --git a/egs/librispeech/ASR/pruned_transducer_stateless7/zipformer.py b/egs/librispeech/ASR/pruned_transducer_stateless7/zipformer.py
index 99433796f..78137d5c5 100644
--- a/egs/librispeech/ASR/pruned_transducer_stateless7/zipformer.py
+++ b/egs/librispeech/ASR/pruned_transducer_stateless7/zipformer.py
@@ -361,9 +361,9 @@ def _whitening_schedule(x: float, ratio: float = 2.0) -> ScheduledFloat:
 def _aux_grad_scale() -> float:
     return 0.2
 def _aux_grad_prob_out() -> ScheduledFloat:
-    return ScheduledFloat((0.0, 0.25), (1000.0, 0.05), (8000.0, 0.0125))
+    return 0.0 # ScheduledFloat((0.0, 0.25), (1000.0, 0.05), (8000.0, 0.0125))
 def _aux_grad_prob_in() -> ScheduledFloat:
-    return ScheduledFloat((0.0, 0.25), (1000.0, 0.0))
+    return 0.0 # ScheduledFloat((0.0, 0.25), (1000.0, 0.0))
     #return ScheduledFloat((0.0, 0.25), (1000.0, 0.05), (8000.0, 0.0125))
 
 
@@ -1356,7 +1356,9 @@ class AttentionSqueeze(nn.Module):
                                          aux_grad_scale=_aux_grad_scale(), prob=_aux_grad_prob_in())
 
         self.to_bottleneck_proj = LinearWithAuxLoss(embed_dim,
-                                                    bottleneck_dim)
+                                                    bottleneck_dim,
+                                                    aux_grad_scale=_aux_grad_scale(),
+                                                    prob=_aux_grad_prob_in())
 
 
         # bottleneck_balancer is before the actiation.  Mostly, for well-trained