Change how bypass_scale works, src = src * bypass_scale + src_orig * (1.0 - bypass_scale)

2022-12-26 14:27:16 +08:00 · 2022-12-26 14:27:16 +08:00 · 920ed685ac
commit 920ed685ac
parent 11f5454b6a
1 changed files with 3 additions and 3 deletions
--- a/egs/librispeech/ASR/pruned_transducer_stateless7/zipformer.py
+++ b/egs/librispeech/ASR/pruned_transducer_stateless7/zipformer.py
@ -474,7 +474,7 @@ class ZipformerEncoderLayer(nn.Module):
    def get_bypass_scale(self, batch_size: int):
        # returns bypass-scale of shape (num_channels,),
        # or (batch_size, num_channels,).  This is actually the
-        # scale on the delta src - src_orig, so 0 correponds to bypassing
+        # scale on the non-residual term, so 0 correponds to bypassing
        # this module.
        if torch.jit.is_scripting() or not self.training:
            return self.bypass_scale
@ -575,9 +575,9 @@ class ZipformerEncoderLayer(nn.Module):
        src = self.balancer(src)
        src = self.norm_final(src)

-        delta = src - src_orig
+        bypass_scale = self.get_bypass_scale(src.shape[1])
+        src = src * bypass_scale + src_orig * (1.0 - bypass_scale)

-        src = src_orig + delta * self.get_bypass_scale(src.shape[1])
        src = self.whiten(src)

        return src, attn_weights