Move feedforward1 to the beginning, separating it from small_conv_module.

2025-12-11 06:55:27 +00:00 · 2022-11-20 13:17:39 +08:00 · 2022-11-20 13:17:39 +08:00 · 31b2a735b8
commit 31b2a735b8
parent 40c883343a
1 changed files with 2 additions and 2 deletions
--- a/egs/librispeech/ASR/pruned_transducer_stateless7/zipformer.py
+++ b/egs/librispeech/ASR/pruned_transducer_stateless7/zipformer.py
@ -472,6 +472,8 @@ class ZipformerEncoderLayer(nn.Module):
        # multi-headed self-attention module
        use_self_attn = (random.random() >= dynamic_skip_rate)

+        src = src + self.feed_forward1(src)
+
        if torch.jit.is_scripting() or use_self_attn:
            # attn_weights: (num_heads, batch_size, seq_len, seq_len)
            attn_weights = self.self_attn_weights(
@ -489,8 +491,6 @@ class ZipformerEncoderLayer(nn.Module):
        if torch.jit.is_scripting() or random.random() >= dynamic_skip_rate:
            src = src + self.small_conv_module(src, src_key_padding_mask=src_key_padding_mask)

-        src = src + self.feed_forward1(src)
-
        # pooling module
        if torch.jit.is_scripting() or use_self_attn:
            src = src + self.attention_squeeze1(src, attn_weights[1:2])