From 14f0cb5977fbf8911ec6b503317792ee9588eeb5 Mon Sep 17 00:00:00 2001
From: jinzr <60612200+JinZr@users.noreply.github.com>
Date: Fri, 11 Aug 2023 20:51:36 +0800
Subject: [PATCH] minor bug fixes for existing scripts

---
 egs/librispeech/ASR/zipformer/jit_pretrained_ctc.py | 2 +-
 egs/librispeech/ASR/zipformer/pretrained_ctc.py     | 2 +-
 2 files changed, 2 insertions(+), 2 deletions(-)
diff --git a/egs/librispeech/ASR/zipformer/jit_pretrained_ctc.py b/egs/librispeech/ASR/zipformer/jit_pretrained_ctc.py
index 904d8cd76..59c268572 100755
--- a/egs/librispeech/ASR/zipformer/jit_pretrained_ctc.py
+++ b/egs/librispeech/ASR/zipformer/jit_pretrained_ctc.py
@@ -412,7 +412,7 @@ def main():
     s = "\n"
     for filename, hyp in zip(params.sound_files, hyps):
         words = " ".join(hyp)
-        words = words.replace("▁", " ").strip()
+        words = words.replace("▁", "").strip()
         s += f"{filename}:\n{words}\n\n"
     logging.info(s)
 
diff --git a/egs/librispeech/ASR/zipformer/pretrained_ctc.py b/egs/librispeech/ASR/zipformer/pretrained_ctc.py
index be239e9c3..3508978d8 100755
--- a/egs/librispeech/ASR/zipformer/pretrained_ctc.py
+++ b/egs/librispeech/ASR/zipformer/pretrained_ctc.py
@@ -274,7 +274,7 @@ def main():
     params.update(vars(args))
 
     token_table = k2.SymbolTable.from_file(params.tokens)
-    params.vocab_size = num_tokens(token_table)
+    params.vocab_size = num_tokens(token_table) + 1  # +1 for blank
     params.blank_id = token_table["<blk>"]
     assert params.blank_id == 0