mirrors/icefall

Fork 0

mirror of https://github.com/k2-fsa/icefall.git synced 2025-12-11 06:55:27 +00:00

History

dohe0342 5d6991b536 from local

2023-01-25 16:43:37 +09:00

d2v-T

from local

2023-01-19 11:27:19 +09:00

__init__.py

from local

2023-01-19 11:27:19 +09:00

asr_datamodule.py

from local

2023-01-19 11:27:19 +09:00

beam_search.py

from local

2023-01-19 11:27:19 +09:00

checkpoint.py

from local

2023-01-19 11:27:19 +09:00

convolution.py

from local

2023-01-24 14:10:47 +09:00

ctc_decode.py

from local

2023-01-19 11:27:19 +09:00

data2vec_audio_adapter.py

from local

2023-01-24 14:07:26 +09:00

data2vec_audio.py

from local

2023-01-19 11:27:19 +09:00

data2vec_encoder.py

from local

2023-01-24 22:55:59 +09:00

decode_librispeech.py

from local

2023-01-19 11:27:19 +09:00

decode_userlibri.py

from local

2023-01-19 11:27:19 +09:00

decode.py

from local

2023-01-24 15:06:38 +09:00

decoder.py

from local

2023-01-19 11:27:19 +09:00

encoder_interface.py

from local

2023-01-19 11:27:19 +09:00

export.py

from local

2023-01-19 11:27:19 +09:00

jit_pretrained_ctc.py

from local

2023-01-19 11:27:19 +09:00

jit_pretrained.py

from local

2023-01-19 11:27:19 +09:00

joiner.py

from local

2023-01-19 11:27:19 +09:00

model.py

from local

2023-01-19 11:27:19 +09:00

nets_utils.py

from local

2023-01-19 11:27:19 +09:00

optim.py

from local

2023-01-19 11:27:19 +09:00

pretrained_ctc.py

from local

2023-01-19 11:27:19 +09:00

pretrained.py

from local

2023-01-19 11:27:19 +09:00

README.md

from local

2023-01-19 11:27:19 +09:00

scaling_converter.py

from local

2023-01-19 11:27:19 +09:00

scaling.py

from local

2023-01-19 11:27:19 +09:00

test_model.py

from local

2023-01-19 11:27:19 +09:00

train_adapter.py

from local

2023-01-25 16:43:37 +09:00

train.py

from local

2023-01-24 15:22:09 +09:00

utils.py

from local

2023-01-24 14:10:16 +09:00

zipformer.py

from local

2023-01-19 11:27:19 +09:00

README.md

data2vec-transducer

	test-clean	test-other
greedy decoding	2.88	6.69
modified beam search	2.76	6.37
fast beam search	2.82	6.59

train command

./pruned_transducer_stateless_d2v_v2/train.py \
      --wandb False \
      --use-pseudo-labels True \
      --load-prefinetuned-model ./pruned_transducer_stateless_d2v_v2/d2v-T-LJft/libri_finetuned.pt \
      --input-strategy AudioSamples \
      --enable-spec-aug False \
      --multi-optim True \
      --start-epoch 1 \
      --world-size 4 \
      --num-epochs 30 \
      --exp-dir ./pruned_transducer_stateless_d2v_v2/d2v-T-LJft \
      --max-duration 150 \
      --freeze-finetune-updates 3000 \
      --encoder-dim 768 \
      --decoder-dim 768 \
      --joiner-dim 768 \
      --use-fp16 1 \
      --peak-dec-lr 0.04175 \
      --peak-enc-lr 0.0003859 \
      --accum-grads 4 \
      --encoder-type d2v \
      --additional-block True \
      --prune-range 10 \
      --context-size 2 \
      --ctc-loss-scale 0.2

decode command

for method in modified_beam_search; do
  ./pruned_transducer_stateless_d2v_v2/decode.py \
    --gen-pseudo-label False \
    --input-strategy AudioSamples \
    --enable-spec-aug False \
    --additional-block True \
    --model-name epoch-27.pt \
    --exp-dir ./pruned_transducer_stateless_d2v_v2/d2v-T-LJft \
    --max-duration 400 \
    --decoding-method $method \
    --max-sym-per-frame 1 \
    --encoder-type d2v \
    --encoder-dim 768 \
    --decoder-dim 768 \
    --joiner-dim 768
done