mirrors/icefall

Fork 0

mirror of https://github.com/k2-fsa/icefall.git synced 2025-12-11 06:55:27 +00:00

History

dohe0342 a885b3e43b from local

2023-01-07 14:19:28 +09:00

__init__.py

…

asr_datamodule.py

from local

2023-01-04 03:13:28 +09:00

beam_search.py

…

checkpoint.py

from local

2022-12-30 11:26:22 +09:00

convolution.py

from local

2023-01-03 13:40:14 +09:00

ctc_decode.py

…

data2vec_audio.py

from local

2023-01-03 22:27:46 +09:00

data2vec_encoder.py

from local

2022-12-26 13:25:58 +09:00

decode.py

from local

2023-01-04 03:20:54 +09:00

decoder.py

…

encoder_interface.py

…

export.py

…

jit_pretrained_ctc.py

…

jit_pretrained.py

…

joiner.py

…

model.py

from local

2022-12-27 14:43:28 +09:00

nets_utils.py

…

optim.py

from local

2022-12-10 14:55:25 +09:00

pretrained_ctc.py

…

pretrained.py

…

README.md

from local

2022-12-20 16:34:30 +09:00

scaling_converter.py

…

scaling.py

…

test_model.py

…

train_adapter.py

from local

2023-01-03 22:26:28 +09:00

train.py

from local

2022-12-27 10:59:32 +09:00

utils.py

from local

2022-12-26 14:14:38 +09:00

zipformer.py

…

README.md

data2vec-transducer

	test-clean	test-other
greedy decoding	2.88	6.69
modified beam search	2.76	6.37
fast beam search	2.82	6.59

train command

./pruned_transducer_stateless_d2v_v2/train.py \
        --wandb False \
        --input-strategy AudioSamples \
        --enable-spec-aug False \
        --multi-optim True \
        --start-epoch 1 \ 
        --world-size 4 \ 
        --num-epochs 30 \
        --full-libri 1 \ 
        --exp-dir ./pruned_transducer_stateless_d2v_v2/d2v-T \
        --max-duration 150 \
        --freeze-finetune-updates 3000 \
        --encoder-dim 768 \
        --decoder-dim 768 \
        --joiner-dim 768 \
        --use-fp16 1 \ 
        --peak-dec-lr 0.04175 \
        --peak-enc-lr 0.0003859 \
        --accum-grads 4 \ 
        --encoder-type d2v \
        --additional-block True \
        --prune-range 10 \
        --context-size 2 \ 
        --ctc-loss-scale 0.2

decode command

for method in greedy_search modified_beam_search fast_beam_search; do
  ./pruned_transducer_stateless_d2v_v2/decode.py \
    --input-strategy AudioSamples \
    --enable-spec-aug False \
    --additional-block True \
    --model-name epoch-27.pt \
    --exp-dir ./pruned_transducer_stateless_d2v_v2/960h_sweep_v3_388 \
    --max-duration 400 \
    --decoding-method $method \
    --max-sym-per-frame 1 \ 
    --encoder-type d2v \
    --encoder-dim 768 \
    --decoder-dim 768 \
    --joiner-dim 768