mirror of
https://github.com/k2-fsa/icefall.git
synced 2025-08-09 18:12:19 +00:00
* add whisper fbank for wenetspeech * add whisper fbank for other dataset * add str to bool * add decode for wenetspeech * add requirments.txt * add original model decode with 30s * test feature extractor speed * add aishell2 feat * change compute feature batch * fix overwrite * fix executor * regression * add kaldifeatwhisper fbank * fix io issue * parallel jobs * use multi machines * add wenetspeech fine-tune scripts * add monkey patch codes * remove useless file * fix subsampling factor * fix too long audios * add remove long short * fix whisper version to support multi batch beam * decode all wav files * remove utterance more than 30s in test_net * only test net * using soft links * add kespeech whisper feats * fix index error * add manifests for whisper * change to licomchunky writer * add missing option * decrease cpu usage * add speed perturb for kespeech * fix kespeech speed perturb * add dataset * load checkpoint from specific path * add speechio * add speechio results --------- Co-authored-by: zr_jin <peter.jin.cn@gmail.com>
1163 lines
102 KiB
Python
1163 lines
102 KiB
Python
#!/usr/bin/env python3
|
|
# Copyright 2021 Xiaomi Corp. (authors: Fangjun Kuang)
|
|
#
|
|
# See ../../../../LICENSE for clarification regarding multiple authors
|
|
#
|
|
# Licensed under the Apache License, Version 2.0 (the "License");
|
|
# you may not use this file except in compliance with the License.
|
|
# You may obtain a copy of the License at
|
|
#
|
|
# http://www.apache.org/licenses/LICENSE-2.0
|
|
#
|
|
# Unless required by applicable law or agreed to in writing, software
|
|
# distributed under the License is distributed on an "AS IS" BASIS,
|
|
# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
|
|
# See the License for the specific language governing permissions and
|
|
# limitations under the License.
|
|
|
|
"""
|
|
This file displays duration statistics of utterances in a manifest.
|
|
You can use the displayed value to choose minimum/maximum duration
|
|
to remove short and long utterances during the training.
|
|
|
|
See the function `remove_short_and_long_utt()` in transducer_stateless/train.py
|
|
for usage.
|
|
"""
|
|
|
|
SPEECHIO_TESTSET_INDEX = 26 # Currently, from 0 - 26 test sets are open source.
|
|
|
|
from lhotse import load_manifest_lazy
|
|
|
|
|
|
def main():
|
|
dataset_parts = []
|
|
for i in range(SPEECHIO_TESTSET_INDEX + 1):
|
|
idx = f"{i}".zfill(2)
|
|
dataset_parts.append(f"SPEECHIO_ASR_ZH000{idx}")
|
|
|
|
prefix = "speechio"
|
|
suffix = "jsonl.gz"
|
|
|
|
for partition in dataset_parts:
|
|
path = f"./data/fbank/{prefix}_cuts_{partition}.{suffix}"
|
|
cuts = load_manifest_lazy(path)
|
|
print(
|
|
f"===================Duration statistics of {partition}==================="
|
|
)
|
|
cuts.describe()
|
|
|
|
|
|
if __name__ == "__main__":
|
|
main()
|
|
|
|
"""
|
|
===================Duration statistics of SPEECHIO_ASR_ZH00000===================
|
|
Cut statistics:
|
|
╒═══════════════════════════╤══════════╕
|
|
│ Cuts count: │ 879 │
|
|
├───────────────────────────┼──────────┤
|
|
│ Total duration (hh:mm:ss) │ 01:36:09 │
|
|
├───────────────────────────┼──────────┤
|
|
│ mean │ 6.6 │
|
|
├───────────────────────────┼──────────┤
|
|
│ std │ 2.0 │
|
|
├───────────────────────────┼──────────┤
|
|
│ min │ 1.7 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 25% │ 5.0 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 50% │ 6.5 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 75% │ 8.1 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 99% │ 11.2 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 99.5% │ 11.6 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 99.9% │ 12.2 │
|
|
├───────────────────────────┼──────────┤
|
|
│ max │ 12.5 │
|
|
├───────────────────────────┼──────────┤
|
|
│ Recordings available: │ 879 │
|
|
├───────────────────────────┼──────────┤
|
|
│ Features available: │ 879 │
|
|
├───────────────────────────┼──────────┤
|
|
│ Supervisions available: │ 879 │
|
|
╘═══════════════════════════╧══════════╛
|
|
Speech duration statistics:
|
|
╒══════════════════════════════╤══════════╤══════════════════════╕
|
|
│ Total speech duration │ 01:36:09 │ 100.00% of recording │
|
|
├──────────────────────────────┼──────────┼──────────────────────┤
|
|
│ Total speaking time duration │ 01:36:09 │ 100.00% of recording │
|
|
├──────────────────────────────┼──────────┼──────────────────────┤
|
|
│ Total silence duration │ 00:00:00 │ 0.00% of recording │
|
|
╘══════════════════════════════╧══════════╧══════════════════════╛
|
|
===================Duration statistics of SPEECHIO_ASR_ZH00001===================
|
|
Cut statistics:
|
|
╒═══════════════════════════╤══════════╕
|
|
│ Cuts count: │ 5069 │
|
|
├───────────────────────────┼──────────┤
|
|
│ Total duration (hh:mm:ss) │ 08:43:04 │
|
|
├───────────────────────────┼──────────┤
|
|
│ mean │ 6.2 │
|
|
├───────────────────────────┼──────────┤
|
|
│ std │ 2.1 │
|
|
├───────────────────────────┼──────────┤
|
|
│ min │ 0.6 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 25% │ 4.6 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 50% │ 6.2 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 75% │ 7.9 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 99% │ 10.0 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 99.5% │ 10.0 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 99.9% │ 10.7 │
|
|
├───────────────────────────┼──────────┤
|
|
│ max │ 12.5 │
|
|
├───────────────────────────┼──────────┤
|
|
│ Recordings available: │ 5069 │
|
|
├───────────────────────────┼──────────┤
|
|
│ Features available: │ 5069 │
|
|
├───────────────────────────┼──────────┤
|
|
│ Supervisions available: │ 5069 │
|
|
╘═══════════════════════════╧══════════╛
|
|
Speech duration statistics:
|
|
╒══════════════════════════════╤══════════╤══════════════════════╕
|
|
│ Total speech duration │ 08:43:04 │ 100.00% of recording │
|
|
├──────────────────────────────┼──────────┼──────────────────────┤
|
|
│ Total speaking time duration │ 08:43:04 │ 100.00% of recording │
|
|
├──────────────────────────────┼──────────┼──────────────────────┤
|
|
│ Total silence duration │ 00:00:00 │ 0.00% of recording │
|
|
╘══════════════════════════════╧══════════╧══════════════════════╛
|
|
===================Duration statistics of SPEECHIO_ASR_ZH00002===================
|
|
Cut statistics:
|
|
╒═══════════════════════════╤══════════╕
|
|
│ Cuts count: │ 2993 │
|
|
├───────────────────────────┼──────────┤
|
|
│ Total duration (hh:mm:ss) │ 02:45:09 │
|
|
├───────────────────────────┼──────────┤
|
|
│ mean │ 3.3 │
|
|
├───────────────────────────┼──────────┤
|
|
│ std │ 1.5 │
|
|
├───────────────────────────┼──────────┤
|
|
│ min │ 0.4 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 25% │ 2.2 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 50% │ 3.1 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 75% │ 4.3 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 99% │ 7.3 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 99.5% │ 7.8 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 99.9% │ 9.1 │
|
|
├───────────────────────────┼──────────┤
|
|
│ max │ 11.8 │
|
|
├───────────────────────────┼──────────┤
|
|
│ Recordings available: │ 2993 │
|
|
├───────────────────────────┼──────────┤
|
|
│ Features available: │ 2993 │
|
|
├───────────────────────────┼──────────┤
|
|
│ Supervisions available: │ 2993 │
|
|
╘═══════════════════════════╧══════════╛
|
|
Speech duration statistics:
|
|
╒══════════════════════════════╤══════════╤══════════════════════╕
|
|
│ Total speech duration │ 02:45:09 │ 100.00% of recording │
|
|
├──────────────────────────────┼──────────┼──────────────────────┤
|
|
│ Total speaking time duration │ 02:45:09 │ 100.00% of recording │
|
|
├──────────────────────────────┼──────────┼──────────────────────┤
|
|
│ Total silence duration │ 00:00:00 │ 0.00% of recording │
|
|
╘══════════════════════════════╧══════════╧══════════════════════╛
|
|
===================Duration statistics of SPEECHIO_ASR_ZH00003===================
|
|
Cut statistics:
|
|
╒═══════════════════════════╤══════════╕
|
|
│ Cuts count: │ 1683 │
|
|
├───────────────────────────┼──────────┤
|
|
│ Total duration (hh:mm:ss) │ 02:23:28 │
|
|
├───────────────────────────┼──────────┤
|
|
│ mean │ 5.1 │
|
|
├───────────────────────────┼──────────┤
|
|
│ std │ 1.4 │
|
|
├───────────────────────────┼──────────┤
|
|
│ min │ 2.4 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 25% │ 4.0 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 50% │ 4.9 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 75% │ 6.0 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 99% │ 9.0 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 99.5% │ 9.4 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 99.9% │ 10.8 │
|
|
├───────────────────────────┼──────────┤
|
|
│ max │ 14.2 │
|
|
├───────────────────────────┼──────────┤
|
|
│ Recordings available: │ 1683 │
|
|
├───────────────────────────┼──────────┤
|
|
│ Features available: │ 1683 │
|
|
├───────────────────────────┼──────────┤
|
|
│ Supervisions available: │ 1683 │
|
|
╘═══════════════════════════╧══════════╛
|
|
Speech duration statistics:
|
|
╒══════════════════════════════╤══════════╤══════════════════════╕
|
|
│ Total speech duration │ 02:23:28 │ 100.00% of recording │
|
|
├──────────────────────────────┼──────────┼──────────────────────┤
|
|
│ Total speaking time duration │ 02:23:28 │ 100.00% of recording │
|
|
├──────────────────────────────┼──────────┼──────────────────────┤
|
|
│ Total silence duration │ 00:00:00 │ 0.00% of recording │
|
|
╘══════════════════════════════╧══════════╧══════════════════════╛
|
|
===================Duration statistics of SPEECHIO_ASR_ZH00004===================
|
|
Cut statistics:
|
|
╒═══════════════════════════╤══════════╕
|
|
│ Cuts count: │ 1311 │
|
|
├───────────────────────────┼──────────┤
|
|
│ Total duration (hh:mm:ss) │ 02:49:16 │
|
|
├───────────────────────────┼──────────┤
|
|
│ mean │ 7.7 │
|
|
├───────────────────────────┼──────────┤
|
|
│ std │ 2.8 │
|
|
├───────────────────────────┼──────────┤
|
|
│ min │ 0.9 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 25% │ 5.8 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 50% │ 8.1 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 75% │ 9.8 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 99% │ 12.9 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 99.5% │ 13.5 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 99.9% │ 13.8 │
|
|
├───────────────────────────┼──────────┤
|
|
│ max │ 14.4 │
|
|
├───────────────────────────┼──────────┤
|
|
│ Recordings available: │ 1311 │
|
|
├───────────────────────────┼──────────┤
|
|
│ Features available: │ 1311 │
|
|
├───────────────────────────┼──────────┤
|
|
│ Supervisions available: │ 1311 │
|
|
╘═══════════════════════════╧══════════╛
|
|
Speech duration statistics:
|
|
╒══════════════════════════════╤══════════╤══════════════════════╕
|
|
│ Total speech duration │ 02:49:16 │ 100.00% of recording │
|
|
├──────────────────────────────┼──────────┼──────────────────────┤
|
|
│ Total speaking time duration │ 02:49:16 │ 100.00% of recording │
|
|
├──────────────────────────────┼──────────┼──────────────────────┤
|
|
│ Total silence duration │ 00:00:00 │ 0.00% of recording │
|
|
╘══════════════════════════════╧══════════╧══════════════════════╛
|
|
===================Duration statistics of SPEECHIO_ASR_ZH00005===================
|
|
Cut statistics:
|
|
╒═══════════════════════════╤══════════╕
|
|
│ Cuts count: │ 3148 │
|
|
├───────────────────────────┼──────────┤
|
|
│ Total duration (hh:mm:ss) │ 04:22:47 │
|
|
├───────────────────────────┼──────────┤
|
|
│ mean │ 5.0 │
|
|
├───────────────────────────┼──────────┤
|
|
│ std │ 1.4 │
|
|
├───────────────────────────┼──────────┤
|
|
│ min │ 2.0 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 25% │ 3.9 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 50% │ 4.9 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 75% │ 5.9 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 99% │ 8.8 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 99.5% │ 9.3 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 99.9% │ 10.3 │
|
|
├───────────────────────────┼──────────┤
|
|
│ max │ 11.1 │
|
|
├───────────────────────────┼──────────┤
|
|
│ Recordings available: │ 3148 │
|
|
├───────────────────────────┼──────────┤
|
|
│ Features available: │ 3148 │
|
|
├───────────────────────────┼──────────┤
|
|
│ Supervisions available: │ 3148 │
|
|
╘═══════════════════════════╧══════════╛
|
|
Speech duration statistics:
|
|
╒══════════════════════════════╤══════════╤══════════════════════╕
|
|
│ Total speech duration │ 04:22:47 │ 100.00% of recording │
|
|
├──────────────────────────────┼──────────┼──────────────────────┤
|
|
│ Total speaking time duration │ 04:22:47 │ 100.00% of recording │
|
|
├──────────────────────────────┼──────────┼──────────────────────┤
|
|
│ Total silence duration │ 00:00:00 │ 0.00% of recording │
|
|
╘══════════════════════════════╧══════════╧══════════════════════╛
|
|
===================Duration statistics of SPEECHIO_ASR_ZH00006===================
|
|
Cut statistics:
|
|
╒═══════════════════════════╤══════════╕
|
|
│ Cuts count: │ 1561 │
|
|
├───────────────────────────┼──────────┤
|
|
│ Total duration (hh:mm:ss) │ 01:39:33 │
|
|
├───────────────────────────┼──────────┤
|
|
│ mean │ 3.8 │
|
|
├───────────────────────────┼──────────┤
|
|
│ std │ 2.2 │
|
|
├───────────────────────────┼──────────┤
|
|
│ min │ 0.4 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 25% │ 2.2 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 50% │ 3.3 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 75% │ 4.9 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 99% │ 10.4 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 99.5% │ 11.3 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 99.9% │ 15.3 │
|
|
├───────────────────────────┼──────────┤
|
|
│ max │ 23.8 │
|
|
├───────────────────────────┼──────────┤
|
|
│ Recordings available: │ 1561 │
|
|
├───────────────────────────┼──────────┤
|
|
│ Features available: │ 1561 │
|
|
├───────────────────────────┼──────────┤
|
|
│ Supervisions available: │ 1561 │
|
|
╘═══════════════════════════╧══════════╛
|
|
Speech duration statistics:
|
|
╒══════════════════════════════╤══════════╤══════════════════════╕
|
|
│ Total speech duration │ 01:39:33 │ 100.00% of recording │
|
|
├──────────────────────────────┼──────────┼──────────────────────┤
|
|
│ Total speaking time duration │ 01:39:33 │ 100.00% of recording │
|
|
├──────────────────────────────┼──────────┼──────────────────────┤
|
|
│ Total silence duration │ 00:00:00 │ 0.00% of recording │
|
|
╘══════════════════════════════╧══════════╧══════════════════════╛
|
|
===================Duration statistics of SPEECHIO_ASR_ZH00007===================
|
|
Cut statistics:
|
|
╒═══════════════════════════╤══════════╕
|
|
│ Cuts count: │ 770 │
|
|
├───────────────────────────┼──────────┤
|
|
│ Total duration (hh:mm:ss) │ 00:58:57 │
|
|
├───────────────────────────┼──────────┤
|
|
│ mean │ 4.6 │
|
|
├───────────────────────────┼──────────┤
|
|
│ std │ 2.4 │
|
|
├───────────────────────────┼──────────┤
|
|
│ min │ 0.7 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 25% │ 2.7 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 50% │ 4.0 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 75% │ 6.0 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 99% │ 11.8 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 99.5% │ 13.0 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 99.9% │ 15.1 │
|
|
├───────────────────────────┼──────────┤
|
|
│ max │ 18.7 │
|
|
├───────────────────────────┼──────────┤
|
|
│ Recordings available: │ 770 │
|
|
├───────────────────────────┼──────────┤
|
|
│ Features available: │ 770 │
|
|
├───────────────────────────┼──────────┤
|
|
│ Supervisions available: │ 770 │
|
|
╘═══════════════════════════╧══════════╛
|
|
Speech duration statistics:
|
|
╒══════════════════════════════╤══════════╤══════════════════════╕
|
|
│ Total speech duration │ 00:58:57 │ 100.00% of recording │
|
|
├──────────────────────────────┼──────────┼──────────────────────┤
|
|
│ Total speaking time duration │ 00:58:57 │ 100.00% of recording │
|
|
├──────────────────────────────┼──────────┼──────────────────────┤
|
|
│ Total silence duration │ 00:00:00 │ 0.00% of recording │
|
|
╘══════════════════════════════╧══════════╧══════════════════════╛
|
|
===================Duration statistics of SPEECHIO_ASR_ZH00008===================
|
|
Cut statistics:
|
|
╒═══════════════════════════╤══════════╕
|
|
│ Cuts count: │ 884 │
|
|
├───────────────────────────┼──────────┤
|
|
│ Total duration (hh:mm:ss) │ 01:16:55 │
|
|
├───────────────────────────┼──────────┤
|
|
│ mean │ 5.2 │
|
|
├───────────────────────────┼──────────┤
|
|
│ std │ 2.3 │
|
|
├───────────────────────────┼──────────┤
|
|
│ min │ 1.1 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 25% │ 3.5 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 50% │ 5.0 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 75% │ 6.4 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 99% │ 11.3 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 99.5% │ 12.7 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 99.9% │ 16.2 │
|
|
├───────────────────────────┼──────────┤
|
|
│ max │ 18.5 │
|
|
├───────────────────────────┼──────────┤
|
|
│ Recordings available: │ 884 │
|
|
├───────────────────────────┼──────────┤
|
|
│ Features available: │ 884 │
|
|
├───────────────────────────┼──────────┤
|
|
│ Supervisions available: │ 884 │
|
|
╘═══════════════════════════╧══════════╛
|
|
Speech duration statistics:
|
|
╒══════════════════════════════╤══════════╤══════════════════════╕
|
|
│ Total speech duration │ 01:16:55 │ 100.00% of recording │
|
|
├──────────────────────────────┼──────────┼──────────────────────┤
|
|
│ Total speaking time duration │ 01:16:55 │ 100.00% of recording │
|
|
├──────────────────────────────┼──────────┼──────────────────────┤
|
|
│ Total silence duration │ 00:00:00 │ 0.00% of recording │
|
|
╘══════════════════════════════╧══════════╧══════════════════════╛
|
|
===================Duration statistics of SPEECHIO_ASR_ZH00009===================
|
|
Cut statistics:
|
|
╒═══════════════════════════╤══════════╕
|
|
│ Cuts count: │ 3466 │
|
|
├───────────────────────────┼──────────┤
|
|
│ Total duration (hh:mm:ss) │ 04:38:13 │
|
|
├───────────────────────────┼──────────┤
|
|
│ mean │ 4.8 │
|
|
├───────────────────────────┼──────────┤
|
|
│ std │ 1.9 │
|
|
├───────────────────────────┼──────────┤
|
|
│ min │ 1.1 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 25% │ 3.4 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 50% │ 4.5 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 75% │ 5.9 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 99% │ 10.5 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 99.5% │ 11.3 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 99.9% │ 12.5 │
|
|
├───────────────────────────┼──────────┤
|
|
│ max │ 13.1 │
|
|
├───────────────────────────┼──────────┤
|
|
│ Recordings available: │ 3466 │
|
|
├───────────────────────────┼──────────┤
|
|
│ Features available: │ 3466 │
|
|
├───────────────────────────┼──────────┤
|
|
│ Supervisions available: │ 3466 │
|
|
╘═══════════════════════════╧══════════╛
|
|
Speech duration statistics:
|
|
╒══════════════════════════════╤══════════╤══════════════════════╕
|
|
│ Total speech duration │ 04:38:13 │ 100.00% of recording │
|
|
├──────────────────────────────┼──────────┼──────────────────────┤
|
|
│ Total speaking time duration │ 04:38:13 │ 100.00% of recording │
|
|
├──────────────────────────────┼──────────┼──────────────────────┤
|
|
│ Total silence duration │ 00:00:00 │ 0.00% of recording │
|
|
╘══════════════════════════════╧══════════╧══════════════════════╛
|
|
===================Duration statistics of SPEECHIO_ASR_ZH00010===================
|
|
Cut statistics:
|
|
╒═══════════════════════════╤══════════╕
|
|
│ Cuts count: │ 2251 │
|
|
├───────────────────────────┼──────────┤
|
|
│ Total duration (hh:mm:ss) │ 04:12:54 │
|
|
├───────────────────────────┼──────────┤
|
|
│ mean │ 6.7 │
|
|
├───────────────────────────┼──────────┤
|
|
│ std │ 3.0 │
|
|
├───────────────────────────┼──────────┤
|
|
│ min │ 1.4 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 25% │ 4.5 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 50% │ 6.3 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 75% │ 8.5 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 99% │ 14.9 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 99.5% │ 15.5 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 99.9% │ 15.8 │
|
|
├───────────────────────────┼──────────┤
|
|
│ max │ 16.2 │
|
|
├───────────────────────────┼──────────┤
|
|
│ Recordings available: │ 2251 │
|
|
├───────────────────────────┼──────────┤
|
|
│ Features available: │ 2251 │
|
|
├───────────────────────────┼──────────┤
|
|
│ Supervisions available: │ 2251 │
|
|
╘═══════════════════════════╧══════════╛
|
|
Speech duration statistics:
|
|
╒══════════════════════════════╤══════════╤══════════════════════╕
|
|
│ Total speech duration │ 04:12:54 │ 100.00% of recording │
|
|
├──────────────────────────────┼──────────┼──────────────────────┤
|
|
│ Total speaking time duration │ 04:12:54 │ 100.00% of recording │
|
|
├──────────────────────────────┼──────────┼──────────────────────┤
|
|
│ Total silence duration │ 00:00:00 │ 0.00% of recording │
|
|
╘══════════════════════════════╧══════════╧══════════════════════╛
|
|
===================Duration statistics of SPEECHIO_ASR_ZH00011===================
|
|
Cut statistics:
|
|
╒═══════════════════════════╤══════════╕
|
|
│ Cuts count: │ 1053 │
|
|
├───────────────────────────┼──────────┤
|
|
│ Total duration (hh:mm:ss) │ 03:27:12 │
|
|
├───────────────────────────┼──────────┤
|
|
│ mean │ 11.8 │
|
|
├───────────────────────────┼──────────┤
|
|
│ std │ 3.4 │
|
|
├───────────────────────────┼──────────┤
|
|
│ min │ 1.1 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 25% │ 11.5 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 50% │ 13.0 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 75% │ 13.9 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 99% │ 15.0 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 99.5% │ 15.1 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 99.9% │ 20.7 │
|
|
├───────────────────────────┼──────────┤
|
|
│ max │ 22.2 │
|
|
├───────────────────────────┼──────────┤
|
|
│ Recordings available: │ 1053 │
|
|
├───────────────────────────┼──────────┤
|
|
│ Features available: │ 1053 │
|
|
├───────────────────────────┼──────────┤
|
|
│ Supervisions available: │ 1053 │
|
|
╘═══════════════════════════╧══════════╛
|
|
Speech duration statistics:
|
|
╒══════════════════════════════╤══════════╤══════════════════════╕
|
|
│ Total speech duration │ 03:27:12 │ 100.00% of recording │
|
|
├──────────────────────────────┼──────────┼──────────────────────┤
|
|
│ Total speaking time duration │ 03:27:12 │ 100.00% of recording │
|
|
├──────────────────────────────┼──────────┼──────────────────────┤
|
|
│ Total silence duration │ 00:00:00 │ 0.00% of recording │
|
|
╘══════════════════════════════╧══════════╧══════════════════════╛
|
|
===================Duration statistics of SPEECHIO_ASR_ZH00012===================
|
|
Cut statistics:
|
|
╒═══════════════════════════╤══════════╕
|
|
│ Cuts count: │ 1170 │
|
|
├───────────────────────────┼──────────┤
|
|
│ Total duration (hh:mm:ss) │ 03:23:34 │
|
|
├───────────────────────────┼──────────┤
|
|
│ mean │ 10.4 │
|
|
├───────────────────────────┼──────────┤
|
|
│ std │ 3.5 │
|
|
├───────────────────────────┼──────────┤
|
|
│ min │ 0.8 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 25% │ 8.0 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 50% │ 11.5 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 75% │ 13.2 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 99% │ 15.0 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 99.5% │ 15.1 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 99.9% │ 15.7 │
|
|
├───────────────────────────┼──────────┤
|
|
│ max │ 20.3 │
|
|
├───────────────────────────┼──────────┤
|
|
│ Recordings available: │ 1170 │
|
|
├───────────────────────────┼──────────┤
|
|
│ Features available: │ 1170 │
|
|
├───────────────────────────┼──────────┤
|
|
│ Supervisions available: │ 1170 │
|
|
╘═══════════════════════════╧══════════╛
|
|
Speech duration statistics:
|
|
╒══════════════════════════════╤══════════╤══════════════════════╕
|
|
│ Total speech duration │ 03:23:34 │ 100.00% of recording │
|
|
├──────────────────────────────┼──────────┼──────────────────────┤
|
|
│ Total speaking time duration │ 03:23:34 │ 100.00% of recording │
|
|
├──────────────────────────────┼──────────┼──────────────────────┤
|
|
│ Total silence duration │ 00:00:00 │ 0.00% of recording │
|
|
╘══════════════════════════════╧══════════╧══════════════════════╛
|
|
===================Duration statistics of SPEECHIO_ASR_ZH00013===================
|
|
Cut statistics:
|
|
╒═══════════════════════════╤══════════╕
|
|
│ Cuts count: │ 1321 │
|
|
├───────────────────────────┼──────────┤
|
|
│ Total duration (hh:mm:ss) │ 01:46:41 │
|
|
├───────────────────────────┼──────────┤
|
|
│ mean │ 4.8 │
|
|
├───────────────────────────┼──────────┤
|
|
│ std │ 1.5 │
|
|
├───────────────────────────┼──────────┤
|
|
│ min │ 0.9 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 25% │ 3.8 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 50% │ 4.8 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 75% │ 5.8 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 99% │ 8.5 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 99.5% │ 9.1 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 99.9% │ 9.5 │
|
|
├───────────────────────────┼──────────┤
|
|
│ max │ 9.7 │
|
|
├───────────────────────────┼──────────┤
|
|
│ Recordings available: │ 1321 │
|
|
├───────────────────────────┼──────────┤
|
|
│ Features available: │ 1321 │
|
|
├───────────────────────────┼──────────┤
|
|
│ Supervisions available: │ 1321 │
|
|
╘═══════════════════════════╧══════════╛
|
|
Speech duration statistics:
|
|
╒══════════════════════════════╤══════════╤══════════════════════╕
|
|
│ Total speech duration │ 01:46:41 │ 100.00% of recording │
|
|
├──────────────────────────────┼──────────┼──────────────────────┤
|
|
│ Total speaking time duration │ 01:46:41 │ 100.00% of recording │
|
|
├──────────────────────────────┼──────────┼──────────────────────┤
|
|
│ Total silence duration │ 00:00:00 │ 0.00% of recording │
|
|
╘══════════════════════════════╧══════════╧══════════════════════╛
|
|
===================Duration statistics of SPEECHIO_ASR_ZH00014===================
|
|
Cut statistics:
|
|
╒═══════════════════════════╤══════════╕
|
|
│ Cuts count: │ 856 │
|
|
├───────────────────────────┼──────────┤
|
|
│ Total duration (hh:mm:ss) │ 01:00:39 │
|
|
├───────────────────────────┼──────────┤
|
|
│ mean │ 4.3 │
|
|
├───────────────────────────┼──────────┤
|
|
│ std │ 1.8 │
|
|
├───────────────────────────┼──────────┤
|
|
│ min │ 0.8 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 25% │ 2.9 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 50% │ 4.1 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 75% │ 5.5 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 99% │ 8.5 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 99.5% │ 9.2 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 99.9% │ 10.0 │
|
|
├───────────────────────────┼──────────┤
|
|
│ max │ 11.1 │
|
|
├───────────────────────────┼──────────┤
|
|
│ Recordings available: │ 856 │
|
|
├───────────────────────────┼──────────┤
|
|
│ Features available: │ 856 │
|
|
├───────────────────────────┼──────────┤
|
|
│ Supervisions available: │ 856 │
|
|
╘═══════════════════════════╧══════════╛
|
|
Speech duration statistics:
|
|
╒══════════════════════════════╤══════════╤══════════════════════╕
|
|
│ Total speech duration │ 01:00:39 │ 100.00% of recording │
|
|
├──────────────────────────────┼──────────┼──────────────────────┤
|
|
│ Total speaking time duration │ 01:00:39 │ 100.00% of recording │
|
|
├──────────────────────────────┼──────────┼──────────────────────┤
|
|
│ Total silence duration │ 00:00:00 │ 0.00% of recording │
|
|
╘══════════════════════════════╧══════════╧══════════════════════╛
|
|
===================Duration statistics of SPEECHIO_ASR_ZH00015===================
|
|
Cut statistics:
|
|
╒═══════════════════════════╤══════════╕
|
|
│ Cuts count: │ 1168 │
|
|
├───────────────────────────┼──────────┤
|
|
│ Total duration (hh:mm:ss) │ 02:08:52 │
|
|
├───────────────────────────┼──────────┤
|
|
│ mean │ 6.6 │
|
|
├───────────────────────────┼──────────┤
|
|
│ std │ 2.0 │
|
|
├───────────────────────────┼──────────┤
|
|
│ min │ 1.2 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 25% │ 5.3 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 50% │ 6.8 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 75% │ 8.2 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 99% │ 9.9 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 99.5% │ 10.0 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 99.9% │ 10.1 │
|
|
├───────────────────────────┼──────────┤
|
|
│ max │ 15.5 │
|
|
├───────────────────────────┼──────────┤
|
|
│ Recordings available: │ 1168 │
|
|
├───────────────────────────┼──────────┤
|
|
│ Features available: │ 1168 │
|
|
├───────────────────────────┼──────────┤
|
|
│ Supervisions available: │ 1168 │
|
|
╘═══════════════════════════╧══════════╛
|
|
Speech duration statistics:
|
|
╒══════════════════════════════╤══════════╤══════════════════════╕
|
|
│ Total speech duration │ 02:08:52 │ 100.00% of recording │
|
|
├──────────────────────────────┼──────────┼──────────────────────┤
|
|
│ Total speaking time duration │ 02:08:52 │ 100.00% of recording │
|
|
├──────────────────────────────┼──────────┼──────────────────────┤
|
|
│ Total silence duration │ 00:00:00 │ 0.00% of recording │
|
|
╘══════════════════════════════╧══════════╧══════════════════════╛
|
|
===================Duration statistics of SPEECHIO_ASR_ZH00016===================
|
|
Cut statistics:
|
|
╒═══════════════════════════╤══════════╕
|
|
│ Cuts count: │ 1201 │
|
|
├───────────────────────────┼──────────┤
|
|
│ Total duration (hh:mm:ss) │ 01:00:46 │
|
|
├───────────────────────────┼──────────┤
|
|
│ mean │ 3.0 │
|
|
├───────────────────────────┼──────────┤
|
|
│ std │ 2.0 │
|
|
├───────────────────────────┼──────────┤
|
|
│ min │ 0.9 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 25% │ 1.6 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 50% │ 2.3 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 75% │ 3.8 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 99% │ 9.0 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 99.5% │ 9.5 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 99.9% │ 9.7 │
|
|
├───────────────────────────┼──────────┤
|
|
│ max │ 9.9 │
|
|
├───────────────────────────┼──────────┤
|
|
│ Recordings available: │ 1201 │
|
|
├───────────────────────────┼──────────┤
|
|
│ Features available: │ 1201 │
|
|
├───────────────────────────┼──────────┤
|
|
│ Supervisions available: │ 1201 │
|
|
╘═══════════════════════════╧══════════╛
|
|
Speech duration statistics:
|
|
╒══════════════════════════════╤══════════╤══════════════════════╕
|
|
│ Total speech duration │ 01:00:46 │ 100.00% of recording │
|
|
├──────────────────────────────┼──────────┼──────────────────────┤
|
|
│ Total speaking time duration │ 01:00:46 │ 100.00% of recording │
|
|
├──────────────────────────────┼──────────┼──────────────────────┤
|
|
│ Total silence duration │ 00:00:00 │ 0.00% of recording │
|
|
╘══════════════════════════════╧══════════╧══════════════════════╛
|
|
===================Duration statistics of SPEECHIO_ASR_ZH00017===================
|
|
Cut statistics:
|
|
╒═══════════════════════════╤══════════╕
|
|
│ Cuts count: │ 1271 │
|
|
├───────────────────────────┼──────────┤
|
|
│ Total duration (hh:mm:ss) │ 01:47:57 │
|
|
├───────────────────────────┼──────────┤
|
|
│ mean │ 5.1 │
|
|
├───────────────────────────┼──────────┤
|
|
│ std │ 2.2 │
|
|
├───────────────────────────┼──────────┤
|
|
│ min │ 1.0 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 25% │ 3.3 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 50% │ 4.9 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 75% │ 6.8 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 99% │ 9.7 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 99.5% │ 10.0 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 99.9% │ 10.0 │
|
|
├───────────────────────────┼──────────┤
|
|
│ max │ 10.4 │
|
|
├───────────────────────────┼──────────┤
|
|
│ Recordings available: │ 1271 │
|
|
├───────────────────────────┼──────────┤
|
|
│ Features available: │ 1271 │
|
|
├───────────────────────────┼──────────┤
|
|
│ Supervisions available: │ 1271 │
|
|
╘═══════════════════════════╧══════════╛
|
|
Speech duration statistics:
|
|
╒══════════════════════════════╤══════════╤══════════════════════╕
|
|
│ Total speech duration │ 01:47:57 │ 100.00% of recording │
|
|
├──────────────────────────────┼──────────┼──────────────────────┤
|
|
│ Total speaking time duration │ 01:47:57 │ 100.00% of recording │
|
|
├──────────────────────────────┼──────────┼──────────────────────┤
|
|
│ Total silence duration │ 00:00:00 │ 0.00% of recording │
|
|
╘══════════════════════════════╧══════════╧══════════════════════╛
|
|
===================Duration statistics of SPEECHIO_ASR_ZH00018===================
|
|
Cut statistics:
|
|
╒═══════════════════════════╤══════════╕
|
|
│ Cuts count: │ 899 │
|
|
├───────────────────────────┼──────────┤
|
|
│ Total duration (hh:mm:ss) │ 00:51:12 │
|
|
├───────────────────────────┼──────────┤
|
|
│ mean │ 3.4 │
|
|
├───────────────────────────┼──────────┤
|
|
│ std │ 1.2 │
|
|
├───────────────────────────┼──────────┤
|
|
│ min │ 1.3 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 25% │ 2.5 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 50% │ 3.1 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 75% │ 4.1 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 99% │ 6.7 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 99.5% │ 7.1 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 99.9% │ 8.2 │
|
|
├───────────────────────────┼──────────┤
|
|
│ max │ 9.2 │
|
|
├───────────────────────────┼──────────┤
|
|
│ Recordings available: │ 899 │
|
|
├───────────────────────────┼──────────┤
|
|
│ Features available: │ 899 │
|
|
├───────────────────────────┼──────────┤
|
|
│ Supervisions available: │ 899 │
|
|
╘═══════════════════════════╧══════════╛
|
|
Speech duration statistics:
|
|
╒══════════════════════════════╤══════════╤══════════════════════╕
|
|
│ Total speech duration │ 00:51:12 │ 100.00% of recording │
|
|
├──────────────────────────────┼──────────┼──────────────────────┤
|
|
│ Total speaking time duration │ 00:51:12 │ 100.00% of recording │
|
|
├──────────────────────────────┼──────────┼──────────────────────┤
|
|
│ Total silence duration │ 00:00:00 │ 0.00% of recording │
|
|
╘══════════════════════════════╧══════════╧══════════════════════╛
|
|
===================Duration statistics of SPEECHIO_ASR_ZH00019===================
|
|
Cut statistics:
|
|
╒═══════════════════════════╤══════════╕
|
|
│ Cuts count: │ 615 │
|
|
├───────────────────────────┼──────────┤
|
|
│ Total duration (hh:mm:ss) │ 00:41:43 │
|
|
├───────────────────────────┼──────────┤
|
|
│ mean │ 4.1 │
|
|
├───────────────────────────┼──────────┤
|
|
│ std │ 1.5 │
|
|
├───────────────────────────┼──────────┤
|
|
│ min │ 1.3 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 25% │ 2.8 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 50% │ 3.9 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 75% │ 5.2 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 99% │ 7.9 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 99.5% │ 8.1 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 99.9% │ 8.6 │
|
|
├───────────────────────────┼──────────┤
|
|
│ max │ 8.8 │
|
|
├───────────────────────────┼──────────┤
|
|
│ Recordings available: │ 615 │
|
|
├───────────────────────────┼──────────┤
|
|
│ Features available: │ 615 │
|
|
├───────────────────────────┼──────────┤
|
|
│ Supervisions available: │ 615 │
|
|
╘═══════════════════════════╧══════════╛
|
|
Speech duration statistics:
|
|
╒══════════════════════════════╤══════════╤══════════════════════╕
|
|
│ Total speech duration │ 00:41:43 │ 100.00% of recording │
|
|
├──────────────────────────────┼──────────┼──────────────────────┤
|
|
│ Total speaking time duration │ 00:41:43 │ 100.00% of recording │
|
|
├──────────────────────────────┼──────────┼──────────────────────┤
|
|
│ Total silence duration │ 00:00:00 │ 0.00% of recording │
|
|
╘══════════════════════════════╧══════════╧══════════════════════╛
|
|
===================Duration statistics of SPEECHIO_ASR_ZH00020===================
|
|
Cut statistics:
|
|
╒═══════════════════════════╤══════════╕
|
|
│ Cuts count: │ 1590 │
|
|
├───────────────────────────┼──────────┤
|
|
│ Total duration (hh:mm:ss) │ 02:10:54 │
|
|
├───────────────────────────┼──────────┤
|
|
│ mean │ 4.9 │
|
|
├───────────────────────────┼──────────┤
|
|
│ std │ 1.5 │
|
|
├───────────────────────────┼──────────┤
|
|
│ min │ 1.2 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 25% │ 3.8 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 50% │ 4.9 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 75% │ 6.0 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 99% │ 8.5 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 99.5% │ 8.7 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 99.9% │ 9.2 │
|
|
├───────────────────────────┼──────────┤
|
|
│ max │ 10.4 │
|
|
├───────────────────────────┼──────────┤
|
|
│ Recordings available: │ 1590 │
|
|
├───────────────────────────┼──────────┤
|
|
│ Features available: │ 1590 │
|
|
├───────────────────────────┼──────────┤
|
|
│ Supervisions available: │ 1590 │
|
|
╘═══════════════════════════╧══════════╛
|
|
Speech duration statistics:
|
|
╒══════════════════════════════╤══════════╤══════════════════════╕
|
|
│ Total speech duration │ 02:10:54 │ 100.00% of recording │
|
|
├──────────────────────────────┼──────────┼──────────────────────┤
|
|
│ Total speaking time duration │ 02:10:54 │ 100.00% of recording │
|
|
├──────────────────────────────┼──────────┼──────────────────────┤
|
|
│ Total silence duration │ 00:00:00 │ 0.00% of recording │
|
|
╘══════════════════════════════╧══════════╧══════════════════════╛
|
|
===================Duration statistics of SPEECHIO_ASR_ZH00021===================
|
|
Cut statistics:
|
|
╒═══════════════════════════╤══════════╕
|
|
│ Cuts count: │ 1035 │
|
|
├───────────────────────────┼──────────┤
|
|
│ Total duration (hh:mm:ss) │ 01:44:07 │
|
|
├───────────────────────────┼──────────┤
|
|
│ mean │ 6.0 │
|
|
├───────────────────────────┼──────────┤
|
|
│ std │ 1.8 │
|
|
├───────────────────────────┼──────────┤
|
|
│ min │ 1.1 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 25% │ 4.7 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 50% │ 5.9 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 75% │ 7.3 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 99% │ 10.4 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 99.5% │ 10.6 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 99.9% │ 11.0 │
|
|
├───────────────────────────┼──────────┤
|
|
│ max │ 11.1 │
|
|
├───────────────────────────┼──────────┤
|
|
│ Recordings available: │ 1035 │
|
|
├───────────────────────────┼──────────┤
|
|
│ Features available: │ 1035 │
|
|
├───────────────────────────┼──────────┤
|
|
│ Supervisions available: │ 1035 │
|
|
╘═══════════════════════════╧══════════╛
|
|
Speech duration statistics:
|
|
╒══════════════════════════════╤══════════╤══════════════════════╕
|
|
│ Total speech duration │ 01:44:07 │ 100.00% of recording │
|
|
├──────────────────────────────┼──────────┼──────────────────────┤
|
|
│ Total speaking time duration │ 01:44:07 │ 100.00% of recording │
|
|
├──────────────────────────────┼──────────┼──────────────────────┤
|
|
│ Total silence duration │ 00:00:00 │ 0.00% of recording │
|
|
╘══════════════════════════════╧══════════╧══════════════════════╛
|
|
===================Duration statistics of SPEECHIO_ASR_ZH00022===================
|
|
Cut statistics:
|
|
╒═══════════════════════════╤══════════╕
|
|
│ Cuts count: │ 1026 │
|
|
├───────────────────────────┼──────────┤
|
|
│ Total duration (hh:mm:ss) │ 01:40:43 │
|
|
├───────────────────────────┼──────────┤
|
|
│ mean │ 5.9 │
|
|
├───────────────────────────┼──────────┤
|
|
│ std │ 2.2 │
|
|
├───────────────────────────┼──────────┤
|
|
│ min │ 0.9 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 25% │ 4.4 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 50% │ 5.8 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 75% │ 7.1 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 99% │ 12.1 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 99.5% │ 12.7 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 99.9% │ 13.9 │
|
|
├───────────────────────────┼──────────┤
|
|
│ max │ 14.0 │
|
|
├───────────────────────────┼──────────┤
|
|
│ Recordings available: │ 1026 │
|
|
├───────────────────────────┼──────────┤
|
|
│ Features available: │ 1026 │
|
|
├───────────────────────────┼──────────┤
|
|
│ Supervisions available: │ 1026 │
|
|
╘═══════════════════════════╧══════════╛
|
|
Speech duration statistics:
|
|
╒══════════════════════════════╤══════════╤══════════════════════╕
|
|
│ Total speech duration │ 01:40:43 │ 100.00% of recording │
|
|
├──────────────────────────────┼──────────┼──────────────────────┤
|
|
│ Total speaking time duration │ 01:40:43 │ 100.00% of recording │
|
|
├──────────────────────────────┼──────────┼──────────────────────┤
|
|
│ Total silence duration │ 00:00:00 │ 0.00% of recording │
|
|
╘══════════════════════════════╧══════════╧══════════════════════╛
|
|
===================Duration statistics of SPEECHIO_ASR_ZH00023===================
|
|
Cut statistics:
|
|
╒═══════════════════════════╤══════════╕
|
|
│ Cuts count: │ 1528 │
|
|
├───────────────────────────┼──────────┤
|
|
│ Total duration (hh:mm:ss) │ 02:06:51 │
|
|
├───────────────────────────┼──────────┤
|
|
│ mean │ 5.0 │
|
|
├───────────────────────────┼──────────┤
|
|
│ std │ 2.5 │
|
|
├───────────────────────────┼──────────┤
|
|
│ min │ 0.5 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 25% │ 3.1 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 50% │ 4.5 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 75% │ 6.6 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 99% │ 12.3 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 99.5% │ 13.9 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 99.9% │ 15.8 │
|
|
├───────────────────────────┼──────────┤
|
|
│ max │ 16.8 │
|
|
├───────────────────────────┼──────────┤
|
|
│ Recordings available: │ 1528 │
|
|
├───────────────────────────┼──────────┤
|
|
│ Features available: │ 1528 │
|
|
├───────────────────────────┼──────────┤
|
|
│ Supervisions available: │ 1528 │
|
|
╘═══════════════════════════╧══════════╛
|
|
Speech duration statistics:
|
|
╒══════════════════════════════╤══════════╤══════════════════════╕
|
|
│ Total speech duration │ 02:06:51 │ 100.00% of recording │
|
|
├──────────────────────────────┼──────────┼──────────────────────┤
|
|
│ Total speaking time duration │ 02:06:51 │ 100.00% of recording │
|
|
├──────────────────────────────┼──────────┼──────────────────────┤
|
|
│ Total silence duration │ 00:00:00 │ 0.00% of recording │
|
|
╘══════════════════════════════╧══════════╧══════════════════════╛
|
|
===================Duration statistics of SPEECHIO_ASR_ZH00024===================
|
|
Cut statistics:
|
|
╒═══════════════════════════╤══════════╕
|
|
│ Cuts count: │ 1930 │
|
|
├───────────────────────────┼──────────┤
|
|
│ Total duration (hh:mm:ss) │ 02:39:02 │
|
|
├───────────────────────────┼──────────┤
|
|
│ mean │ 4.9 │
|
|
├───────────────────────────┼──────────┤
|
|
│ std │ 2.0 │
|
|
├───────────────────────────┼──────────┤
|
|
│ min │ 0.9 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 25% │ 3.4 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 50% │ 4.7 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 75% │ 6.2 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 99% │ 10.3 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 99.5% │ 10.9 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 99.9% │ 12.0 │
|
|
├───────────────────────────┼──────────┤
|
|
│ max │ 12.6 │
|
|
├───────────────────────────┼──────────┤
|
|
│ Recordings available: │ 1930 │
|
|
├───────────────────────────┼──────────┤
|
|
│ Features available: │ 1930 │
|
|
├───────────────────────────┼──────────┤
|
|
│ Supervisions available: │ 1930 │
|
|
╘═══════════════════════════╧══════════╛
|
|
Speech duration statistics:
|
|
╒══════════════════════════════╤══════════╤══════════════════════╕
|
|
│ Total speech duration │ 02:39:02 │ 100.00% of recording │
|
|
├──────────────────────────────┼──────────┼──────────────────────┤
|
|
│ Total speaking time duration │ 02:39:02 │ 100.00% of recording │
|
|
├──────────────────────────────┼──────────┼──────────────────────┤
|
|
│ Total silence duration │ 00:00:00 │ 0.00% of recording │
|
|
╘══════════════════════════════╧══════════╧══════════════════════╛
|
|
===================Duration statistics of SPEECHIO_ASR_ZH00025===================
|
|
Cut statistics:
|
|
╒═══════════════════════════╤══════════╕
|
|
│ Cuts count: │ 1164 │
|
|
├───────────────────────────┼──────────┤
|
|
│ Total duration (hh:mm:ss) │ 01:24:42 │
|
|
├───────────────────────────┼──────────┤
|
|
│ mean │ 4.4 │
|
|
├───────────────────────────┼──────────┤
|
|
│ std │ 1.9 │
|
|
├───────────────────────────┼──────────┤
|
|
│ min │ 0.9 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 25% │ 2.9 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 50% │ 4.1 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 75% │ 5.6 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 99% │ 10.4 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 99.5% │ 10.9 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 99.9% │ 12.5 │
|
|
├───────────────────────────┼──────────┤
|
|
│ max │ 13.0 │
|
|
├───────────────────────────┼──────────┤
|
|
│ Recordings available: │ 1164 │
|
|
├───────────────────────────┼──────────┤
|
|
│ Features available: │ 1164 │
|
|
├───────────────────────────┼──────────┤
|
|
│ Supervisions available: │ 1164 │
|
|
╘═══════════════════════════╧══════════╛
|
|
Speech duration statistics:
|
|
╒══════════════════════════════╤══════════╤══════════════════════╕
|
|
│ Total speech duration │ 01:24:42 │ 100.00% of recording │
|
|
├──────────────────────────────┼──────────┼──────────────────────┤
|
|
│ Total speaking time duration │ 01:24:42 │ 100.00% of recording │
|
|
├──────────────────────────────┼──────────┼──────────────────────┤
|
|
│ Total silence duration │ 00:00:00 │ 0.00% of recording │
|
|
╘══════════════════════════════╧══════════╧══════════════════════╛
|
|
===================Duration statistics of SPEECHIO_ASR_ZH00026===================
|
|
Cut statistics:
|
|
╒═══════════════════════════╤══════════╕
|
|
│ Cuts count: │ 1336 │
|
|
├───────────────────────────┼──────────┤
|
|
│ Total duration (hh:mm:ss) │ 02:25:38 │
|
|
├───────────────────────────┼──────────┤
|
|
│ mean │ 6.5 │
|
|
├───────────────────────────┼──────────┤
|
|
│ std │ 2.3 │
|
|
├───────────────────────────┼──────────┤
|
|
│ min │ 0.5 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 25% │ 4.9 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 50% │ 6.8 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 75% │ 8.3 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 99% │ 10.4 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 99.5% │ 11.9 │
|
|
├───────────────────────────┼──────────┤
|
|
│ 99.9% │ 12.9 │
|
|
├───────────────────────────┼──────────┤
|
|
│ max │ 13.3 │
|
|
├───────────────────────────┼──────────┤
|
|
│ Recordings available: │ 1336 │
|
|
├───────────────────────────┼──────────┤
|
|
│ Features available: │ 1336 │
|
|
├───────────────────────────┼──────────┤
|
|
│ Supervisions available: │ 1336 │
|
|
╘═══════════════════════════╧══════════╛
|
|
Speech duration statistics:
|
|
╒══════════════════════════════╤══════════╤══════════════════════╕
|
|
│ Total speech duration │ 02:25:38 │ 100.00% of recording │
|
|
├──────────────────────────────┼──────────┼──────────────────────┤
|
|
│ Total speaking time duration │ 02:25:38 │ 100.00% of recording │
|
|
├──────────────────────────────┼──────────┼──────────────────────┤
|
|
│ Total silence duration │ 00:00:00 │ 0.00% of recording │
|
|
╘══════════════════════════════╧══════════╧══════════════════════╛
|
|
|
|
"""
|