Merge pull request #5 from hyhuc0079/hyhuc0079-patch-2

v3ucn · web-flow · commit 9db84a19c5a1 · 2024-02-02T20:05:56.000+08:00
Hyhuc0079 patch 2
diff --git a/audio_slicer_pre.py b/audio_slicer_pre.py
@@ -13,7 +13,7 @@
     "--max_sec", "-M", type=int, default=5000, help="Maximum seconds of a slice"
 )
 parser.add_argument(
-    "--model_name",
+    "--dataset_path",
     type=str,
     default="inputs",
     help="Directory of input wav files",
@@ -38,7 +38,7 @@
     os.makedirs(folder_path)
 
 # 遍历指定目录下的所有.wav文件
-audio_directory = f'{args.model_name}'
+audio_directory = f'{args.dataset_path}'
 for filename in os.listdir(audio_directory):
     file_path = os.path.join(audio_directory, filename)
     if os.path.isfile(file_path) and filename.endswith('.wav'):
diff --git a/webui_dataset.py b/webui_dataset.py
@@ -11,21 +11,21 @@
 
 
 def do_slice(
-    model_name: str,
+    dataset_path: str,
     min_sec: int,
     max_sec: int,
     min_silence_dur_ms: int,
 ):
-    if model_name == "":
-        return "Error: 角色名不能为空"
+    if dataset_path == "":
+        return "Error: 数据集路径不能为空"
     logger.info("Start slicing...")
-    output_dir = os.path.join(dataset_root, model_name, ".\\wavs")
+    output_dir = os.path.join(dataset_root, dataset_path, ".\\wavs")
 
 
     cmd = [
         "audio_slicer_pre.py",
-        "--model_name",
-        model_name,
+        "--dataset_path",
+        dataset_path,
         "--min_sec",
         str(min_sec),
         "--max_sec",
@@ -115,6 +115,8 @@ def do_transcribe_all(
 with gr.Blocks(theme="NoCrypt/miku") as app:
     gr.Markdown(initial_md)
     model_name = gr.Textbox(label="角色名",placeholder="请输入角色名")
+    ##add by hyh 添加一个数据集路径的文本框
+    dataset_path = gr.Textbox(label="数据集路径",placeholder="设置切割数据集样本路径")
     
     with gr.Accordion("音频素材切割"):
         with gr.Row():
@@ -158,7 +160,7 @@ def do_transcribe_all(
 
     slice_button.click(
         do_slice,
-        inputs=[model_name, min_sec, max_sec, min_silence_dur_ms],
+        inputs=[dataset_path, min_sec, max_sec, min_silence_dur_ms],
         outputs=[result1],
     )
     transcribe_button_whisper.click(
@@ -212,4 +214,4 @@ def do_transcribe_all(
 )
 args = parser.parse_args()
 
-app.launch(inbrowser=not args.no_autolaunch, server_name=args.server_name)
+app.launch(inbrowser=not args.no_autolaunch, server_name=args.server_name, server_port=7971)