Spaces:

archivartaunik
/

Stt

Running

App Files Files Community

archivartaunik commited on Mar 21, 2025

Commit

1cfce90

verified ·

1 Parent(s): d8ce896

Rename app (11).py to app.py

Browse files

Files changed (2) hide show

app (11).py +0 -179
app.py +292 -0

app (11).py DELETED Viewed

@@ -1,179 +0,0 @@
-import os
-import gradio as gr
-import google.generativeai as genai
-import mimetypes
-from pydub import AudioSegment
-GEMINI_API_KEY = os.getenv("gemini")
-MODEL_NAME_TH = os.getenv("modTH")
-MODEL_NAME = os.getenv("mod")
-genai.configure(api_key=GEMINI_API_KEY)
-def transcribe_audio(audio_file):
-    try:
-        mime_type, _ = mimetypes.guess_type(audio_file)
-        if mime_type is None:
-            return "Немагчыма вызначыць тып файла. Падтрымліваюцца толькі аўдыяфайлы."
-        with open(audio_file, "rb") as f:
-            audio_data = f.read()
-        prompt_text = (
-            """The user wants me to transcribe the audio into subtitles in SRT format, with a maximum of three words per one subtitle.
-I need to listen to the audio and create subtitles with timestamps. Check time format hours:minutes:seconds,milliseconds (00:00:00,000) after creating all.  Example SRT format:
-1
-00:00:01,670 --> 00:00:02,030
-За мяжою, за мяжою,
-2
-00:00:02,270 --> 00:00:03,850
-ні сваё і не чужое.
-3
-00:00:04,240 --> 00:00:05,760
-Хоць спявай ты, хоць ты грай,
-4
-00:00:05,770 --> 00:00:06,250
-а навокал іншы край.
-            """
-        )
-        model = genai.GenerativeModel(MODEL_NAME_TH)
-        response = model.generate_content(
-            [prompt_text, {"mime_type": mime_type, "data": audio_data}]
-        )
-        if response.text:
-            transcript = response.text.strip()
-        else:
-            transcript = "Не атрымалася транскрыбаваць аўдыя. Магчыма, памылка з API."
-        return transcript
-    except FileNotFoundError:
-        return "Памылка: Файл не знойдзены."
-    except genai.APIError as e:
-        return f"Памылка API: {str(e)}"
-    except Exception as e:
-        return f"Нечаканая памылка: {str(e)}"
-def fix_subtitles_format(transcript):
-    """
-    Дадатковы запыт да мадэлі, які выпраўляе фармат часоў у субцітрах.
-    """
-    try:
-        prompt_fix = (
-            f"Не змяняй тэксты, выправі толькі часовы фармат у субцітрах на правільны, вось прыклад 00:00:01,589 \n"
-            f" У адказ напішы толькі субцітры: {transcript}"
-        )
-        model = genai.GenerativeModel(MODEL_NAME)
-        response_fix = model.generate_content(prompt_fix)
-        if response_fix.text:
-            fixed_transcript = response_fix.text.strip()
-        else:
-            fixed_transcript = transcript
-        return fixed_transcript
-    except Exception as e:
-        return transcript
-def create_srt(transcript, filename="subtitles.srt"):
-    try:
-        with open(filename, "w", encoding="utf-8") as f:
-            f.write(transcript)
-        return transcript, filename
-    except Exception as e:
-        return f"Памылка пры запісе SRT-файла: {str(e)}", None
-def process_audio(audio):
-    transcript = transcribe_audio(audio)
-    if transcript.startswith("Памылка"):
-        return transcript, None
-    # Дадаем другі запыт для выпраўлення фармату часоў у субцітрах
-    fixed_transcript = fix_subtitles_format(transcript)
-    text, srt_file = create_srt(fixed_transcript)
-    return text, srt_file
-def extract_audio_from_video(video_file):
-    try:
-        audio = AudioSegment.from_file(video_file)
-        audio_path = "extracted_audio.mp3"
-        audio.export(audio_path, format="mp3")
-        return audio_path, None
-    except Exception as e:
-        return None, f"Памылка пры выдзяленні аўдыі з відэафайла: {str(e)}"
-def process_video(video):
-    audio_path, error = extract_audio_from_video(video)
-    if error:
-        return error, None
-    return process_audio(audio_path)
-def process_file(audio, video):
-    if audio is not None:
-        return process_audio(audio)
-    elif video is not None:
-        return process_video(video)
-    else:
-        return "Няма файла для апрацоўкі.", None
-def update_on_audio_change(audio):
-    if audio is not None:
-        return gr.update(value=None, interactive=False)
-    else:
-        return gr.update(interactive=True)
-def update_on_video_change(video):
-    if video is not None:
-        return gr.update(value=None, interactive=False)
-    else:
-        return gr.update(interactive=True)
-def translate_transcript(transcript, target_language):
-    try:
-        prompt_text = (
-            f"перакладзі толькі тэксты субцітраў на {target_language} мову. Астатняя пакінь як ёсць."
-            f"Тэкст:\n{transcript}"
-        )
-        model = genai.GenerativeModel(MODEL_NAME)
-        response = model.generate_content(prompt_text)
-        if response.text:
-            translated = response.text.strip()
-        else:
-            translated = "Не атрымалася перакласці тэкст. Магчыма, памылка з API."
-        translated_srt_filename = "translated_subtitles.srt"
-        with open(translated_srt_filename, "w", encoding="utf-8") as f:
-            f.write(translated)
-        return translated, translated_srt_filename
-    except Exception as e:
-        return f"Памылка пры перакладзе: {str(e)}", None
-with gr.Blocks() as demo:
-    gr.Markdown("# Транскрыпцыя аўдыя для беларускай мовы")
-    gr.Markdown(
-        """
-## Загрузіце аўдыёфайл або відэафайл да 15 хвілін.  Калі загружаны аўдыёфайл, відэа неактыўна, і наадварот.
-Субцітры будуць аўтаматычна згенераваны разам з файлам субцітраў.
-[Далучайцеся да беларускаймоўнай суполкі ў ТГ](https://t.me/belarusai)
-**Падтрымаць праект:** [Buy me a coffee](https://buymeacoffee.com/tuteishygpt)
-        """
-    )
-    with gr.Row():
-        audio_input = gr.Audio(type="filepath", label="Аўдыёфайл")
-        video_input = gr.Video(label="Відэафайл")
-    audio_input.change(fn=update_on_audio_change, inputs=audio_input, outputs=video_input)
-    video_input.change(fn=update_on_video_change, inputs=video_input, outputs=audio_input)
-    btn = gr.Button("Апрацаваць")
-    transcript_output = gr.Textbox(label="Транскрыпцыя", lines=10)
-    file_output = gr.File(label="SRT-файл")
-    btn.click(fn=process_file, inputs=[audio_input, video_input], outputs=[transcript_output, file_output])
-    gr.Markdown("## Пераклад субцітраў")
-    with gr.Row():
-        language_dropdown = gr.Dropdown(
-            choices=["English", "Руcкая", "Польская", "Літоўская", "Нямецкая"],
-            label="Выберы мову перакладу", value="English"
-        )
-        translate_btn = gr.Button("Пераклад")
-    translation_output = gr.Textbox(label="Пераклад", lines=10)
-    translation_file_output = gr.File(label="Translated SRT-файл")
-    translate_btn.click(
-        fn=translate_transcript,
-        inputs=[transcript_output, language_dropdown],
-        outputs=[translation_output, translation_file_output]
-    )
-demo.launch()

app.py ADDED Viewed

	@@ -0,0 +1,292 @@

+import gradio as gr
+from argparse import Namespace
+import os
+import shutil
+import sys
+import yt_dlp  # Дададзены імпарт для працы з YouTube
+from sub_tools.media.converter import hls_to_media, media_to_signature, video_to_audio
+from sub_tools.media.segmenter import segment_audio
+from sub_tools.subtitles.combiner import combine_subtitles
+from sub_tools.system.directory import change_directory
+from sub_tools.system.console import header, success, error
+from sub_tools.transcribe import transcribe
+GEMINI_API_KEY = os.getenv("gemini")
+genai.configure(api_key=GEMINI_API_KEY)
+def main_logic(args: Namespace) -> tuple:
+    """
+    Асноўная логіка прыкладання: ад загрузкі відэа/аўдыё да зліцця субтытраў.
+    Пасля зліцця субтытраў вяртае (тэкст субтытраў, шлях да SRT‑файла для спампоўкі).
+    """
+    output_str = ""
+    subtitles_text = ""
+    srt_file_path = None
+    try:
+        change_directory(args.output_path)
+        step = 1
+        if "video" in args.tasks:
+            if not args.hls_url:
+                output_str += f"{step}. Download Video: No video file uploaded\n"
+                raise Exception("No video file uploaded")
+            header(f"{step}. Download Video")
+            output_str += f"{step}. Download Video: Started\n"
+            hls_to_media(args.hls_url, args.video_file, False, args.overwrite)
+            success("Done!")
+            output_str += "Done!\n"
+            step += 1
+        if "audio" in args.tasks:
+            header(f"{step}. Video to Audio")
+            output_str += f"{step}. Video to Audio: Started\n"
+            video_to_audio(args.video_file, args.audio_file, args.overwrite)
+            success("Done!")
+            output_str += "Done!\n"
+            step += 1
+        if "signature" in args.tasks:
+            header(f"{step}. Audio to Signature")
+            output_str += f"{step}. Audio to Signature: Started\n"
+            media_to_signature(args.audio_file, args.signature_file, args.overwrite)
+            success("Done!")
+            output_str += "Done!\n"
+            step += 1
+        if "segment" in args.tasks:
+            header(f"{step}. Segment Audio")
+            output_str += f"{step}. Segment Audio: Started\n"
+            segment_audio(args.audio_file, args.audio_segment_prefix, args.audio_segment_format, args.audio_segment_length, args.overwrite)
+            success("Done!")
+            output_str += "Done!\n"
+            step += 1
+        if "transcribe" in args.tasks:
+            if not (args.gemini_api_key and args.gemini_api_key.strip()):
+                output_str += f"{step}. Transcribe Audio: No Gemini API Key provided\n"
+                raise Exception("No Gemini API Key provided")
+            header(f"{step}. Transcribe Audio")
+            output_str += f"{step}. Transcribe Audio: Started\n"
+            transcribe(args)
+            success("Done!")
+            output_str += "Done!\n"
+            step += 1
+        if "combine" in args.tasks:
+            header(f"{step}. Combine Subtitles")
+            output_str += f"{step}. Combine Subtitles: Started\n"
+            combine_subtitles(args.languages, args.audio_segment_prefix, args.audio_segment_format)
+            success("Done!")
+            output_str += "Done!\n"
+            if args.languages:
+                language = args.languages[0]
+                srt_file_path = os.path.join(os.getcwd(), f"{language}.srt")
+                try:
+                    with open(srt_file_path, "r", encoding="utf-8") as f:
+                        subtitles_text = f.read()
+                except Exception as e:
+                    subtitles_text = f"Error reading subtitles file: {str(e)}"
+            else:
+                subtitles_text = "No language specified"
+            step += 1
+        return (subtitles_text, srt_file_path)
+    except Exception as e:
+        error_msg = f"Error: {str(e)}"
+        error(error_msg)
+        return (error_msg, None)
+def run_subtools(
+    tasks,
+    hls_url,
+    video_file,
+    audio_file,
+    signature_file,
+    output_path,
+    languages,
+    overwrite,
+    retry,
+    gemini_api_key,
+    debug,
+    audio_segment_prefix,
+    audio_segment_format,
+    audio_segment_length
+):
+    """
+    Падрыхтоўка каталога вываду і запуск асноўнай логікі.
+    """
+    if os.path.exists(output_path):
+        shutil.rmtree(output_path)
+    os.makedirs(output_path, exist_ok=True)
+    if isinstance(languages, str):
+        languages = [lang.strip() for lang in languages.split(",") if lang.strip()]
+    args = Namespace(
+        tasks=tasks,
+        hls_url=hls_url,
+        video_file=video_file,
+        audio_file=audio_file,
+        signature_file=signature_file,
+        output_path=output_path,
+        languages=languages,
+        overwrite=overwrite,
+        retry=retry,
+        gemini_api_key=gemini_api_key,
+        debug=debug,
+        audio_segment_prefix=audio_segment_prefix,
+        audio_segment_format=audio_segment_format,
+        audio_segment_length=audio_segment_length,
+    )
+    return main_logic(args)
+def transcribe_youtube(youtube_url: str) -> tuple:
+    """
+    Спампоўвае аўдыё з відэа YouTube праз yt_dlp і вяртае паведамленне і шлях да часовага аўдыёфайла.
+    Выкарыстоўвае chromewebstore.google.com_cookies.txt, калі ён ёсць.
+    """
+    if not youtube_url:
+        return "Не ўведзена спасылка", None
+    temp_audio_file = "temp_youtube_audio.wav"  # Пераканайцеся, што пашырэнне адпавядае audioformat
+    try:
+        ydl_opts = {
+            'format': 'bestaudio/best',
+            'outtmpl': temp_audio_file,
+            'quiet': True,
+            'extractaudio': True,
+            'audioformat': 'wav',
+            'audioquality': 0  # Якасць 0 = лепшая
+        }
+        # Вызначаем шлях да файла cookie
+        default_cookies_file = "chromewebstore.google.com_cookies.txt"
+        if os.path.exists(default_cookies_file):
+            ydl_opts['cookiefile'] = default_cookies_file
+            print(f"Выкарыстоўваецца файл cookie па змаўчанні: {default_cookies_file}")
+        else:
+            ydl_opts['cookiesfrombrowser'] = 'chrome'
+            print("Файл cookie па змаўчанні не знойдзены. Паспрабуйце атрымаць cookies з браўзера аўтаматычна.")
+        with yt_dlp.YoutubeDL(ydl_opts) as ydl:
+            ydl.download([youtube_url])
+        return ("Спампоўка YouTube аўдыё завершана", temp_audio_file)
+    except Exception as e:
+        err_msg = f"Памылка пры апрацоўцы YouTube (yt_dlp): {e}. Калі ласка, пераканайцеся, што спасылка сапраўдная, і праверце, ці даступныя відэа."
+        print(err_msg)
+        return (err_msg, None)
+def process_uploaded_file(audio, video):
+    """
+    Выбірае, які файл загружаны, і фармуе параметры для апрацоўкі.
+    Калі загружаны аўдыёфайл – запускае апрацоўку для аўдыё,
+    калі відэафайл – запускае поўны ланцуг апрацоўкі.
+    """
+    # Калі загружаны толькі аўдыёфайл:
+    if audio is not None and video is None:
+        tasks = ["signature", "segment", "transcribe", "combine"]
+        video_file = ""  # відэа не выкарыстоўваецца
+        audio_file = audio
+        hls_url = ""  # не патрабуецца
+    # Калі загружаны толькі відэафайл:
+    elif video is not None and audio is None:
+        tasks = ["video", "audio", "signature", "segment", "transcribe", "combine"]
+        video_file = video
+        audio_file = "audio.mp3"  # прызначаем імя для аўдыёфайла
+        hls_url = "dummy"  # задаём няпустое значэнне для праверкі
+    else:
+        return "Error: Загрузіце толькі АЎДЫЁ або ВІДЭАфайл, а не абодва.", None
+    return run_subtools(
+        tasks=tasks,
+        hls_url=hls_url,
+        video_file=video_file,
+        audio_file=audio_file,
+        signature_file="message.shazamsignature",
+        output_path="output",
+        languages="be",
+        overwrite=False,
+        retry=50,
+        gemini_api_key="AIzaSyCwvZ_s4TvxoMaegbpQOOW1nzjZ6IbqGbg",
+        debug=False,
+        audio_segment_prefix="audio_segment",
+        audio_segment_format="mp3",
+        audio_segment_length=300000
+    )
+def process_youtube_url(youtube_url):
+    """
+    Апрацоўвае YouTube спасылку: спампоўвае аўдыё і запускае ланцуг апрацоўкі для стварэння субтытраў.
+    """
+    download_msg, audio_file = transcribe_youtube(youtube_url)
+    if not audio_file:
+        return download_msg, None
+    # Выкарыстоўваем апрацоўку толькі для аўдыё (аналагічна выпадку, калі загружаны аўдыёфайл)
+    tasks = ["signature", "segment", "transcribe", "combine"]
+    return run_subtools(
+        tasks=tasks,
+        hls_url="",
+        video_file="",
+        audio_file=audio_file,
+        signature_file="message.shazamsignature",
+        output_path="output_youtube",  # выкарыстоўваем асобны вывад для YouTube
+        languages="be",
+        overwrite=False,
+        retry=50,
+        gemini_api_key="AIzaSyCwvZ_s4TvxoMaegbpQOOW1nzjZ6IbqGbg",
+        debug=False,
+        audio_segment_prefix="audio_segment",
+        audio_segment_format="mp3",
+        audio_segment_length=300000
+    )
+# --------------------- Gradio UI ---------------------
+with gr.Blocks() as demo:
+    with gr.Tabs():
+        with gr.Tab("Файл"):
+            with gr.Row():
+                audio_input = gr.Audio(type="filepath", label="Аўдыёфайл")
+                video_input = gr.Video(label="Відэафайл")
+            # Пры змене аднаго з палёў дэактывуецца процілеглае
+            audio_input.change(fn=update_on_audio_change, inputs=audio_input, outputs=video_input)
+            video_input.change(fn=update_on_video_change, inputs=video_input, outputs=audio_input)
+            submit_btn_file = gr.Button("Submit")
+            output_text_file = gr.Textbox(label="Тэкст субтытраў")
+            output_file_file = gr.File(label="Спампаваць SRT файл")
+            submit_btn_file.click(fn=process_uploaded_file, inputs=[audio_input, video_input], outputs=[output_text_file, output_file_file])
+        with gr.Tab("YouTube"):
+            youtube_url_input = gr.Textbox(label="YouTube URL", placeholder="Устаўце спасылку на відэа YouTube")
+            submit_btn_youtube = gr.Button("Submit")
+            output_text_youtube = gr.Textbox(label="Тэкст субтытраў")
+            output_file_youtube = gr.File(label="Спампаваць SRT файл")
+            submit_btn_youtube.click(fn=process_youtube_url, inputs=youtube_url_input, outputs=[output_text_youtube, output_file_youtube])
+def update_on_audio_change(audio):
+    if audio is not None:
+        return gr.update(interactive=False)
+    return gr.update(interactive=True)
+def update_on_video_change(video):
+    if video is not None:
+        return gr.update(interactive=False)
+    return gr.update(interactive=True)
+demo.launch()