MRD2F · Enrobax · Feb 12, 2026 · Feb 12, 2026 · Feb 12, 2026 · Feb 12, 2026
diff --git a/pyproject.toml b/pyproject.toml
@@ -9,6 +9,7 @@ dependencies = [
     "ffmpeg>=1.4",
     "flake8>=7.3.0",
     "flask>=3.1.2",
+    "flask-restful>=0.3.10",
     "openai-whisper>=20250625",
     "pandas>=2.3.3",
     "pytest==8.4.2",

diff --git a/...rvice/data/inputs/5846093734223028963.ogg → src/app/convertor/data/test.ogg b/...rvice/data/inputs/5846093734223028963.ogg → src/app/convertor/data/test.ogg
diff --git a/src/app/convertor/routes.py b/src/app/convertor/routes.py
@@ -0,0 +1,26 @@
+from flask import Blueprint
+from flask_restful import Api, Resource, request
+
+from app.convertor.service import FileService
+
+upload_bp = Blueprint("convertor", __name__, url_prefix="/convertor")
+api = Api(upload_bp)
+
+
+class FileUploadResource(Resource):
+    def post(self):
+        allowed_extensions = ["mp3", "wav", "ogg"]
+
+        language = request.form.get("language")
+        model = request.form.get("model")
+        file_service = FileService(
+            allowed_extensions=allowed_extensions,
+            max_size_mb=1000,
+            language=language,
+            model=model,
+        )
+
+        return file_service.convert(request.files.get("file"))
+
+
+api.add_resource(FileUploadResource, "/upload/")
diff --git a/src/app/convertor/service.py b/src/app/convertor/service.py
@@ -0,0 +1,63 @@
+import os
+
+from app.convertor.transcription import Transcription
+
+
+class FileService:
+    def __init__(self, allowed_extensions, max_size_mb, model, language):
+        self.allowed_extensions = allowed_extensions
+        self.max_size_mb = max_size_mb
+        self.max_size_bytes = max_size_mb * 1024 * 1024
+        self.model = model
+        self.language = language
+
+    def _allowed_extension(self, filename):
+        ext = os.path.splitext(filename)[1].lower().replace(".", "")
+        return ext in self.allowed_extensions
+
+    def _allowed_size(self, file):
+        file.seek(0, os.SEEK_END)
+        size = file.tell()
+        file.seek(0)
+        return size <= self.max_size_bytes
+
+    def validate(self, file):
+        if not file:
+            return {"error": "Missing file"}, 400
+
+        # Controllo filename
+        if not file.filename:
+            return {"error": "Invalid filename"}, 400
+
+        # Controllo estensione
+        if not self._allowed_extension(file.filename):
+            return {"error": "File extension not allowed"}, 400
+
+        # Controllo MIME dichiarato
+        if not file.mimetype.startswith("audio/"):
+            return {"error": "File is not an audio type"}, 400
+
+        # Controllo dimensione
+        if not self._allowed_size(file):
+            return {"error": f"File exceeds {self.max_size_mb} MB"}, 400
+
+        return None
+
+    def convert(self, file):
+        error = self.validate(file)
+
+        if error:
+            return error
+
+        try:
+            transcription = Transcription(
+                file_storage=file, model_id=self.model, language=self.language
+            )
+            text = transcription.get_transcription()
+            return {
+                "message": "File converted successfully",
+                "transcription": text,
+            }, 200
+
+        except Exception as e:
+            return {"error": str(e)}, 400
diff --git a/src/app/convertor/service/__init__.py b/src/app/convertor/service/__init__.py
diff --git a/src/app/convertor/service/convertor_controller.py b/src/app/convertor/service/convertor_controller.py
diff --git a/src/app/convertor/service/convertor_service.py b/src/app/convertor/service/convertor_service.py
diff --git a/src/app/convertor/service/data/__init__.py b/src/app/convertor/service/data/__init__.py
diff --git a/src/app/convertor/service/data/inputs/5846093734223028963.ogx b/src/app/convertor/service/data/inputs/5846093734223028963.ogx
diff --git a/src/app/convertor/service/transcription.py b/src/app/convertor/service/transcription.py
diff --git a/src/app/convertor/transcription.py b/src/app/convertor/transcription.py
@@ -0,0 +1,96 @@
+import os
+import tempfile
+
+import whisper
+
+
+class Transcription:
+    whisper_allowed_extensions = [
+        "flac",
+        "m4a",
+        "mp3",
+        "mp4",
+        "mpeg",
+        "mpga",
+        "oga",
+        "ogg",
+        "wav",
+        "webm",
+    ]
+
+    whisper_model_ids = ["tiny", "base", "small", "medium", "large", "turbo"]
+
+    def __init__(
+        self,
+        file_storage,
+        model_id="tiny",
+        show_text=False,
+        language="english",
+        test_mode=False,
+        text_preview_size=None,
+        output_file_name="",
+    ):
+        self.file_storage = file_storage
+        self.model_id = model_id
+        self.show_text = show_text
+        self.language = language
+        self.test_mode = test_mode
+        self.text_preview_size = text_preview_size
+
+        self.output_file_name = output_file_name
+
+        print(self.model_id, self.language)
+
+        check, ext = self._check_file_extension()
+        if not check:
+            raise ValueError(f"Invalid file format: .{ext}")
+
+        if not self._check_whisper_model_id():
+            raise ValueError(f"Invalid model ID selection: {self.model_id}")
+
+    def _check_file_extension(self):
+        filename = self.file_storage.filename
+        ext = filename.rsplit(".", 1)[-1].lower()
+
+        if ext in self.whisper_allowed_extensions:
+            return True, ext
+        else:
+            return False, ext
+
+    def _check_whisper_model_id(self):
+        if self.model_id in self.whisper_model_ids:
+            return True
+        else:
+            return False
+
+    def _get_model(self):
+        return whisper.load_model(self.model_id)
+
+    def _save_transcription(self, text, output_file_name=""):
+        file_name = self.output_file_name if not output_file_name else output_file_name
+        with open(f"{file_name}.txt", "w", encoding="utf-8") as f:
+            f.write(text)
+
+    def get_transcription(self):
+        model = self._get_model()
+
+        # Salvataggio temporaneo
+        with tempfile.NamedTemporaryFile(delete=False, suffix=".tmp") as tmp:
+            self.file_storage.save(tmp.name)
+            temp_path = tmp.name
+
+        try:
+            result = model.transcribe(temp_path, fp16=False)
+
+            if self.show_text:
+                if self.text_preview_size:
+                    print(result["text"][: self.text_preview_size])
+                else:
+                    print(result["text"])
+            if self.test_mode:
+                self._save_transcription(result["text"])
+
+            return result["text"]
+
+        finally:
+            os.remove(temp_path)