1-1-Cómo Echar a Andar Whisper con Python
Cómo Echar a Andar Whisper con Python — Guía Paso a Paso y Estructura del Proyecto
A continuación te explico cómo configurar un proyecto básico para usar Whisper en Python y convertir audios o videos en texto.
📁 Estructura Recomendada del Proyecto
Puedes organizar tu proyecto así:
⚙️ Paso 1: Crear Entorno Virtual (opcional pero recomendado)
Desde la terminal:
Activar el entorno:
-
Windows:
-
Linux/MacOS:
⚙️ Paso 2: Instalar Dependencias
Dentro del entorno virtual:
Agrega esto a requirements.txt:
Instala FFmpeg:
-
Windows: Descargar desde https://ffmpeg.org/download.html y agregar a PATH.
-
Linux/MacOS:
Verifica que FFmpeg funciona:
⚙️ Paso 3: Crear el Script Principal
Contenido de transcribir.py:
⚡ Paso 4: Ejecutar el Proyecto
Asegúrate de tener archivos en la carpeta audios, por ejemplo audios/prueba.mp3.
Ejecuta el script:
El texto transcrito se guardará en transcripciones/prueba.txt.
🛠️ Notas Importantes
✅ Puedes cambiar el modelo (tiny, small, medium, large) según tus necesidades de velocidad y precisión.
✅ Soporta audio en español, inglés y otros idiomas. Puedes omitir "language='es'" y dejar que detecte el idioma automáticamente.
✅ Whisper funciona con archivos .mp3, .wav, .m4a, .mp4, entre otros.
📦 Extras: Versión por Línea de Comandos
También puedes usar Whisper directamente sin escribir código:
🚀 Conclusión
Ya tienes listo un entorno funcional para transcribir audios o videos a texto usando Whisper de OpenAI. Es ideal para subtitulados, análisis de entrevistas o automatizar tareas de transcripción
Comentarios
Publicar un comentario