Ir al contenido principal

Marcelino - Paso 3 - Grabación de los datos

Paso 3 - Grabación de los datos

  Ambiente tranquilo

    Antes de comenzar, debe asegurarse de que la habitación en la que está grabando es lo más silenciosa posible. Además, asegúrese de apagar los altavoces mientras graba - para evitar comentarios acústicos en sus archivos de audio.

  Ajuste su micrófono

    A continuación, debe ajustar el micrófono para obtener una mejor percepción de su voz.

    Si usted tiene un micrófono de auriculares, esto debería ser fácil de hacer. El micrófono debe estar un poco a un lado y debajo de la boca (para que el micrófono no recoja la respiración) y no más de media pulgada (1-2 cm) de distancia.

  Niveles de Grabación

    Ahora necesita probar sus niveles de grabación.

    Inicie Audacity.

    Asegúrese de que el volumen del micrófono en Audacity esté establecido en 1.0.
 

    A continuación, haga clic en Grabar (es decir, el botón de círculo rojo) y comience a hablar en su voz normal durante unos segundos, y luego haga clic en Detener (es decir, el botón cuadrado amarillo).


    Mire la pantalla de forma de onda para la pista de audio que acaba de crear. La regla vertical a la izquierda de la pantalla de forma de onda le proporciona una guía para sus niveles de audio. Trate de mantener sus niveles de grabación entre 0,5 y -0,5, con un promedio de alrededor de 0,3 a -0,3. Está bien tener unos cuantos puntos fuera del rango de 0.5 a -0.5, pero evita tener que ir más allá del rango de 1.0 a -1.0, ya que esto generará distorsión. Si es necesario, ajuste el volumen del micrófono de Audacity para mantener su audio dentro de los rangos adecuados.

  Configuración de las preferencias de Audacity

    En Audacity, establece la tasa de muestreo del proyecto y el formato de muestra en sus preferencias (En el menú "Editar" pulse sobre "Preferencias"). Haga clic en la pestaña "Calidad":

      - Configure su 'Formato de frecuencia de muestreo predeterminado' haciendo clic en las flechas arriba/abajo para cambiarlo a 16000Hz.
      - Establezca su 'Formato de muestra predeterminado' a 16 bits.

    A continuación, haga clic en la ficha 'Audio I/O' y, a continuación:

      - Ajuste sus 'Canales' a 1 (Mono).

    Luego haga clic en la pestaña "Formatos de archivo" y luego:

      - Configure su 'Formato de exportación sin comprimir' a WAV (Microsoft PCM de 16 bits) o exporte su audio utilizando el formato FLAC.

    Haga clic en Aceptar para guardar la configuración.

    Ahora debe salir y volver a iniciar Audacity para que estos cambios de configuración del proyecto estén activos. Mira el selector de tasa de proyecto en la esquina inferior izquierda de la ventana de Audacity, asegúrate de que indique 16000.

  Grabación de su primer archivo de audio

    Peticiones

      En el paso 2 creamos un archivo prompts.txt que ahora se puede utilizar para guiarle en qué palabras necesita grabar para sus archivos de audio de voz individuales.

      Cada línea del archivo prompts.txt corresponde al contenido transcrito de un archivo de audio. La primera columna contiene el nombre del archivo de audio y las columnas siguientes en la misma línea contienen las transcripciones de texto de lo que se graba en el archivo de audio, vea a continuación:

        */muestra1 MARCA UNO DOS TRES CUATRO CINCO SEIS SIETE VILCHEZ NUEVE OH CERO
        */muestra2 MARCA UNO TRES CINCO SIETE NUEVE CERO DOS CUATRO SEIS OH
        */muestra3 MARCA CERO NUEVE SIETE CINCO TRES UNO SEIS CUATRO DOS
        */muestra4 MARCA UNO DOS DOS TRES TRES CUATRO CUATRO CINCO
        */muestra5 MARCA SEIS SEIS SIETE SIETE NUEVE NUEVE OH OH CERO CERO
        */muestra6 TELEFONO PACO PEREZ LLAMA PACO PEREZ
        */muestra7 TELEFONO PACO LLAMA TELEFONO DE PACO PEREZ LLAMA PEREZ
        */muestra8 TELEFONO TELEFONO PACO PACO LLAMA LLAMA PEREZ PEREZ
        */muestra9 MEDIDA COMIDA Y COMIDA MEDIDA
        */muestra10 QUEJAS REJAS AVION CAMION RUBICON
        */muestra11 HERMANA MANADA MANUAL KENYA SEMANA
        */muestra12 CORREA CODIGO RODRIGO ROMERO BORREGO CORDERO
        */muestra13 PUERTA PIERNA POZO AGATA AGOBIO ARMADA
        */muestra14 ABALON ABDOMINALES ABUSO BUZO BERZA
        */muestra15 ABONO ADORNO ALISAR AFECTAR EFECTO OFELIA
        */muestra16 ALCANZAR ACUPUNTURA ACTUAL AVENTURA OBSTRUYE OYE PAYASO
        */muestra17 ALGORITMO ALGUNA OTRA VERDE VENTA VENTANA
        */muestra18 BATALLA MESTALLA METAL DESAYUNO DESCALZO
        */muestra19 ROTO CORTO MUERTO DESEMPEÑO ENTRADAS MONTOYA MOYA NEOYORQUINO
        */muestra20 DICOTOMIA DISLEXIA ANOREXIA AXIOMA MARCHA MALTRECHA MARIACHI MEDIANOCHE
        */muestra21 BOBINA BOLONIA COLONIA ARMONIA ARMISTICIO
        */muestra22 COLECCION COLORACION COMBINACION COMERCIAL
        */muestra23 AGUJA BURBUJA BRUJA ABEJA IDENTIFICA INDEFINIDA INFORMAL
        */muestra24 DERECHO BARBECHO TECHO YATE YODO AYER
        */muestra25 MAÑANA PESTAÑA CAMPAÑA ENTRAÑAS LIMITROFES MAFIA
        */muestra26 CUBA CUBULAR CUMULATIVO ACALLAR ALCANTARILLADO ALLI
        */muestra27 CURADO CICLISMO COAXIAL AMARILLO AMPOLLAS CABALLO
        */muestra28 AÑORA CASTAÑA PANAMEÑO NIÑO NIÑA MAGNIFICO MALEFICA MAMIFERO
        */muestra29 DIGITAL TACTIL ANUAL PASTORAL CLIMAX COEXISTENCIA CONEXION
        */muestra30 AMNESIA ASIA ASIDUO ASEMEJA CONTEXTO EXACTA EXAMEN
        */muestra31 HOLA COLA BOLA MOLA YOLANDA YESO FERREA FORRADA GORRAS GUERRA
        */muestra32 VOXFORGE INICIO LEER ESCUCHAR HALLAR HERMOSILLO HUELLA HUMILLACION
        */muestra33 PLAY INICIAR SIGUIENTE SALTAR HACIA ADELANTE PREVIO ATRAS
        */muestra34 MUSICA MOSTRAR QUIEN SOBRE INFORMACION BAJA BAJO INFERIOR
        */muestra35 JUGADOR SUBIR ARRIBA PARA PARAR SILENCIO
        */muestra36 TIEMPO ORDENADOR COMPUTADORA VOLUMEN CORREO ELECTRONICO
        */muestra37 COMPUTERIZADO AMPUTADO MINICOMPUTADORA PUMA SUMA
        */muestra38 BOTON AMPUTACION AGUDA ACEPTAR IMAGEN APAGAR
        */muestra39 GOOGLE FEMENINO MASCULINO BUSCAR LEER LEE ESCRIBE ESCRIBIR
        */muestra40 DAVID SALUDAR SALUDA ENCIENDE ENCENDER

    Audacity

      Para empezar, no debe tener ninguna pista mostrada en la ventana de Audacity. Si lo hace, haga clic en el icono x en la parte superior izquierda de la visualización de la pista de audio (o presione ctrl-z tantas veces como sea necesario para eliminarlas o reinicie Audacity). Si no lo hace, Audacity grabará su nueva pista, y dejará su antigua pista sin tocar, y cuando exporte su audio a un archivo wav, ambas pistas se fusionarán en su archivo wav.

      Asegúrese de que los volúmenes están ajustados correctamente, como se describe en la sección anterior.

      Grabar el primer archivo haciendo clic en 'Grabar' en Audacity y decir las palabras en la primera línea de su archivo prompts.txt:

        MARCA UNO DOS TRES CUATRO CINCO SEIS SIETE VILCHEZ NUEVE OH CERO

      Hable normalmente - no demasiado lento o demasiado rápido - y claramente. Haga una pausa ligeramente antes de comenzar a hablar y deje una breve pausa después de haber completado (es decir, media pausa antes y después de hablar). Recuerde no respirar hasta que haya hecho clic en - la mayoría de los micrófonos captar ruidos de respiración.

      Haga clic en el icono "Detener" cuando haya terminado.

      Revise su forma de onda para asegurarse de que los picos más altos y más bajos de su grabación estén entre 0,5 y 1,0 en el rango superior y el rango inferior entre -0,5 y -1,0. Si lo están, escuche el archivo (presione 'Reproducir' en Audacity) para asegurarse de que su pronunciación es clara y que no escucha ningún ruido de no habla (es decir, ruidos de respiración, saltos de labios o ruidos de fondo, ...). Si hay algún problema, pulse ctrl-z y vuelva a grabar su archivo.

      Cree una nueva carpeta en el directorio 'voxforge' en su directorio de inicio y llámela 'train', luego cree una subcarpeta en su directorio 'train' llamada 'wav'.

      Si el archivo suena bien, haga clic en 'Archivo' en el menú de Audacity, luego haga clic en 'Exportar como Wav' y guárdelo como el nombre del archivo listado en su archivo prompts.txt ('sample1' en este caso) '[Su directorio de inicio]/voxforge/train/wav' que acaba de crear.

    Grabación de los archivos de audio restantes

      Repita el mismo proceso para cada línea en su archivo prompts.txt. Cuando haya terminado, debe tener una serie de archivos de audio correspondientes a todos los archivos enumerados en la primera columna del archivo prompts.txt su carpeta 'voxforge/train/wav'.