

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

# Streaming y resultados parciales
<a name="streaming-partial-results"></a>

*Como la transmisión funciona en tiempo real, las transcripciones se producen a partir de resultados parciales.* Amazon Transcribe divide la transmisión de audio entrante en función de los segmentos naturales del habla, como un cambio de altavoz o una pausa en el audio. La transcripción se devuelve a la aplicación en una secuencia de eventos de transcripción, y cada respuesta contiene más discurso transcrito hasta que se transcribe un segmento completo.

En el siguiente bloque de código se muestra una aproximación de esto. Para ver este proceso en acción, inicie sesión en [Consola de administración de AWS](https://console.aws.amazon.com/transcribe/), seleccione **Transcripción en tiempo real** y hable por el micrófono. Observe el panel **Resultado de la transcripción** mientras habla.

En este ejemplo, cada línea es el resultado parcial de un segmento de audio.

```
The      
The Amazon.
The Amazon is
The Amazon is the law.
The Amazon is the largest
The Amazon is the largest ray
The Amazon is the largest rain for
The Amazon is the largest rainforest.
The Amazon is the largest rainforest on the
The Amazon is the largest rainforest on the planet.
```

Estos resultados parciales están presentes en el resultado de la transcripción dentro de los objetos [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_Result.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_Result.html). En este bloque de objetos también hay un **IsPartial**campo. Si este campo es true, el segmento de transcripción aún no está completo. A continuación, puede ver la diferencia entre un segmento incompleto y uno completo:

```
{{"IsPartial": true (incomplete segment)}}
            
"Transcript": "The Amazon is the largest rainforest."

"EndTime": 4.545,
"IsPartial": true,
"ResultId": "12345a67-8bc9-0de1-2f34-a5b678c90d12",
"StartTime": 0.025


{{"IsPartial": false (complete segment)}}
            
"Transcript": "The Amazon is the largest rainforest on the planet."

"EndTime": 6.025,
"IsPartial": false,
"ResultId": "34567e89-0fa1-2bc3-4d56-78e90123456f",
"StartTime": 0.025
```

Cada palabra de un segmento *completo* tiene una puntuación de confianza asociada, que es un valor comprendido entre `0` y `1`. Un valor mayor indica una mayor probabilidad de que la palabra se transcriba correctamente.

**sugerencia**  
Los extremos `StartTime` y `EndTime` de un segmento de audio se pueden utilizar para sincronizar el resultado de la transcripción con el diálogo de vídeo.

Si está ejecutando una aplicación que requiere una latencia baja, quizás le interese utilizar la [estabilización parcial de los resultados.](#streaming-partial-result-stabilization)

## estabilización parcial de los resultados
<a name="streaming-partial-result-stabilization"></a>

Amazon Transcribe comienza a devolver los resultados de la transcripción en cuanto empiezas a reproducir tu audio. Devuelve estos resultados parciales de forma incremental hasta que genera un resultado final al nivel de un segmento de voz natural. Un segmento de voz natural es una voz continua que contiene una pausa o un cambio de hablante.

Amazon Transcribe sigue emitiendo resultados parciales hasta que genera el resultado final de la transcripción de un segmento de voz. Como el reconocimiento de voz puede revisar las palabras a medida que van adquiriendo más contexto, las transcripciones en streaming pueden cambiar ligeramente con cada nueva salida parcial de resultados.

Este proceso ofrece dos opciones para cada segmento de voz:
+ Esperar a que termine el segmento
+ Usar los resultados parciales del segmento

La estabilización parcial del resultado cambia la forma en Amazon Transcribe que se produce el resultado final de la transcripción para cada segmento completo. Cuando se activa, sólo se pueden cambiar las últimas palabras de los resultados parciales. Debido a esto, la precisión de la transcripción puede verse afectada. Sin embargo, la transcripción se devuelve más rápido que sin la estabilización de los resultados parciales. Esta reducción de la latencia puede resultar beneficiosa a la hora de subtitular vídeos o generar subtítulos descriptivos para transmisiones en directo.

Los siguientes ejemplos muestran cómo se gestiona la misma secuencia de audio cuando la estabilización de resultados parciales no está activada y cuándo sí lo está. Tenga en cuenta que puede establecer el nivel de estabilidad en bajo, medio o alto. La baja estabilidad proporciona la máxima precisión. La alta estabilidad transcribe más rápido, pero con una precisión ligeramente inferior.

<a name="table-streaming-partial-result"></a>
<table>
<thead>
  <tr><th>“Transcripción”:</th><th>"EndTime":</th><th>"IsPartial":</th></tr>
</thead>
<tbody>
  <tr><td colspan="3">La estabilización de resultados parciales no está habilitada</td></tr>
  <tr><td> <pre>The<br />The      <br />The Amazon.<br />The Amazon is<br />The Amazon is the law.<br />The Amazon is the largest<br />The Amazon is the largest ray<br />The Amazon is the largest rain for<br />The Amazon is the largest rainforest.<br />The Amazon is the largest rainforest on the<br />The Amazon is the largest rainforest on the planet.<br />The Amazon is the largest rainforest on the planet.<br />The Amazon is the largest rainforest on the planet.</pre> </td><td> <pre>0.545<br />1.045<br />1.545<br />2.045<br />2.545<br />3.045<br />3.545<br />4.045<br />4.545<br />5.045<br />5.545<br />6.025<br />6.025</pre> </td><td> <pre>true<br />true<br />true<br />true<br />true<br />true<br />true<br />true<br />true<br />true<br />true<br />true<br />false</pre> </td></tr>
  <tr><td colspan="3">La estabilización de resultados parciales está activada (alta estabilidad)</td></tr>
  <tr><td> <pre>The<br />The<br />The Amazon.<br />The Amazon is<br />The Amazon is the large<br />The Amazon is the largest<br />The Amazon is the largest rainfall.<br />The Amazon is the largest rain forest.<br />The Amazon is the largest rain forest on<br />The Amazon is the largest rain forest on the planet.<br />The Amazon is the largest rain forest on the planet.<br />The Amazon is the largest rain forest on the planet.<br />The Amazon is the largest rain forest on the planet.<br />The Amazon is the largest rain forest on the planet.</pre> </td><td> <pre>0.515<br />1.015<br />1.515<br />2.015<br />2.515<br />3.015<br />3.515<br />4.015<br />4.515<br />5.015<br />5.515<br />6.015<br />6.335<br />6.335</pre> </td><td> <pre>true<br />true<br />true<br />true<br />true<br />true<br />true<br />true<br />true<br />true<br />true<br />true<br />true<br />false</pre> </td></tr>
</tbody>
</table>


Al activar la estabilización de resultados parciales, Amazon Transcribe utiliza un `Stable` campo para indicar si un elemento es estable, donde «elemento» hace referencia a una palabra o un signo de puntuación transcritos. Los valores de `Stable` son `true` o `false`. Los elementos marcados como `false` (no estables) tienen más probabilidades de cambiar a medida que se transcribe el segmento. Por el contrario, los elementos marcados como `true` (estables) no cambiarán.

Puede elegir renderizar palabras no estables para que los subtítulos descriptivos se alineen con la voz. Aunque los subtítulos descriptivos cambien ligeramente a medida que se añade el contexto, esta experiencia de usuario es mejor que las ráfagas de texto periódicas, que pueden o no alinearse con la voz.

También puede optar por mostrar las palabras no estables en un formato diferente, por ejemplo, en cursiva, para indicar a los espectadores que estas palabras pueden cambiar. La visualización de resultados parciales limita la cantidad de texto que se muestra en un momento dado. Esto puede ser importante cuando se trata de limitaciones de espacio, como ocurre con los subtítulos descriptivos de los vídeos.

**Profundice más con el blog AWS de Machine Learning**  
Para obtener más información sobre cómo mejorar la precisión con las transcripciones en tiempo real, consulte:  
[Mejore la experiencia de transcripción en streaming con una estabilización Amazon Transcribe parcial de los resultados](https://aws.amazon.com/blogs/machine-learning/amazon-transcribe-now-supports-partial-results-stabilization-for-streaming-audio/)
[“¿Qué era eso?” Aumento de la precisión de los subtítulos para las transmisiones en directo con Amazon Transcribe](https://aws.amazon.com/blogs/media/what-was-that-increasing-subtitle-accuracy-for-live-broadcasts-using-amazon-transcribe/)

### Ejemplo de salida de estabilización de resultados parciales
<a name="streaming-stabilization-output"></a>

El siguiente ejemplo de salida muestra los indicadores `Stable` de un segmento incompleto (`"IsPartial": true`). Puede ver que las palabras “*to*” y “*Amazon*” no son estables y, por lo tanto, podrían cambiar antes de finalizar el segmento.

```
"Transcript": {
    "Results": [
        {
            "Alternatives": [
                {
                    "Items": [
                        {
                            "Content": "Welcome",
                            "EndTime": 2.4225,
                            "Stable": true,
                            "StartTime": 1.65,
                            "Type": "pronunciation",
                            "VocabularyFilterMatch": false
                        },
                        { 
                            "Content": "to",
                            "EndTime": 2.8325,
                            "Stable": false,
                            "StartTime": 2.4225,
                            "Type": "pronunciation",
                            "VocabularyFilterMatch": false
                        },
                        {
                            "Content": "Amazon",
                            "EndTime": 3.635,
                            "Stable": false,
                            "StartTime": 2.8325,
                            "Type": "pronunciation",
                            "VocabularyFilterMatch": false
                        },
                        {
                            "Content": ".",
                            "EndTime": 3.635,
                            "Stable": false,
                            "StartTime": 3.635,
                            "Type": "punctuation",
                            "VocabularyFilterMatch": false
                        }
                    ],
                    "Transcript": "Welcome to Amazon."
                }
            ],
            "EndTime": 4.165,
            "IsPartial": true,
            "ResultId": "12345a67-8bc9-0de1-2f34-a5b678c90d12",
            "StartTime": 1.65
        }
    ]
}
```