Trascrizione di uno stream in tempo reale utilizzando un vocabolario medico personalizzato

Per migliorare la precisione della trascrizione in uno stream in tempo reale, puoi utilizzare un vocabolario personalizzato utilizzando uno o più stream. HTTP/2 WebSocket Per avviare una richiesta, usa l'API HTTP/2 . StartMedicalStreamTranscription Puoi utilizzare un vocabolario personalizzato in tempo reale utilizzando AWS Management Console l'StartMedicalStreamTranscriptionAPI o utilizzando il protocollo. WebSocket

Per AWS Management Console trascrivere l'audio in streaming di un dettato medico, scegli l'opzione per trascrivere un dettato medico, avvia lo streaming e inizia a parlare nel microfono.

Per trascrivere l'audio in streaming di un dettato medico (AWS Management Console)

Accedi alla AWS Management Console.
Nel pannello di navigazione, in Amazon Transcribe Medicina, scegli Trascrizione. Real-time
Per Specialità medica, scegli la specialità medica del dottore che parla nel flusso.
Per Tipo di input audio, scegli Conversazione o Dettatura.
Per Impostazioni aggiuntive, scegli Vocabolario personalizzato.
1. Per Selezione del vocabolario, scegli un vocabolario personalizzato.
Quindi scegli Start streaming (Avvia streaming).
Parla nel microfono.

Di seguito è riportata la sintassi per i parametri di una richiesta. HTTP/2


POST /medical-stream-transcription HTTP/2
host: transcribestreaming.us-west-2.amazonaws.com
authorization: Generated value
x-amz-target: com.amazonaws.transcribe.Transcribe.StartMedicalStreamTranscription
x-amz-content-sha256: STREAMING-MED-AWS4-HMAC-SHA256-EVENTS
x-amz-date: 20220208T235959Z
x-amzn-transcribe-session-id: my-first-http2-med-stream
x-amzn-transcribe-language-code: en-US
x-amzn-transcribe-media-encoding: flac
x-amzn-transcribe-sample-rate: 16000
x-amzn-transcribe-vocabulary-name: my-first-med-vocab
x-amzn-transcribe-specialty: PRIMARYCARE
x-amzn-transcribe-type: CONVERSATION
x-amzn-transcribe-show-speaker-label: true
Content-type: application/vnd.amazon.eventstream
transfer-encoding: chunked

Descrizioni del parametro:

host: aggiorna il Regione AWS ('us-west-2' nell'esempio precedente) con Regione AWS il nome che stai chiamando. Per un elenco di endpoint validi Regioni AWS, vedi Regioni AWS e Endpoint.
autorizzazione: questo è un campo generato. Per ulteriori informazioni sulla creazione di una firma, consulta Firmare AWS le richieste con la versione 4 della firma.
x-amz-target: non modificare questo campo; usa il contenuto mostrato nell'esempio precedente.
x-amz-content-sha256: questo è un campo generato. Per ulteriori informazioni sul calcolo di una firma, consulta Firmare AWS le richieste con Signature Version 4.
x-amz-date: data e ora di creazione della firma. Il formato è YYYYMMDDTHHMMSSZ, dove YYYY=anno, MM=mese, DD=giorno, HH=ora, MM=minuto, SS=secondi e “T” e “Z” sono caratteri fissi. Per ulteriori informazioni, consulta Gestione delle date in Signature Version 4.
x-amzn-transcribe-session-id: il nome della tua sessione di streaming.
x-amzn-transcribe-language-code: la codifica usata per l'audio in ingresso. Fai riferimento a StartMedicalStreamTranscription o Lingue supportate e funzionalità specifiche della lingua per un elenco di valori validi.
x-amzn-transcribe-media-encoding: la codifica usata per l'audio in ingresso. I valori validi sono pcm, ogg-opus e flac.
x-amzn-transcribe-sample-rate: La frequenza di campionamento dell'audio in ingresso (in Hertz). Amazon Transcribe supporta un intervallo da 8.000 Hz a 48.000 Hz. Low-quality l'audio, ad esempio l'audio del telefono, è in genere di circa 8.000 Hz. High-quality l'audio varia in genere da 16.000 Hz a 48.000 Hz. Tieni presente che la frequenza di campionamento specificata deve corrispondere a quella dell'audio.
x-amzn-transcribe-vocabulary-name: il nome del vocabolario che vuoi usare con la tua trascrizione.
x-amzn-transcribe-specialty: la specialità medica che viene trascritta.
x-amzn-transcribe-type: scegli se si tratta di una dettazione o di una conversazione.
x-amzn-transcribe-show-speaker-label: per abilitare la diarizzazione, questo valore deve essere true.
content-type: non modificare questo campo; usa il contenuto mostrato nell'esempio precedente.

Per partizionare gli altoparlanti negli WebSocket stream con l'API, utilizzate il seguente formato per creare un URI predefinito per avviare una WebSocket richiesta e vocabulary-name impostarlo sul nome del vocabolario personalizzato.


GET wss://transcribestreaming.us-west-2.amazonaws.com:8443/medical-stream-transcription-websocket
?language-code=en-US
&X-Amz-Algorithm=AWS4-HMAC-SHA256
&X-Amz-Credential=AKIAIOSFODNN7EXAMPLE%2F20220208%2Fus-west-2%2Ftranscribe%2Faws4_request
&X-Amz-Date=20220208T235959Z
&X-Amz-Expires=300
&X-Amz-Security-Token=security-token
&X-Amz-Signature=Signature Version 4 signature 
&X-Amz-SignedHeaders=host
&media-encoding=flac
&sample-rate=16000
&session-id=sessionId
&specialty=medicalSpecialty
&type=CONVERSATION
&vocabulary-name=vocabularyName
&show-speaker-label=boolean

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Trascrizione di un file audio utilizzando un vocabolario medico personalizzato

Set di caratteri per Amazon Transcribe Medical