View a markdown version of this page

Trascrizione di uno stream in tempo reale utilizzando un vocabolario medico personalizzato - Amazon Transcribe

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Trascrizione di uno stream in tempo reale utilizzando un vocabolario medico personalizzato

Per migliorare la precisione della trascrizione in uno stream in tempo reale, puoi utilizzare un vocabolario personalizzato utilizzando uno o più stream. HTTP/2 WebSocket Per avviare una richiesta, usa l'API HTTP/2 . StartMedicalStreamTranscription Puoi utilizzare un vocabolario personalizzato in tempo reale utilizzando Console di gestione AWS l'StartMedicalStreamTranscriptionAPI o utilizzando il protocollo. WebSocket

Per Console di gestione AWS trascrivere l'audio in streaming di un dettato medico, scegli l'opzione per trascrivere un dettato medico, avvia lo streaming e inizia a parlare nel microfono.

Per trascrivere l'audio in streaming di un dettato medico (Console di gestione AWS)
  1. Accedi alla Console di gestione AWS.

  2. Nel pannello di navigazione, in Amazon Transcribe Medicina, scegli Trascrizione. Real-time

  3. Per Specialità medica, scegli la specialità medica del dottore che parla nel flusso.

  4. Per Tipo di input audio, scegli Conversazione o Dettatura.

  5. Per Impostazioni aggiuntive, scegli Vocabolario personalizzato.

    1. Per Selezione del vocabolario, scegli un vocabolario personalizzato.

  6. Quindi scegli Start streaming (Avvia streaming).

  7. Parla nel microfono.

Di seguito è riportata la sintassi per i parametri di una richiesta. HTTP/2

POST /medical-stream-transcription HTTP/2 host: transcribestreaming.us-west-2.amazonaws.com authorization: Generated value x-amz-target: com.amazonaws.transcribe.Transcribe.StartMedicalStreamTranscription x-amz-content-sha256: STREAMING-MED-AWS4-HMAC-SHA256-EVENTS x-amz-date: 20220208T235959Z x-amzn-transcribe-session-id: my-first-http2-med-stream x-amzn-transcribe-language-code: en-US x-amzn-transcribe-media-encoding: flac x-amzn-transcribe-sample-rate: 16000 x-amzn-transcribe-vocabulary-name: my-first-med-vocab x-amzn-transcribe-specialty: PRIMARYCARE x-amzn-transcribe-type: CONVERSATION x-amzn-transcribe-show-speaker-label: true Content-type: application/vnd.amazon.eventstream transfer-encoding: chunked

Descrizioni del parametro:

  • host: aggiorna il Regione AWS ('us-west-2' nell'esempio precedente) con Regione AWS il nome che stai chiamando. Per un elenco di endpoint validi Regioni AWS, vedi Regioni AWS e Endpoint.

  • autorizzazione: questo è un campo generato. Per ulteriori informazioni sulla creazione di una firma, consulta Firmare AWS le richieste con la versione 4 della firma.

  • x-amz-target: non modificare questo campo; usa il contenuto mostrato nell'esempio precedente.

  • x-amz-content-sha256: questo è un campo generato. Per ulteriori informazioni sul calcolo di una firma, consulta Firmare AWS le richieste con Signature Version 4.

  • x-amz-date: data e ora di creazione della firma. Il formato è YYYYMMDDTHHMMSSZ, dove YYYY=anno, MM=mese, DD=giorno, HH=ora, MM=minuto, SS=secondi e “T” e “Z” sono caratteri fissi. Per ulteriori informazioni, consulta Gestione delle date in Signature Version 4.

  • x-amzn-transcribe-session-id: il nome della tua sessione di streaming.

  • x-amzn-transcribe-language-code: la codifica usata per l'audio in ingresso. Fai riferimento a StartMedicalStreamTranscription o Lingue supportate e funzionalità specifiche della lingua per un elenco di valori validi.

  • x-amzn-transcribe-media-encoding: la codifica usata per l'audio in ingresso. I valori validi sono pcm, ogg-opus e flac.

  • x-amzn-transcribe-sample-rate: La frequenza di campionamento dell'audio in ingresso (in Hertz). Amazon Transcribe supporta un intervallo da 8.000 Hz a 48.000 Hz. Low-quality l'audio, ad esempio l'audio del telefono, è in genere di circa 8.000 Hz. High-quality l'audio varia in genere da 16.000 Hz a 48.000 Hz. Tieni presente che la frequenza di campionamento specificata deve corrispondere a quella dell'audio.

  • x-amzn-transcribe-vocabulary-name: il nome del vocabolario che vuoi usare con la tua trascrizione.

  • x-amzn-transcribe-specialty: la specialità medica che viene trascritta.

  • x-amzn-transcribe-type: scegli se si tratta di una dettazione o di una conversazione.

  • x-amzn-transcribe-show-speaker-label: per abilitare la diarizzazione, questo valore deve essere true.

  • content-type: non modificare questo campo; usa il contenuto mostrato nell'esempio precedente.

Per partizionare gli altoparlanti negli WebSocket stream con l'API, utilizzate il seguente formato per creare un URI predefinito per avviare una WebSocket richiesta e vocabulary-name impostarlo sul nome del vocabolario personalizzato.

GET wss://transcribestreaming.us-west-2.amazonaws.com:8443/medical-stream-transcription-websocket ?language-code=en-US &X-Amz-Algorithm=AWS4-HMAC-SHA256 &X-Amz-Credential=AKIAIOSFODNN7EXAMPLE%2F20220208%2Fus-west-2%2Ftranscribe%2Faws4_request &X-Amz-Date=20220208T235959Z &X-Amz-Expires=300 &X-Amz-Security-Token=security-token &X-Amz-Signature=Signature Version 4 signature &X-Amz-SignedHeaders=host &media-encoding=flac &sample-rate=16000 &session-id=sessionId &specialty=medicalSpecialty &type=CONVERSATION &vocabulary-name=vocabularyName &show-speaker-label=boolean