Implementazione di un modello in Studio

Per distribuire i modelli di JumpStart base, accedi a una scheda dettagliata del modello nell'interfaccia utente di Studio. Per ulteriori informazioni su come aprire JumpStart in Studio, consultaApri in Studio JumpStart. Dopo aver esplorato la scheda dei dettagli del modello che preferisci, scegli Implementa nell’angolo in alto a destra. Quindi, segui i passaggi descritti in Distribuisci modelli con SageMaker Studio.

Amazon offre SageMaker JumpStart anche implementazioni ottimizzate, che forniscono configurazioni di distribuzione predefinite progettate per casi d'uso specifici come la generazione di contenuti, il riepilogo o le interazioni in stile chat. Quando distribuisci un modello supportato, puoi selezionare il caso d'uso di destinazione e scegliere un'ottimizzazione dei vincoli (ottimizzazione dei costi, ottimizzata per il throughput, ottimizzata per la latenza o bilanciata) e Amazon configura SageMaker JumpStart automaticamente l'endpoint per quello scenario. Questo ti dà visibilità su parametri prestazionali chiave come la latenza P50, il time-to-first-token (TTFT) e il throughput, garantendo al contempo che l'implementazione sia ottimizzata per il tuo carico di lavoro. Per iniziare, apri la pagina dei dettagli di un modello supportato in Studio, scegli Deploy e usa il pannello Performance per configurare la tua distribuzione ottimizzata.

Importante

Alcuni modelli di fondazione richiedono l’accettazione esplicita di un contratto di licenza con l’utente finale (End User License Agreement, EULA) prima dell’implementazione. Per ulteriori informazioni, consulta Accettazione dell'EULA in Amazon Studio SageMaker.

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Fine-tune un modello in Studio

Valutazione di un modello in Studio