Amazon KendraWeb crawler - Amazon Kendra

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Amazon KendraWeb crawler

È possibile utilizzare Amazon Kendra Web Crawler per eseguire la scansione e indicizzare le pagine Web.

È possibile eseguire la scansione solo di siti Web pubblici o siti Web interni all'azienda che utilizzano il protocollo di comunicazione sicuro Hypertext Transfer Protocol Secure (HTTPS). Se si riceve un errore durante la crawling di un sito web, è possibile che il sito web non sia in grado di eseguire il crawling. Per eseguire il crawling dei siti web interni, è possibile configurare un proxy web. Il proxy web deve essere rivolto al pubblico. È anche possibile utilizzare l’autenticazione per accedere ai siti web ed eseguirne il crawling.

Quando selezioni i siti Web da indicizzare, devi rispettare la Policy di uso accettabile di Amazon e tutti gli altri termini di Amazon. Ricorda che devi utilizzare Amazon Kendra Web Crawler solo per indicizzare le tue pagine Web o le pagine Web che hai l'autorizzazione a indicizzare. Per informazioni su come impedire a Amazon Kendra Web Crawler di indicizzare i tuoi siti Web, consulta. Configurazione del file per Web Crawler robots.txtAmazon Kendra

Nota

L'uso improprio di Amazon Kendra Web Crawler per eseguire una scansione aggressiva di siti Web o pagine Web di cui non sei proprietario non è considerato un uso accettabile.

Amazon Kendradispone di due versioni del connettore. web crawler Le funzionalità supportate di ogni versione includono:

Amazon KendraConnettore Web Crawler v1.0/API WebCrawlerConfiguration

  • Proxy web

  • Filtri di inclusione/esclusione

Amazon KendraConnettore Web Crawler v2.0 /API TemplateConfiguration

  • Mappature dei campi

  • Filtri di inclusione/esclusione

  • Sincronizzazione completa e incrementale dei contenuti

  • Proxy web

  • Autenticazione di base, NTLM/Kerberos, SAML e tramite moduli per i tuoi siti Web

  • Virtual Private Cloud (VPC) (Cloud privato virtuale (VPC)

Importante

La creazione di connettori Web Crawler v2.0 non è supportata da. CloudFormation Utilizza il connettore Web Crawler v1.0 se hai bisogno di assistenza. CloudFormation

Per la risoluzione dei problemi relativi al connettore di origine dati del crawler Amazon Kendra Web, consulta. Risoluzione dei problemi relativi alle origini dati