Amazon KendraWebcrawler - Amazon Kendra

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Amazon KendraWebcrawler

Sie können den Amazon Kendra Web Crawler verwenden, um Webseiten zu crawlen und zu indizieren.

Sie können nur öffentlich zugängliche Websites oder interne Unternehmenswebsites crawlen, die das sichere Kommunikationsprotokoll Hypertext Transfer Protocol Secure (HTTPS) verwenden. Wenn Sie beim Crawling einer Website einen Fehler erhalten, kann es sein, dass die Website für das Crawling gesperrt ist. Um interne Websites zu crawlen, können Sie einen Webproxy einrichten. Der Webproxy muss öffentlich zugänglich sein. Sie können auch eine Authentifizierung verwenden, um auf Websites zuzugreifen und diese zu crawlen.

Bei der Auswahl der zu indizierenden Websites müssen Sie die Amazon Acceptable Use Policy (Richtlinie zur zulässigen Nutzung) und alle anderen Amazon-Bedingungen einhalten. Denken Sie daran, dass Sie Amazon Kendra Web Crawler nur verwenden dürfen, um Ihre eigenen Webseiten oder Webseiten zu indizieren, für deren Indexierung Sie autorisiert sind. Informationen dazu, wie Sie verhindern können, dass Amazon Kendra Web Crawler Ihre Website (s) indexiert, finden Sie unter. Konfiguration der robots.txt Datei für Amazon Kendra Web Crawler

Anmerkung

Der Missbrauch von Amazon Kendra Web Crawler zum aggressiven Crawlen von Websites oder Webseiten, die Ihnen nicht gehören, wird nicht als akzeptable Nutzung angesehen.

Amazon Kendrahat zwei Versionen des Connectors. web crawler Zu den unterstützten Funktionen jeder Version gehören:

Amazon KendraWeb Crawler-Konnektor v1.0//API WebCrawlerConfiguration

  • Webproxy

  • Einschluss- und Ausschlussfilter

Amazon KendraWebcrawler-Konnektor v2.0/API TemplateConfiguration

  • Feldzuordnungen

  • Einschluss- und Ausschlussfilter

  • Vollständige und inkrementelle Inhaltssynchronisierung

  • Webproxy

  • Basic-, NTLM/Kerberos-, SAML- und Formularauthentifizierung für Ihre Websites

  • Virtual Private Cloud (VPC)

Wichtig

Die Erstellung von Web Crawler v2.0-Connectoren wird von nicht unterstützt. CloudFormation Verwenden Sie den Web Crawler v1.0-Connector, wenn Sie Unterstützung benötigen. CloudFormation

Informationen zur Problembehandlung Ihres Amazon Kendra Webcrawler-Datenquellen-Connectors finden Sie unter. Problembehandlung bei Datenquellen