

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 在上构建可扩展的网络爬网系统 AWS
<a name="building"></a>

本节介绍如何构建本[架构](architecture.md)节中描述的网络爬虫。它包括一种系统的方法，用于创建强大的公司及其相关网络资产数据集。此数据集是您的抓取活动的基础。然后，本节介绍如何在中Python构建合乎道德的网络爬虫。

**Topics**
+ [准备数据集](building-prepare.md)
+ [构建 Web 爬虫](building-crawler.md)
+ [搭建 AWS 基础架构](building-infrastructure.md)