

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

# Creazione di un sistema di scansione web scalabile per i dati ESG su AWS
<a name="introduction"></a>

*Vijit Vashishtha e Mansi Doshi, Amazon Web Services*

*Gennaio 2025* [(storia del](doc-history.md) documento)

I fattori ambientali, sociali e di governance (ESG) sono considerazioni fondamentali per gli investitori nella valutazione dei potenziali investimenti:
+ **Ambientale**: si concentra sull'impatto di un'azienda sul mondo naturale. Include fattori come le emissioni di carbonio, la gestione delle risorse e l'efficienza energetica.
+ **Sociale**: esamina il modo in cui un'azienda gestisce le relazioni con dipendenti, fornitori, clienti e comunità. Copre aspetti come le pratiche di lavoro, la diversità e il coinvolgimento della comunità.
+ **Governance**: esamina la leadership, i controlli interni e i diritti degli azionisti di un'azienda. Include la composizione del consiglio di amministrazione, la retribuzione dei dirigenti e l'etica aziendale.

Le aziende con solide pratiche ESG sono sempre più considerate in una posizione migliore per la sostenibilità e la redditività a lungo termine. Vi è una crescente domanda da parte degli investitori di informazioni ESG. Le aziende in grado di dimostrare le proprie credenziali di sostenibilità attraverso dati ESG affidabili e utili si trovano in una posizione migliore per attrarre capitali e rimanere competitive. Le aziende pubblicano i dati ESG attraverso varie fonti, come notizie, articoli e rapporti annuali. Poiché queste informazioni sono sparse, un web crawler può aiutarti a raccogliere questi dati in modo efficiente.

Questa guida completa dimostra come utilizzare [AWS Fargate](https://docs.aws.amazon.com/AmazonECS/latest/developerguide/AWS_Fargate.html)[Amazon Elastic Compute Cloud (Amazon [AWS Batch](https://docs.aws.amazon.com/batch/latest/userguide/what-is-batch.html)EC2) e Amazon Simple Storage Service (](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/concepts.html)[Amazon S3) Simple Storage Service (Amazon S3) per creare una pipeline di raccolta dati solida,](https://docs.aws.amazon.com/AmazonS3/latest/userguide/Welcome.html) scalabile e responsabile. Descrive quanto segue:
+ Progettazione di un sistema di scansione scalabile utilizzando quanto segue: Servizi AWS
  + Fargate o Amazon EC2 per l'esecuzione dell'applicazione crawler
  + AWS Batch per orchestrare in modo efficiente i lavori di scansione su larga scala
  + Amazon S3 per uno storage di dati sicuro e duraturo
+ Implementazione delle migliori pratiche per la scansione etica, tra cui:
  + Rispetto del file robots.txt e delle politiche relative al sito
  + Gestione della limitazione della velocità per evitare di sovraccaricare i siti target
  + Garantire la privacy dei dati e l'uso responsabile delle informazioni raccolte
+ Sviluppo di un crawler Python basato su un crawler ottimizzato per l'infrastruttura AWS 
+ Ottimizzazione delle prestazioni del crawler mantenendo al contempo gli standard etici

## Destinatari principali
<a name="intended-audience"></a>

Questa guida è destinata agli ingegneri dei dati e agli architetti del cloud che desiderano raccogliere in modo efficiente grandi quantità di dati up-to-date ESG da siti Web pubblici. È particolarmente rilevante per i progetti che coinvolgono analisi di mercato, valutazioni finanziarie sostenibili o ricerche finanziarie.

## Obiettivi aziendali specifici
<a name="targeted-business-outcomes"></a>

I motivi più comuni per cui le aziende utilizzano i dati ESG sono i seguenti:
+ **Gestione del rischio**: i dati ESG aiutano a identificare e mitigare i potenziali rischi legati a questioni ambientali, sociali e di governance.
+ **Attrazione degli investitori**: molti investitori ora considerano i fattori ESG quando prendono decisioni di investimento. Considerano le solide pratiche ESG come indicatori di sostenibilità e redditività a lungo termine.
+ **Gestione della reputazione**: una buona performance ESG può migliorare la reputazione di un'azienda tra clienti, dipendenti e pubblico in generale.
+ **Conformità normativa**: con l'aumento delle normative relative ai fattori ESG, l'adozione di pratiche ESG aiuta le aziende a stare al passo con i requisiti di conformità.
+ **Innovazione ed efficienza**: concentrarsi sui fattori ESG può favorire l'innovazione nei prodotti, nei servizi e nelle operazioni. Ciò porta a una maggiore efficienza e a risparmi sui costi.
+ **Vantaggio competitivo**: una forte performance ESG può differenziare un'azienda dai suoi concorrenti e aprire nuove opportunità di mercato.
+ **Coinvolgimento degli stakeholder**: le pratiche ESG aiutano le aziende a interagire meglio e a soddisfare le aspettative dei vari stakeholder, tra cui dipendenti, clienti e comunità locali.