

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

# Strategia dei dati
<a name="data-strategy"></a>


| **Domanda** | **Example response** | 
| --- | --- | 
| Quali tipi di dati specifici sono fondamentali per i carichi di lavoro di intelligenza artificiale generativa e quale percentuale di questi è attualmente accessibile? | I registri delle chiamate dei clienti e i dati sulle recensioni dei prodotti sono fondamentali. Attualmente, l'85% di questi tipi di dati è accessibile per i nostri progetti di intelligenza artificiale generativa. | 
| Come garantite e misurate la qualità dei vostri dati? | Abbiamo implementato metriche sulla qualità dei dati, tra cui completezza, accuratezza, coerenza e tempestività. Utilizziamo strumenti automatizzati per valutare regolarmente queste metriche e disponiamo di un team dedicato per la pulizia e l'arricchimento dei dati. | 
| Quale percentuale dei tuoi dati soddisfa i tuoi standard di qualità per l'uso dell'IA generativa? | Attualmente, il 78% dei nostri dati soddisfa i nostri standard di qualità. Puntiamo a raggiungere il 95% entro i prossimi 12 mesi attraverso migliori processi di pulizia dei dati. | 
| Come pensate di creare fiducia tra i vostri stakeholder in merito all'utilizzo dei dati nell'IA generativa? | Stiamo implementando un comitato etico per l'IA, fornendo spiegazioni chiare sulle decisioni in materia di intelligenza artificiale e conducendo audit trimestrali sull'IA per garantire trasparenza ed equità. | 
| Quanto è completa la vostra documentazione sulle fonti di dati e sulla provenienza dei dati? | Disponiamo di un catalogo di dati dettagliato che include i metadati per tutte le nostre fonti di dati, tra cui origine, frequenza di aggiornamento e utilizzo. Utilizziamo strumenti di data lineage per monitorare il flusso e la trasformazione dei dati tra i nostri sistemi. | 
| Come garantite la diversità dei set di dati per prevenire distorsioni nei modelli di intelligenza artificiale? | Riceviamo attivamente dati da diversi dati demografici e controlliamo regolarmente i nostri set di dati per individuare eventuali distorsioni rappresentazionali. Utilizziamo anche tecniche di generazione di dati sintetici per bilanciare le categorie sottorappresentate. | 
| Qual è la frequenza di aggiornamento dei dati per i modelli di intelligenza artificiale generativa critici e come si determina questa frequenza? | I modelli critici vengono aggiornati settimanalmente. Questa frequenza è determinata dalle metriche prestazionali dei test A/B e miriamo a una riduzione non superiore al 2% tra un aggiornamento e l'altro. | 
| Quante versioni di set di dati critici conservate e per quanto tempo? | Conserviamo le ultime cinque versioni di ogni set di dati critico, con un periodo di conservazione di 18 mesi per ogni versione. | 
| Quanti team interfunzionali sono coinvolti nelle vostre iniziative di intelligenza artificiale generativa e hanno accesso ai vostri dati? | Abbiamo tre team interfunzionali. Ogni team include data scientist, esperti di settore, esperti di etica e analisti aziendali. | 
| Quali politiche e pratiche di governance dei dati avete in atto? | Abbiamo un comitato interfunzionale per la governance dei dati che supervisiona le nostre politiche sui dati. Abbiamo implementato controlli degli accessi basati sui ruoli, schemi di classificazione dei dati e audit regolari per garantire la conformità al nostro quadro di governance. | 
| Quali misure avete adottato per garantire la privacy dei dati, ottenere il consenso adeguato e mantenere la riservatezza? | Abbiamo implementato un quadro completo sulla privacy dei dati in linea con GDPR e CCPA. Ciò include l'ottenimento del consenso esplicito per l'utilizzo dei dati, l'implementazione di tecniche di anonimizzazione dei dati e regolari valutazioni dell'impatto sulla privacy. | 
| Quale percentuale dei vostri set di dati di formazione sull'intelligenza artificiale è stata verificata per individuare eventuali distorsioni nell'ultimo trimestre? | Il 70% dei nostri set di dati di formazione sull'intelligenza artificiale è stato verificato per rilevare eventuali distorsioni lo scorso trimestre. Stiamo implementando strumenti automatici di rilevamento dei pregiudizi per ottenere audit trimestrali al 100%. | 
| Qual è la tua attuale capacità di elaborazione dei dati e quanto prevedi di averne bisogno per i futuri carichi di lavoro di intelligenza artificiale generativa? | La nostra capacità attuale è del 10% TB/day. We project needing 30 TB/day entro un anno e stiamo scalando la nostra infrastruttura per soddisfare questa domanda. | 
| Qual è la tua strategia per bilanciare la privacy dei dati con le esigenze dei dati dei modelli di intelligenza artificiale generativa? | Stiamo implementando tecniche di anonimizzazione avanzate e generazione di dati sintetici. Il nostro obiettivo è aumentare i nostri dati utilizzabili per l'IA del 40%, riducendo al contempo i rischi per la privacy del 60% nel prossimo anno. | 
| Quale percentuale dei tuoi set di dati di machine learning (ML) è etichettata con precisione e qual è il tuo tasso di precisione obiettivo? | Attualmente, l'85% dei nostri set di dati ML è etichettato con precisione. Puntiamo a un tasso di precisione del 95% entro il prossimo trimestre utilizzando tecniche di etichettatura sia umane che automatizzate. | 