Prerequisiti Attivare l'ambiente Conda Compilazione Resnet50 ResNet50 Inferenza

Utilizzo di MXNet -Neuron e del Neuron Compiler AWS

L'API di compilazione MXNet -Neuron fornisce un metodo per compilare un grafico modello che è possibile eseguire su un dispositivo Inferentia.AWS

In questo esempio, si utilizza l'API per compilare un modello ResNet -50 e utilizzarlo per eseguire l'inferenza.

Per ulteriori informazioni su Neuron SDK, consulta la documentazione di Neuron SDK.AWS

Prerequisiti

Prima di utilizzare questo tutorial, è necessario aver completato la procedura di configurazione in Avvio di un'istanza DLAMI con Neuron AWS. È inoltre necessario avere dimestichezza con il deep learning e l'uso del DLAMI.

Attivare l'ambiente Conda

Attiva l'ambiente MXNet -Neuron conda usando il seguente comando:



source activate aws_neuron_mxnet_p36

Per uscire dall'ambiente conda corrente, eseguire:



source deactivate

Compilazione Resnet50

Creare uno script Python chiamato mxnet_compile_resnet50.py con il seguente contenuto. Questo script utilizza l'API Python di compilazione MXNet -Neuron per compilare un modello -50. ResNet



import mxnet as mx
import numpy as np

print("downloading...")
path='http://data.mxnet.io/models/imagenet/'
mx.test_utils.download(path+'resnet/50-layers/resnet-50-0000.params')
mx.test_utils.download(path+'resnet/50-layers/resnet-50-symbol.json')
print("download finished.")

sym, args, aux = mx.model.load_checkpoint('resnet-50', 0)

print("compile for inferentia using neuron... this will take a few minutes...")
inputs = { "data" : mx.nd.ones([1,3,224,224], name='data', dtype='float32') }

sym, args, aux = mx.contrib.neuron.compile(sym, args, aux, inputs)

print("save compiled model...")
mx.model.save_checkpoint("compiled_resnet50", 0, sym, args, aux)

Compilare il modello utilizzando il seguente comando:



python mxnet_compile_resnet50.py

La compilazione richiederà alcuni minuti. Al termine della compilazione, i seguenti file si troveranno nella directory corrente:



resnet-50-0000.params
resnet-50-symbol.json
compiled_resnet50-0000.params
compiled_resnet50-symbol.json

ResNet50 Inferenza

Creare uno script Python chiamato mxnet_infer_resnet50.py con il seguente contenuto. Questo script scarica un'immagine di esempio e la usa per eseguire l'inferenza con il modello compilato.



import mxnet as mx
import numpy as np

path='http://data.mxnet.io/models/imagenet/'
mx.test_utils.download(path+'synset.txt')

fname = mx.test_utils.download('https://raw.githubusercontent.com/awslabs/mxnet-model-server/master/docs/images/kitten_small.jpg')
img = mx.image.imread(fname)

# convert into format (batch, RGB, width, height)
img = mx.image.imresize(img, 224, 224) 
# resize
img = img.transpose((2, 0, 1)) 
# Channel first
img = img.expand_dims(axis=0) 
# batchify
img = img.astype(dtype='float32')

sym, args, aux = mx.model.load_checkpoint('compiled_resnet50', 0)
softmax = mx.nd.random_normal(shape=(1,))
args['softmax_label'] = softmax
args['data'] = img
# Inferentia context
ctx = mx.neuron()

exe = sym.bind(ctx=ctx, args=args, aux_states=aux, grad_req='null')
with open('synset.txt', 'r') as f:
    labels = [l.rstrip() for l in f]

exe.forward(data=img)
prob = exe.outputs[0].asnumpy()
# print the top-5
prob = np.squeeze(prob)
a = np.argsort(prob)[::-1] 
for i in a[0:5]:
    print('probability=%f, class=%s' %(prob[i], labels[i]))

Eseguire l'inferenza con il modello compilato utilizzando il seguente comando:



python mxnet_infer_resnet50.py

L'aspetto dell'output deve essere simile al seguente:



probability=0.642454, class=n02123045 tabby, tabby cat
probability=0.189407, class=n02123159 tiger cat
probability=0.100798, class=n02124075 Egyptian cat
probability=0.030649, class=n02127052 lynx, catamount
probability=0.016278, class=n02129604 tiger, Panthera tigris

Fase succcessiva

Utilizzo di MXNet -Neuron Model Serving

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Utilizzo di AWS Neuron Serving TensorFlow

Utilizzo di MXNet -Neuron Model Serving