Acuity-toolkit转换模型假如我的mean中三个值和std中三个值都不一样怎么办？

Aruen · August 5, 2021, 2:35am

@Frank @jasonl
1_quantize_model.sh中只有四个值，前三个是mean,第四个是std
–channel-mean-value ‘114.5 114.5 114.5 57.63’

实际：
mean：{123.675，116.280，103.530}
std:{58.395, 57.120, 57.375}

Frank · August 6, 2021, 1:43am

@Aruen 这个是工具目前本身的一个限制，可能没有办法做这么一个操作，所以我的建议是，在模型量化的时候，这里直接就设置为1.在你代码里面手动去处理，或者你可以选择一个平均值，去测试下效果。

Aruen · August 6, 2021, 2:00am

@Frank @jasonl
我现在有一个onnx模型通过acuity-toolkit转nb后，c++推理结果与cpu下网络输出结果差的挺大的，不知道什么原因？

$convert_onnx \
    --onnx-model ./model/vargfacenet.onnx \
    --net-output ${NAME}.json \
    --data-output ${NAME}.data


$tensorzone \
    --action quantization \
    --dtype float32 \
    --source text \
    --source-file data/validation_onnx.txt \
    --channel-mean-value '127.5 127.5 127.5 127.5' \
    --reorder-channel '0 1 2' \
    --model-input ${NAME}.json \
    --model-data ${NAME}.data \
    --model-quantize ${NAME}.quantize \
    --quantized-dtype asymmetric_affine-u8 \
    --quantized-rebuild \


$export_ovxlib \
    --model-input ${NAME}.json \
    --data-input ${NAME}.data \
    --reorder-channel '0 1 2' \
    --channel-mean-value '127.5 127.5 127.5 127.5' \
    --export-dtype quantized \
    --model-quantize ${NAME}.quantize \
    --optimize VIPNANOQI_PID0X88  \
    --viv-sdk ${ACUITY_PATH}vcmdtools \
    --pack-nbg-unify  \

cpu下

image = cv2.imread(img_path) # H,W,C, BGR, numpy
        if image.shape[0] != 112 or image.shape[1] != 112:
            image = cv2.resize(image, (112,112))
        #if image.shape[0] != 80 or image.shape[1] != 144:
        #    image = cv2.resize(image, (144,80))
        image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB) # H,W,C, RGB, numpy
        image = image.transpose(2, 0, 1).astype(np.float32) / 255 # C,H,W, RGB, (0,1)
        image[0,:,:] = (image[0,:,:] - 0.5) / 0.5 # R
        image[1,:,:] = (image[1,:,:] - 0.5) / 0.5 # G
        image[2,:,:] = (image[2,:,:] - 0.5) / 0.5 # B
        image = image[np.newaxis, :] # 1,C,H,W,numpy
        image = torch.from_numpy(image) # 1,C,H,W, tensor

这些地方应该都对得上

c++推理：

config.modelType = ONNX
inData.input_type = RGB24_RAW_DATA;
 outconfig.format = AML_OUTDATA_FLOAT32;

onnx网络输出前四位：
1.84245333e-02 -4.22798276e-01 7.84602523e-01 -7.89071247e-02
c++网络输出前四位：
0.122210 -0.058842 -0.063368 -0.004526

Frank · August 6, 2021, 3:13am

@Aruen 这应该是后处理代码的关系把，这个还是需要你自己研究下代码，aml nn本身就不开源，封装性也比较高，我认为这里的数据还要再经过处理

Aruen · August 6, 2021, 3:16am

这个是网络直接输出，没有到后处理那里！前处理应该是什么问题呀！

Frank · August 6, 2021, 3:25am

@Aruen 不清楚，这个库是不开源的，前处理接口是封装好的，我这边也没办法帮你调试

Aruen · August 6, 2021, 3:28am

@Frank
是不是用生成的原始的case_code的c++去跑，看网络输出结果，也可以做个对比！

Frank · August 6, 2021, 7:01am

@Aruen 原始的可以设置打印信息等级，可以看到更多打印信息，而且封装程度不高，你可以获取并打印出输出层的所有信息，你可以查看比对一下这些信息和你的ONNX模型

Aruen · August 9, 2021, 9:37am

@Frank

按照推荐步骤去分析，float类型的精度和原始cpu平台下测试结果就差的很大（有没有onnx模型的转换demo?）
（1）确认float类型的精度和原始cpu平台下测试结果相差很多
原始cpu平台下跑onnx模型网络输出:
0.0184245333
-0.422798276  
0.784602523
-0.0789071247
-0.0164997458
-0.326351434
0.180208728  
0.124262467
-0.239654392
-0.121204361

量化前：执行完import导入模型之后，使用inference.sh脚本（执行0_import_model.sh后执行inference.sh）
root@50d4581267c4:/test/aml_npu_sdk_6.4.4.3/acuity-toolkit/nomask_face_feature# head -10 before_quant_512.tensor
0.10576270520687103
-0.07041622698307037
-0.08786770701408386
-0.03913433849811554
-0.14785173535346985
0.04474426060914993
0.14684905111789703
0.1447640359401703
-0.2373252809047699
0.05276653915643692

Frank · August 9, 2021, 9:47am

Aruen:

按照推荐步骤去分析，float类型的精度和原始cpu平台下测试结果就差的很大（有没有onnx模型的转换demo?）
（1）确认float类型的精度和原始cpu平台下测试结果相近

上面说差很多，下面说相近，是不是哪里打错字了？

Aruen · August 9, 2021, 12:32pm

@Frank
下面字打错了，直接看数据，是相差很多！

Frank · August 10, 2021, 1:23am

@Aruen 这个问题比较难分析，工具本身不开源，onnx模型本身转换时也没有其他参数，也许你可以转成其他平台的再转换试试，或者试试其他onnx模型

Aruen · August 10, 2021, 2:56am

@Frank
原本模型是pytorch，由于acuity-toolkit工具支持的pytorch版本最大1.2.0,我们pytorch模型训练的大于1.2.0,没办法才把pytorch模型转成onnx再去转成nb文件！

Frank · August 10, 2021, 3:44am

@Aruen 目前来说，我这边能提供的帮助比较有限，这工具不开源，我也没办法帮你做什么内部的debug