environment building

  • 安装tensorrt-8.6.1环境: 手动下载tensorrt lib8.6.1后上传至服务器安装(https://pypi.nvidia.com/tensorrt-libs/tensorrt_libs-8.6.1-py2.py3-none-manylinux_2_17_x86_64.whl)

    安装pycuda前, sudo apt-get install python3.8-dev libxml2-dev libxslt-dev

tips

pt2onnx 转换生成的如果是static的onnx,那么就无法生成dynamic的engine了

reference

TODO

dynamic shape model: https://zhuanlan.zhihu.com/p/299845547

training tips

  • 💡 Add –cache ram or –cache disk to speed up training (requires significant RAM/disk resources).

experiments

TODO

0.如何将dynamic输入的模型调通?使用不加padding的letterbox得到正确结果

1.ultralytics默认选项设置训练出来的模型,对于resize、letterbox的适应性试验;

2.如果适应很好,可以替换letterbox

3.如果适应不好,需要:

  • 1)使用torch重构letterbox;
  • 2)使用cuda memcp的stride格式(存在么?)
    1. 使用cuda memcpy可以从torch tensor中拷贝么?或者直接使用torch tensor的cuda显存?
    1. 优化目前的myletterbox
  • 5)训练一个真正的dynamic输入的模型

4.如何训练出可以接受resize输入,不需要补齐黑边的模型