- 转载请注明作者和出处:http://blog.csdn.net/u011475210
- 嵌入式平台:NVIDIA Jetson TX1
- 嵌入式系统:Ubuntu16.04
- 编者: WordZzzz
系列教程持续发布中,欢迎订阅、关注、收藏、评论、点赞哦~~( ̄▽ ̄~)~
前言
下周甲方要来查看项目进行,我着急忙慌的在刚刷完机的板子上编译YOLO,然而,webcom不好用······记性真是差的不行,赶紧打开markdown,把先前的笔记都整理出来。
本篇文章分为两个部分,第一部分是YOLO安装,第二部分是YOLO的优化加速。
YOLO安装
YOLO官网:https://pjreddie.com/darknet/yolo/
不说废话,就是干。
1.获取源码:
1 | git clone https://github.com/pjreddie/darknet |
2.修改Makefile
我们打开MakeFile文件:
1 | vim Makefile |
Makefile内容如下:
1 | GPU=0 |
我们只需要关注前几行:
1 | GPU=0 |
前五行的这些类似于宏定义,在make的时候会导致某些程序功能的开启与关闭,0代表关闭,1代表开启。我直接把前四个都打开了。想用GPU,那么前两行就得打开;想用webcom等OpenCV实现的程序,那么就需要打开OPENCV;至于OPENCMP,我只知道它是用来实现多线程优化加速的,所以我干脆也打开了。
- TX1计算能力是53,对应的配置:
1 | GPU=1 |
- TX1计算能力是53,对应的配置:
1 | GPU=1 |
3.保存Makefile之后,开始编译:
1 | make |
4.下载预训练好的模型:
1 | wget https://pjreddie.com/media/files/yolo.weights |
5.测试:
我直接用webcom来测试。注意,必须使用支持V4L2的摄像头,板载的摄像头是不支持的,当然,如果你在Makefile里面没打开Opencv,这里是会报错的。
- COCO数据集训练的YOLO(干跑3帧左右):
1 | ./darknet detector demo cfg/coco.data cfg/yolo.cfg yolo.weights |
- COCO数据集训练的TINY-YOLO(干跑15帧左右):
1 | ./darknet detector demo cfg/coco.data cfg/tiny-yolo.cfg tiny-yolo.weights |
- COCO数据集训练的TINY-YOLO(干跑15帧左右):
1 | ./darknet detector demo cfg/voc.data cfg/tiny-yolo-voc.cfg tiny-yolo-voc.weights |
注:大家如果想看看不开GPU跑成什么样子,可以加入参数-nogpu。举个栗子:
- COCO数据集训练的TINY-YOLO(关掉GPU):
1 | ./darknet -nogpu detector demo cfg/voc.data cfg/tiny-yolo-voc.cfg tiny-yolo-voc.weights |
- 查看GPU使用情况:
1 | $ sudo ~/tegrastats |
YOLO的优化加速
大家是不是不满足上面的帧率,别着急,WordZzzz带着你搞优化啊。正经说来,也不算优化,就是调调参数,让代码跑的快点。
修改网络模型输入图像尺寸大小
YOLOv2做了很多优化,其中就有为了提高小物体检测准确率而增加的多尺度训练(这里说的不够专业,后面有时间了专门写篇讲解YOLO的文章)。
原来的YOLO网络使用固定的448 448的图片作为输入,现在加入anchor boxes后,输入变成了416 416。目前的网络只用到了卷积层和池化层,那么就可以进行动态调整(意思是可检测任意大小图片)。作者希望YOLOv2具有不同尺寸图片的鲁棒性,因此在训练的时候也考虑了这一点。
不同于固定输入网络的图片尺寸的方法,作者在几次迭代后就会微调网络。没经过10次训练(10 epoch),就会随机选择新的图片尺寸。YOLO网络使用的降采样参数为32,那么就使用32的倍数进行尺度池化{320,352,…,608}。最终最小的尺寸为320 320,最大的尺寸为608 608。接着按照输入尺寸调整网络进行训练。
这种机制使得网络可以更好地预测不同尺寸的图片,意味着同一个网络可以进行不同分辨率的检测任务,在小尺寸图片上YOLOv2运行更快,在速度和精度上达到了平衡。
所以,我们可以修改输入尺寸大小,来提高YOLO运行速度。
随便打开一个cfg下的cfg文件,如“tiny-yolo.cfg”,内容如下:
1 | [net] |
同样的,我们只需要看前面几行就行,把width和height修改成最小尺度:
1 | width=288 |
此时再次使用COCO数据集训练的TINY-YOLO进行测试,帧率可以提高到20左右:
1 | ./darknet detector demo cfg/coco.data cfg/tiny-yolo.cfg tiny-yolo.weights |
修改预览分辨率
可以直接X掉预览窗口,这样,预览窗口减小后,速度也会提升,只不过有时候效果不明显。
当然,大家也可以修改源码然后重新编译。源码中预览窗口大小的代码在src/demo.c中的第279行。我把预览分辨率改成了1280 * 720,当然你还可以改的更小。改完之后重新编译。
1 | if(!prefix){ |
修改摄像头分辨率
一开始就让摄像头采集到的分辨率低点,也是有效果的。
1 | ./darknet detector demo cfg/coco.data cfg/tiny-yolo.cfg tiny-yolo.weights -w 640 -h 480 |
经过上述三步的优化之后,我用COCO数据集,帧率峰值都能到30(TX2,TX1慢5帧左右)。
系列教程持续发布中,欢迎订阅、关注、收藏、评论、点赞哦~~( ̄▽ ̄~)~
完的汪(∪。∪)。。。zzz