0%

mAP(mean of Average Precision),是目标检测中模型性能的衡量标准

在理解mAP的定义前要掌握混淆矩阵和交并比的先验知识

精确率:

召回率:

交并比

阅读全文 »

mAP(mean of Average Precision),是object detection中模型性能的衡量标准

混淆矩阵(confusion matrix)衡量分类型模型准确度中最基本直观的方法

$TN$ (true negative) 将负类预测成负类

$TP$ (true positive) 将正类预测成正类

$FN$ (false negative) 将正类预测成负类 (type Ⅰ error)

$FP$ (false positive) 将负类预测成正类 (type Ⅱ error)

阅读全文 »

JSON简介

  • JSON = JavaScript Object Notation
  • JSON 是轻量级的文本数据交换格式
  • JSON 具有自我描述性(人类可读)
  • JSON 独立于语言
阅读全文 »

当我们制作数据集时,经常会遇到批量下载百度图片的问题,制作一个批量下载器就显得很有必要,用python可以很快实现一个图片下载器

阅读全文 »

下载官方版yolov3项目工程

1
2
3
4
git clone https://github.com/pjreddie/darknet
cd darknet
# 如需使用GPU,将Makefile中的GPU赋值为1
make

阅读全文 »

Lex是linux平台下的一种词法分析程序生成器,它可以根据词法规则说明书的要求来生成单词识别程序,由该程序识别出输入文本中的各个单词

阅读全文 »

人脸识别是CNN的另一种典型应用。在人脸识别任务中,我们要完成的任务是对于任意的输入人脸图像,判断该图像是否为数据库中某一人的照片。但由于实际应用的限制,我们往往只能获取某人的单张照片作为数据集,通过单张数据训练模型来进行人脸识别的问题就被称为One-Shot问题

上图即为One-Shot问题的范例,对于第一张输入图像,识别系统应该判断出她是第二个人,而对于第二张图像,识别系统应该判断出她不属于四个人中

阅读全文 »

在目标定位中,我们如何判定定位效果的好坏呢,我们使用的估值函数为交并比(Intersection over Union)

在上图中红色框是目标的准确位置,假设紫色框是我们的预测位置,那他们的并集就是绿色的部分,交集是黄色的部分,IoU为

阅读全文 »

滑动窗口是一种解决目标检测的简单方法,但其问题也很明显:不能输出精确的边界框,同时识别精度与滑动窗的大小相关

比如在上图中由于滑动窗的选择大小不精确,就导致没有任何一个窗口中完全包含目标,同时目标边界未必是正方形或者指定的窗口大小

YOLO(You Only Look Once)算法是一种能实现精准定位边界框的目标检测算法

阅读全文 »

除分类问题外,定位问题也是神经网络要解决的目标之一

如上图所示,分类问题是判断图像中的物体种类,而定位问题则是在分类的同时在图像上把目标圈出来
分类问题的解决方法是通过softmax函数输出预测值,那如果想实现目标定位,就要修改一下softmax的输出

阅读全文 »