mask rcnn 数据基础介绍

[TOC] 概念理解 Mask R-CNN (Regional Convolutional Neural Network: 区域卷积神经网络) 图像分类 (Classification): 图片中有气球。 语义分割 (Semantic Segmentation): 这些是图片中组成所有气球的像素。 目标检测 (Object Detection): 这里是图片中7个气球的位置。我们需要识别被遮挡的物体。 实例分割 (Instance Segmentation): 这是是图片中7个气球的位置,包括组成每一个气球的像素。 mAP: 均值平均精度(Mean Average Precision) Backbone: 骨干网络 backbone feature map : 骨干特征图 Feature Pyramid Network (FPN): 特征金字塔网络 Mask RCNN 的实现采用的是 ResNet101 + FPN 作为骨干网络 Region Proposal Network (RPN): 区域提议网络 Anchor: 锚点, RPN 通过扫描骨干特征图(backbone feature map ) 得到锚点的. SSD 中称为先验框Prior boxes Non-max Suppression : 非最大抑制, 在 RPN 预测过程中,我们会选择最可能包含物体的锚点,然后去修正它们的位置以及尺寸。如果有些锚点重叠得太多,我们会保留前景得分最高的一个,而其他的锚点就丢弃掉(这种方式成为非最大抑制 Non-max Suppression )。 ...

August 13, 2018

mask rcnn 数据预处理解读

[TOC] import os import sys import json import skimage.draw import skimage.io import skimage.color from imgaug import augmenters as iaa import numpy as np import random import matplotlib.pyplot as plt # plt.switch_backend('agg') # Root directory of the project ROOT_DIR = os.path.abspath("../../") sys.path.append(ROOT_DIR) # Import Mask RCNN from mrcnn import visualize from mrcnn.config import Config from mrcnn import model as modellib, utils from mrcnn.model import log from samples.cells import run_via_json COCO_MODEL_PATH = os.path.join(ROOT_DIR, "mask_rcnn_coco.h5") DEFAULT_LOGS_DIR = os.path.join(ROOT_DIR, "logs") class_names = ['BG', 'cells1', 'cells2'] train_class_name = ['cells1', 'cells2'] show_class_name = ['cells2'] train_config = run_via_json.TrainConfig() config = train_config dataset = run_via_json.CellDataset() dataset.load_data(train_config.dataset_dir, train_config.train_dir_name, class_names, annotation=train_config.train_annotation_json) dataset.prepare()

August 13, 2018