Automated red blood cell classification on blood smear images helps hematologist to analyze RBC lab results in less time and cost. Overlapping cells can cause incorrect predicted results that have to separate into multiple single RBCs before classifying. To classify multiple classes with deep learning, imbalance problems are common in medical imaging because normal samples are always higher than rare disease samples. This paper presents a new method to segment and classify red blood cells from blood smear images, specifically to tackle cell overlapping and data imbalance problems. Focusing on overlapping cell separation, our segmentation process first estimates ellipses to represent red blood cells. The method detects the concave points and then finds the ellipses using directed ellipse fitting. The accuracy is 0.889 on 20 blood smear images. Classification requires balanced training datasets. However, some RBC types are rare. The imbalance ratio is 34.538 on 12 classes with 20,875 individual red blood cell samples. The use of machine learning for RBC classification with an imbalance dataset is hence more challenging than many other applications. We analyze techniques to deal with this problem. The best accuracy and f1 score are 0.921 and 0.8679 on EfficientNet-b1 with augmentation. Experimental results show that the weight balancing technique with augmentation has the potential to deal with imbalance problems by improving the f1 score on minority classes while data augmentation significantly improves the overall classification performance.
翻译:血液涂片图像的自动红血细胞分类有助于血友病学家分析红细胞实验室结果的时间和成本减少。 重叠细胞可以导致不正确的预测结果, 在分类之前必须分为多个单一的RBC。 要将多类分类并进行深层学习, 不平衡问题在医学成像中是常见的, 因为正常的样本总是高于罕见的疾病样本。 本文提出了一个新方法, 将红血细胞从血液涂片中进行分解和分类, 特别是处理细胞重叠和数据不平衡问题。 侧重于重叠的细胞分离, 我们的分解过程首先估计省略出以代表红血细胞。 这种方法可以探测锥形点, 然后用定向的 Ellips 安装来发现椭圆。 20个血液涂片图像的准确性为 0. 889 。 但是, 某些 RBC 类型是罕见的。 12类的不平衡率为34.538, 使用20 875 个红细胞样本样本对红细胞进行分解, 具体解决细胞分类的机器学习比许多其他应用更具有挑战性。 我们分析处理这一问题的技术。 最佳的准确性和f1 分分分数是0. 921 和0. 和0. 869 分分比分比分比分数 水平, 水平 水平 水平 水平 水平 提高 提高 提高 增长 提高 提高 提高 增长 提高 提高 提高 提高 提高 提高 升级 提高 提高 提高 提高 提高 提高 提高 水平 提高 提高 提高 提高 提高 升级 提高 提高 提高 提高 提高 提高 提高 提高 提高 提高 提高 提高 提高 提高 提高 提高 提高 提高 水平 提高 提高 提高 提高 提高 提高 提高 提高 水平 提高 提高 提高 提高 提高 提高 提高 提高 提高 提高 提高 提高 水平 提高 提高 提高 提高 提高 提高 提高 提高 提高 提高 提高 提高 提高 提高 提高 提高 水平 提高 提高 提高 提高 提高 提高 提高 提高 提高 提高 提高 提高 提高 提高 提高 提高 提高 提高 提高 提高 提高 提高 提高 提高 提高