Wireless Capsule Endoscopy helps physicians examine the gastrointestinal (GI) tract noninvasively, with the cost of generating many images. Many available datasets, such as KID2 and Kvasir, suffer from imbalance issue which make it difficult to train an effective artificial intelligence (AI) system. Moreover, increasing number of classes makes the problem worse. In this study, an ensemble of one-class classifiers is used for detecting anomaly. This method focuses on learning single models using samples from only one class, and ensemble all models for multiclass classification. A total of 1,778 normal, 227 inflammation, 303 vascular diseases, and 44 polyp images have been used from the KID2 dataset. In the first step, deep features are extracted based on an autoencoder architecture from the preprocessed images. Then, these features are oversampled using Synthetic Minority Over-sampling Technique and clustered using Ordering Points to Identify the Clustering Structure. To create one-class classification model, the Support Vector Data Descriptions are trained on each cluster with the help of Ant Colony Optimization, which is also used for tuning clustering parameters for improving F1-score. This process is applied on each classes and ensemble of final models used for multiclass classification. The entire algorithm ran 5 times and obtained F1-score 96.3 +- 0.2% and macro-average F1-score 85.0 +- 0.4%, for anomaly detection and multiclass classification, respectively. The results are compared with GoogleNet, AlexNet, Resnet50, VGG16 and other published algorithms, and demonstrate that the proposed method is a competitive choice for multiclass class anomaly detection in GI images.
翻译:无线卡普勒 Endoscop 帮助医生检查胃肠道(GI), 其成本为生成许多图像。 许多可用的数据集, 如 KID2 和 Kvasir, 都存在不平衡问题, 这使得难以培训有效的人工智能系统(AI) 。 此外, 类数的增加使得问题更加严重 。 在此研究中, 使用单级分类器的集合来检测异常点。 这个方法侧重于学习单类模型, 仅使用一个类样本, 并混合所有模型, 用于多级分类 。 从 KID2 数据集中共使用了1 778正常、 227 炎、 303 血管疾病和44 多元图象。 在第一步, 根据预处理的图像的自动编码结构, 深度特性使得问题更加严重。 然后, 这些特性被过度标注, 使用超标集的技术和集集点来识别组合结构 。 要创建一等分类模型, 使用支持性矢量数据说明, 将每个分类的 支持性数据解数据解解解解数级数 3, 用于每类 的 高级分类 的 用于使用 高级 数据 的 高级 和 高级 的 数据 的 。 用于 的 的 的 的 的 的 高级 和 的 的 的 的 高级 的 的 高级 的 的 的 的 的 高级 高级 的 的 的 的 和 的 的 的 的 的 的 的 的 的 的 的 的 的 的 和 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 和 的 的 的 的 的 的 的 和 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 和 的 的 的 的 的 的 的 和 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的