Wildlife object detection plays a vital role in biodiversity conservation, ecological monitoring, and habitat protection. However, this task is often challenged by environmental variability, visual similarities among species, and intra-class diversity. This study investigates the effectiveness of two individual deep learning architectures ResNet-101 and Inception v3 for wildlife object detection under such complex conditions. The models were trained and evaluated on a wildlife image dataset using a standardized preprocessing approach, which included resizing images to a maximum dimension of 800 pixels, converting them to RGB format, and transforming them into PyTorch tensors. A ratio of 70:30 training and validation split was used for model development. The ResNet-101 model achieved a classification accuracy of 94% and a mean Average Precision (mAP) of 0.91, showing strong performance in extracting deep hierarchical features. The Inception v3 model performed slightly better, attaining a classification accuracy of 95% and a mAP of 0.92, attributed to its efficient multi-scale feature extraction through parallel convolutions. Despite the strong results, both models exhibited challenges when detecting species with similar visual characteristics or those captured under poor lighting and occlusion. Nonetheless, the findings confirm that both ResNet-101 and Inception v3 are effective models for wildlife object detection tasks and provide a reliable foundation for conservation-focused computer vision applications.


翻译:野生动物目标检测在生物多样性保护、生态监测和栖息地保护中发挥着至关重要的作用。然而,该任务常受到环境变化、物种间视觉相似性以及类内多样性的挑战。本研究探讨了两种独立深度学习架构ResNet-101和Inception v3在此类复杂条件下进行野生动物目标检测的有效性。模型在野生动物图像数据集上采用标准化预处理方法进行训练和评估,预处理包括将图像最大尺寸调整为800像素、转换为RGB格式并转化为PyTorch张量。模型开发采用70:30的训练与验证数据划分。ResNet-101模型取得了94%的分类准确率和0.91的平均精度均值(mAP),在提取深层层次特征方面表现出色。Inception v3模型表现略优,获得95%的分类准确率和0.92的mAP,这归功于其通过并行卷积实现的高效多尺度特征提取。尽管结果优异,两种模型在检测具有相似视觉特征的物种或处于弱光照与遮挡条件下的个体时仍面临挑战。尽管如此,研究结果证实ResNet-101和Inception v3均是野生动物目标检测任务的有效模型,为保护导向的计算机视觉应用提供了可靠基础。

0
下载
关闭预览

相关内容

【NeurIPS2025】迈向开放世界的三维“物体性”学习
医学影像中的高效扩散模型:全面综述
专知会员服务
15+阅读 · 5月26日
深度学习图像检索(CBIR): 十年之大综述
专知
66+阅读 · 2020年12月5日
【CVPR 2020 Oral】小样本类增量学习
专知
20+阅读 · 2020年6月26日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
相关VIP内容
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员