摘要: 传统的家禽卫生监测方式主要是靠人工操作,既效率低、主观性强,又很难满足现代集约化养殖的需要。本文阐述以Stacking多模型融合技术为基础的禽类健康检测系统,通过CNN、ResNet、AlexNet、VGG等深度学习模型的融合,使禽类粪便图像分类的精确性、系统实时性和轻量化性能得到显著提升。实验结果表明,该系统的总体准确度为0.9919,优于单一模型,验证了多模型集成的有效性。文章还从监测结果出发,对家禽养殖业进行资源利用的策略分析,技术上的支持使家禽养殖业的智能化、可持续发展,此外系统还可以向其他农业影像分析场景进行推广,实现应用的广泛性。
Abstract: Traditional poultry hygiene monitoring methods mainly rely on manual operation, which is inefficient, subjective, and difficult to meet modern requirements the need for intensive farming. This article describes a poultry health detection system based on Stacking multi model fusion technology. Through the fusion of deep learning models such as CNN, ResNet, AlexNet, and VGG, the accuracy, real-time performance, and lightweight performance of poultry manure image classification have been significantly improved. The experimental results show that the overall accuracy of the system is 0.9919, which is better than a single model and verifies the effectiveness of multi model integration. The article also analyzes the strategy of resource utilization in the poultry farming industry based on monitoring results. Technical support enables the intelligent and sustainable development of the poultry farming industry. In addition, the system can be promoted to other agricultural image analysis scenarios to achieve widespread application.
1. 前言
家禽健康状况不仅与养殖场生产效益、经济效益直接相关,而且对产品质量、市场竞争力具有重要影响,是农业经济的重要组成部分。但传统的禽类卫生监测方法主要依靠人工操作,如通过耗时耗力、因经验差异、劳累等主观因素影响易导致误诊或漏诊的观察粪便特征、临床检查等方法判断禽类卫生状况。加之传统方法在实时性、连续性上明显不足,对疾病风险难以及时发现,不能满足高效精准监测现代集约化养殖的需求。近些年来,随着深度学习和计算机视觉技术的快速发展,运用图像分析进行家禽健康状况监测的方法成为可能。家禽粪便图像作为反映健康状况的重要数据载体,具有丰富的病理信息,可以通过自动化手段实现高效的疾病诊断。然而,目前国内外的研究多集中于单一模型的应用,对多模型协同作用的研究尚处于初步阶段,因此开发一种高效、稳定的多模型融合解决方案迫在眉睫。
本文是结合CNN、ResNet、AlexNet以及VGG等深度学习模型的优势,开发一种基于Stacking多模型融合的家禽健康检测系统。该系统在优化模型的实时性及轻量化性能的同时,通过多种模型间的相互协同,在确保系统在实际应用中具备更高效、更稳定的性能的同时,提高了对家禽粪便图像健康状况的分类准确率;并可对禽类健康自动化诊断起到有效的支撑作用,使禽类、鸭类等家禽的患病率大大降低,从而为保障禽类健康和公共卫生安全提供技术解决方案的同时,进一步降低对药物治疗的用药量,降低医疗费用。同时,该系统也提供了一个强有力的技术支持,使现代养殖业向智能化、集约化方向发展。
2. 研究背景
基于DeepLearning模型的家禽健康监测系统,随着现代人工智能技术的飞速发展,已逐渐成为研究的热点。学者们普遍认为,传统的人工观测方式,在满足现代化养殖需求方面,效率较低,主观色彩较浓[1]-[3]。比如通过观察禽类行为、粪便状态等进行健康监测的方法,虽然在小规模养殖上有一定的可行性,但这种方法在集约化养殖上,既费时又耗力,很难落到实处[4]。随着深度学习和计算机视觉技术的广泛应用,研究人员开始探索通过图像分析技术提升监测效率和准确性的解决方案[5] [6]。
目前已有的研究大致可分为两大类:第一类研究关注的是应用单一的特征或模型。如在图像识别方面表现优异的何凯明[7]等人提出的残差网络(ResNet),在家禽粪便图像的健康分析中得到了广泛应用。此外,Tan等还开发了一种基于图像分析的疾病诊断系统,该系统采用了卷积神经网络(CNN)来实现早期的疾病检测,但这类研究往往依赖单一的资料来源,在繁杂的育种环境下很难适应[8]。
第二类研究致力于多特征融合和多模型协同分析(Multi-Model)。研究发现,整合多模态数据有助于增强监测系统的全面性,包含图像数据、环境参数以及生理指标等[9] [10]。例如,Sun [9]等利用Stacking多模融合技术实现了不同数据源的协同分析,结合了CNN和支持向量机(SVM)。这些研究显示,在提高家禽健康监测的精确性和稳定性方面,多模式协同和数据融合方法具有显著优势。但是,这样的方法同样面临着挑战,需要更高的计算成本,以及更短的实时性。
上述研究虽有进展,但仍有一些欠缺。首先,在对多模型协同理论的探讨尚不深入的情况下,现有的研究更多地着眼于深度学习单一模型的优化。其次,以实验室环境数据为基础的研究居多,在实际养殖场景中缺乏验证。另外,深度学习模式的“BlackBox”特性,使得系统的可解释性受到限制,很难获得用户的广泛信赖[11]。最后,对多模式融合的部分探索还没有深入展开。今后的研究可以从以下几个方面展开:一是扩大数据集的规模和多样性,特别是要扩大包含不同病种的数据集;二是适应产业化部署需要,优化模型轻量化、实时性设计;三是加强模型解释性研究,研制智能监控系统,以利于用户使用;四是探索多模合一、实时性可操作的技术可行性。
综上所述,家禽健康监测领域的研究正逐步从单一模型向多模态协同方向发展。通过结合深度学习与多模型融合技术,构建高效、智能的家禽健康监测系统,将为现代化养殖业的可持续发展提供有力支持。
3. 技术路线
3.1. 数据处理
在数据处理阶段,我们首先对图像尺寸进行了统一化处理,利用transforms.Resize方法将所有图像调整为224 × 224像素,以增强模型的泛化能力。接着,我们使用transforms. ToTensor方法将图像从PIL格式转换为PyTorch Tensor格式,并标准化像素值至[0, 1]范围,便于后续处理。随后,我们采用datasets. ImageFolder类从预设目录中自动加载并标签化图像数据,依据文件夹名称(“healthy”与“unhealthy”)为图像赋予相应标签。最后,我们将数据集划分为训练集和测试集,以确保模型训练的有效性和评估的公正性。见图1,这一系列步骤为深度学习模型提供了标准化、格式统一的图像数据,为后续的模型训练与性能验证奠定了坚实基础。
Figure 1. Date processing flowchart
图1. 数据处理流程图
3.2. 模型构建
在本研究中,为提高监测禽类的健康状况的准确性及效率,我们采用Stacking (叠堆泛化)多模型融合法,这是一种多模态融合的集成式学习技术。Stacking是一种集成式的学习技术,可以将很多基本模型的预测结果整合在一起,从而有效提高最终预测的精确性和稳定性。以下是我们实现Stacking Multi-Model融合的具体流程。首先,我们选用四种在图像分类领域表现优异的深度学习模型为基本模型,适用于分析家禽粪便图片的任务。选择的基底模型有卷积神经网络、残差神经网络(ResNet)、AlexNet和VGG.这些模型的结构和特点各不相同,可以捕捉到不同类型的特征,然后使模型的整体性能得到提升。其次,模型训练时我们使用了涵盖正常粪便和有健康问题粪便样本的大量家禽粪便图片作为资料集。为了保证模型能够更好地学习有效特征,所有的图片都经过了标准化的预处理,包括图像尺寸调整,去噪和归一化等操作。采用交叉验证技术,将数据集分成若干子集,以不同子集轮流训练测试,以保证训练结果的可靠性和泛化能力。最后,在完成了基础机型的培训之后,就进入到了整合STACKING阶段。具体地说,Stacking方法是在一个元学习器(Meta-Learner)中输入每个基础模型的预测结果作为二次学习的新特征。这样,Metacritor就可以将基础模型的优点进一步结合,增强最终的预测性能。在本研究中,选择Metacritor是关键的一步。元学习器我们选择了逻辑回归,因为逻辑回归在很多应用上都有很好的表现,而且它的特点是简单,容易实现,并且具有很强的解释性。逻辑回归学习如何在不同模型的输出之间进行加权,最终输出更精确的预测,通过拟合基础模型的预测结果。
3.3. 数据结果分析
在本研究中,基于STACKING多模式融合的禽类健康状态检测系统,实现了对禽类健康状况的准确预测,通过对禽类粪便影像的深入分析,见图2。进行了严格的数据结果分析,以验证系统性能。资料集共收录14,618张家禽粪便影像,并附有标示,分为[健康]及[不健康]两大类。我们利用四个基本模型(CNN, ResNet, AlexNet, VGG)进行多模型的Stacking整合,使预测准确率得到提高。在考试阶段,预测套题采用预训练模式,预测成绩记录在案。
准确率评估:系统整体精确度达到0.9919,显示该模型对鸟类健康状况的识别精确度极高。这种优异的业绩得益于有效应用了Stacking多模式整合战略。
模型对比:通过对不同模型测试精确度的对比,我们发现Stacking集成后的模型比单一的基础模型表现明显要好。这证明,在提高预测准确率方面,多模式融合方法是有效的。
可视化分析:我们用形象化的方式展示了各模型随训练轮次变化的测试精准度。结果发现,各型号的精准度随着训练轮次的增加而逐步提高,模型的精准度在完成整合后得到了更显著的提高。
Figure 2. Training loss of four different deep learning models during the training process
图2. 四个不同深度学习模型在训练过程中的训练损失
4. 局限与建议
虽然这项研究在家禽健康检测系统的基础上取得了一些成果,但基于Stacking多模式融合技术,仍有一些局限性和有待改进之处。一是数据集规模和多样性限制。目前研究所用的资料收集规模有限,且主要集中在几种禽类常见疾病上。这就限制了模型的概括能力,也限制了模型识别罕见病症的能力。今后的研究要扩大数据集的规模和种类,使模型的稳健性得到进一步的提升。在训练过程中,模型在训练时能够更好地平衡分类和定位的精确度,采用动态任务对齐分配策略和损失计算的优化。以增强模型的适应性和泛化能力。二是实时性和轻量化需求。虽然该模型在实验中显示的精度很高,但在实际应用中为了满足工业级部署的需要,对模型的实时性、轻量化等都需进一步优化。为了达到更高效、准确的家禽健康检测,今后的研究方向是探讨更高效的算法和模型压缩技术。三是多模态数据集成。当前研究主要依靠图像资料,此法过于单一,今后可考虑将声音、生物传感器资料等多模态资料整合起来,收集更全面的家禽健康资讯。这类多模态资料一体化或将进一步提高侦测的精确性与及时性。四是实时预警与响应机制。通过机器端的自动识别和报警功能,及时发现疫病病变情况,并通过后台系统实现实时监测和响应,为养殖场管理者提供及时有效的预警信息。五是配套开发新的目标检测算法模型。借鉴生物系统信息处理机制,构建基于生物计算模型的算法框架,并赋予模型具有自适应、自组织、自修复的生物学特性。通过深度学习模型和生物免疫计算原理,对家禽的正常行为模式进行初步匹配,识别异常行为,并通过注意力机制和生成对抗网络进行异常检测和疾病识别。六是模型的可解释性。在图像识别上表现突出的深度学习模型虽然其“黑箱”特性限制了模型的可解释性。今后的研究方向是为便于养殖户及兽医对模型预测结果有较好的认识和信任,探索更多提高模型可解释性的方法。七是实际应用测试。本研究所用到的模型主要在缺少实际养殖环境验证的实验室环境中开展试验。今后的工作应包括对模型进行不同养殖条件下实测,以对其在现实工作中的性能及适用性进行评价。
综上所述,虽然本研究在对家禽健康监测的精确性及效率的提高上有所进展,但是为了实现家禽保健监测技术的整体进步与应用,仍需在资料集扩充、模型优化、多模态数据融合、模型可解释及实际应用测试方面做进一步的研究与开发。
5. 研究结论与发展
我们经过研究和实验提出了用于解决传统人工检测方法低效、误诊率高问题的基于Stacking多模型融合技术的禽类健康检测系统。该系统对禽类粪便图像进行了特征提取和分类,通过融合多深度学习模型实现了家禽疾病的早期诊断。实验结果显示,该系统在测试集的正确率上比单一模型的正确率要明显要好,从而验证了它的正确性和实用性。我们进行了研究过程中的数据预处理和构建模型体系结构,包括用于特征提取的CNN、Resnet、AlexNet和VGG等模型、用于优化模型性能的随机森林。实验结果表明:Stacking融合模型在各种指标上都取得了优异的成绩,证实了它的性能优势。误差分析发现,模型在特定的图像条件下出现了误差,这也给今后的研究提供了一个改进的方向。
本研究在禽类卫生监测系统具有较强的应用价值。该系统可以实现家禽疾病的早期诊断,从而减少检测误差率,提高疾病诊断的效率,对家禽的疾病进行早期诊断具有十分重要的意义。由于及时的疾病诊断和治疗能明显降低家禽死亡率,提高养殖效益,对养殖业具有十分重要的意义。研究证明,Stacking多模态融合技术性能优势较强,因此能够应用于各种农业场景,需要高精度图像分类。本研究通过对先进的计算机视觉技术和深度学习算法的应用,为家禽养殖健康监测领域的发展迈进一大步,从而实现家禽健康监测智能化、自动化,促进养殖业智能化发展。同时本研究也提供了很好的模型扩展。这一由Stacking多模型融合技术提出的禽类健康检测系统不仅适合于禽类的健康监测领域,甚至可以向作物的病害监测等其他农业图像分析场景迁移。
基金项目
2024国家级大学生创新创业训练计划(项目编号:202411548029)。