肺结核是全球公共卫生问题,每年数百万人受到其影响,其中包括成千上万的死亡病例。尽管存在有效的治疗方法,但及时诊断和早期干预仍然是防止病灶扩大的关键,其中外科手术治疗成为了一种有效手段。本文提出了一种基于YOLOv2算法的微创手术机器人肺结核病灶识别技术。该技术结合了微创手术机器人、内窥镜、K210视觉识别模块以及YOLOv2识别算法,以提高肺结核病灶实时监测的识别准确度和处理效率。本文构建了训练数据集,使用YOLOv2算法进行深度网络训练,并评估了性能指标,包括准确率、召回率、精确度和F1分数。实验结果表明,该技术具有高准确度和高效率,有望改进肺结核的检测与治疗手段。 Tuberculosis has been a major challenge in the global public health sector, affecting millions of people annually, including tens of thousands of fatalities. Despite the existence of effective treatment methods, timely diagnosis and early intervention remain crucial in preventing the spread of lesions. Surgical intervention has emerged as an effective means of treatment. This paper introduces a minimally invasive surgical robot-based tuberculosis lesion recognition technology, which is built upon the YOLOv2 algorithm. This technology combines robot system design, endoscopy, the K210 visual recognition module, and the YOLOv2 recognition algorithm to enhance the identification accuracy and the handling efficiency for real-time recognition. The paper constructed a diverse training dataset, conducted deep network training using the YOLOv2 algorithm, and evaluated performance metrics, including accuracy, recall, precision, and F1 score. Experimental results demonstrate that this technology offers high accuracy and efficiency, with the potential to enhance tuberculosis detection and treatment.
肺结核是全球公共卫生问题,每年数百万人受到其影响,其中包括成千上万的死亡病例。尽管存在有效的治疗方法,但及时诊断和早期干预仍然是防止病灶扩大的关键,其中外科手术治疗成为了一种有效手段。本文提出了一种基于YOLOv2算法的微创手术机器人肺结核病灶识别技术。该技术结合了微创手术机器人、内窥镜、K210视觉识别模块以及YOLOv2识别算法,以提高肺结核病灶实时监测的识别准确度和处理效率。本文构建了训练数据集,使用YOLOv2算法进行深度网络训练,并评估了性能指标,包括准确率、召回率、精确度和F1分数。实验结果表明,该技术具有高准确度和高效率,有望改进肺结核的检测与治疗手段。
肺结核,YOLOv2算法,K210,图像识别
Erhan Zhu, Yu Guo, Zheming Fan, Xinyang Zhang, Xinyu Lu, Shuai Xu, Fengfeng Wang
College of Mechanical and Electrical Engineering, Jinling Institute of Technology, Nanjing Jiangsu
Received: Nov. 16th, 2023; accepted: Feb. 18th, 2024; published: Feb. 23rd, 2024
Tuberculosis has been a major challenge in the global public health sector, affecting millions of people annually, including tens of thousands of fatalities. Despite the existence of effective treatment methods, timely diagnosis and early intervention remain crucial in preventing the spread of lesions. Surgical intervention has emerged as an effective means of treatment. This paper introduces a minimally invasive surgical robot-based tuberculosis lesion recognition technology, which is built upon the YOLOv2 algorithm. This technology combines robot system design, endoscopy, the K210 visual recognition module, and the YOLOv2 recognition algorithm to enhance the identification accuracy and the handling efficiency for real-time recognition. The paper constructed a diverse training dataset, conducted deep network training using the YOLOv2 algorithm, and evaluated performance metrics, including accuracy, recall, precision, and F1 score. Experimental results demonstrate that this technology offers high accuracy and efficiency, with the potential to enhance tuberculosis detection and treatment.
Keywords:Tuberculosis, YOLOv2, K210, Image Recognition
Copyright © 2024 by author(s) and beplay安卓登录
This work is licensed under the Creative Commons Attribution International License (CC BY 4.0).
http://creativecommons.org/licenses/by/4.0/
肺结核一直是全球公共卫生领域的一大挑战。根据世界卫生组织的统计数据,每年有数百万人受到结核病的影响。近年来,耐多药肺结核的病例有增加趋势 [
如今,具有视觉识别功能的微创手术机器人技术已经在医疗领域中取得了显著的进展。刘龑龙等 [
本文旨在探索将YOLOv2算法引入视觉识别机器人系统,以提高肺结核病灶的识别精度和效率的方法。本文所采用的YOLOv2算法在VOC2007数据集上,保持检测速度为40帧/s的情况下mAP能够达到78.6% [
根据机器人的设计需求,我们将结构分成了三大模块,包括:机械臂操作模块、图像识别模块和单片机模块,见图1。
图1. 微创手术机器人
机械臂操作模块由操作末端部分,电机模块部分以及底部滑台部分组成。主要负责将内窥镜伸入病人体内拍摄、协助医生进行切除操作等。内窥镜很适合在人体内部进行非侵入性的观察、检查和治疗。它由一个细长、灵活的数字传感器组成,可以通过自然腔道(如口腔、喉咙、食道、胃、肠道等)或通过小切口(例如肚脐切口)插入体内。内窥镜可以搭载摄像头、光源和其他传感器,将内部图像传送到显示屏上,以供使用者实时观察。
STM32单片机模块提供了强大的处理能力和计算资源,能够有效处理机器人控制和通信任务。结合K210图像识别模块,STM32单片机可以协调并执行机械臂的运动。STM32单片机能够在低功耗模式下运行,特别是在病灶识别这种需要长时间运行的应用中,低功耗设计可以减少功耗需求,从而提高设备的可用性和可靠性,同时不会影响图像传输的速度。
当图像识别任务开始时,机械臂会驱动电机和底部滑台将携带有内窥镜的操作末端送至正确位置,内窥镜将拍摄到的数据通过信息传输模块实时传送给K210模块。K210模块在完成运算后会将数据发送给上位机,由上位机将数据传输至电脑,电脑在完成信息整合和加工后将结果输出在屏幕上,使用者根据输出的结果控制单片机操作机械臂,见图2。
图2. 微创手术机器人结构图
K210包含RISC-V双核CPU的低功耗高性能的芯片,其核心功能是机器视觉与听觉,包含用于计算卷积人工神经网络的神经网络处理器(KPU),其中内置了卷积、批归一化、激活、池化运算单元等。通过将K210模块与内窥镜系统整合,可以实现对肺结核病灶的高效处理和识别。
K210对于大多数机器学习算法拥有很强的图像处理能力。它可以与YOLOv2算法结合,在嵌入式环境中处理复杂的图像处理任务,在保证低功耗的同时实现病灶检测。另外,K210模块可以轻松集成到嵌入式环境系统中,通过USB与上位机进行数据传输和通信。这有助于实现病灶图像的实时分析和传输。
YOLOv2算法之所以能够在检测物体算法中脱颖而出,是因为它提供了准确的结果、标签和IoU值。该算法在处理小物体方面表现更好 [
YOLOv2相较于其前代算法和其他算法有许多改善。该算法提出了Darknet-19的网络结构。该结构删除了传统网络的最后一个FC层,代之以一个1 × 1的卷积,进一步使用全局平均池化来减少参数,从而明显改善运算速度并防止过拟合。用户可以任意指定锚框的数量,在YOLOv2中将中间特征图和最终特征图结合使用,将前卷积层的高分辨率特征图添加到后卷积层的低分辨率特征图中。高分辨率特征图隐含了小物体上的数据,提高了小物体检测性能。
YOLOv2在最后一个卷积层输出后,在卷积或池化之后,激活函数之前,会对每个数据输出进行标准化,进行批量标准化BN。数据集中的每一张图片会被分成13 × 13的网格。YOLOv2预测每个网格5个锚框 [
b x = σ ( t x ) + c x (1)
b y = σ ( t y ) + c y (2)
b ω = p ω e t ω (3)
b h = p h e t h (4)
Pr ( o b j e c t ) ∗ I o U ( b , o b j e c t ) = σ ( t o ) (5)
上述公式中 c x 与 c y 是所得图像的左上角的横竖坐标。 p ω 与 p h 表示先验框的大小。由于先验框与预测框位置不同,为了提高精度,我们还需要计算两者的坐标误差,但是在训练前期,使预测框学习到的先验框的形状和位置只会在迭代的第1到第12800次之间进行计算。
利用YOLO算法,我们对病灶模型进行了训练。首先,我们收集并整理了大量肺结核病灶图像数据集 [
部分代码设计:
#准备图像
dataset = LoadImages (data_path) # data_path进行检测的图像文件夹路径
for img_path, img, im0s, _ in dataset:
img = torch.from_numpy (img).to (model.device)
#进行推理
pred = model (img) [
pred = non_max_suppression (pred, conf_thres = 0.5, iou_thres = 0.4) [
#处理检测结果
if pred is not None and len (pred):
det = pred [
det [:,:4] = scale_coords (img.shape [2:], det [:, :4], im0s.shape).round () #重新缩放边界框
for * xyxy, conf, cls_conf, cls in det:
label = class_names [int (cls)]
#数据集中的类别名
#在图像上绘制边界框
c1, c2 = (int (xyxy [
本文已经指出了数据集在YOLOv2算法模型中的作用,而在实际训练中,需要构建包含不同尺寸、形状和位置的肺结核病灶图像的训练数据集,并对数据集里的每张图像进行详细标注,其中包括病灶的坐标、类别信息以及其他必要的标识。这一过程包含了锚框的选择,以确保模型能够准确地预测病灶的位置和尺寸。利用构建好的训练数据集,我们对YOLOv2算法进行了深度网络训练。模型通过学习训练数据集中的图像和标签逐渐提高了对肺结核病灶的识别能力。数据集的质量和多样性对模型的训练效果起到了至关重要的作用。
为了评估数据集和模型的质量,衡量病灶识别的精度,本文将用作性能评估的图片分成了不同数量的十组,手动统计了图中的病灶数量,并交由训练完成的模型进行识别。我们对检测结果采用了以下数据用于评估性能:
准确率(Accuracy)与召回率(Recall) [
F1分数(F1 Score):F1分数是精确度和召回率的调和平均,可以综合评估模型性能。
我们将性能评估指标按照每组的实际病灶数量进行排列后生成了如图3所示的性能指标与病灶数量关系。
图3. 性能指标与病灶数量关系
从图中可以看出,识别的准确率平均值能够超过90%,F1分数达到75%。由于先前的研究在肺结核检测中的平均准确率低于80%,我们认为该研究对肺结核检测精度的提升效果显著。另外,随着数据训练量的增加,检测精度能够呈上升趋势。同时K210模块的响应时长基本达到ms级别,满足实时性要求。相较于在该领域先前的一些研究,YOLO算法的引入不仅使检测精度得到明显改善,还对检测速度进行了提升。面对实际医疗环境中复杂多变的情况,本文所展现出的及时性和准确性使已有的手术机器人视觉识别模型更加切合实际使用需求。部分测试结果如图4所示。
图4. 测试结果
本文介绍了一种基于YOLOv2算法的手术机器人肺结核病灶识别技术,旨在提高肺结核病灶实时检测的识别精度和效率。通过将YOLOv2算法与视觉识别机器人系统整合,我们实现了更准确、更快速的病灶识别,为改进肺结核的治疗手段和方式提供了新的途径。本文还详细介绍了机器人系统的方案设计、内窥镜的应用、K210模块的功能以及YOLOv2算法的原理和病灶识别模型的设计。通过性能评估,我们验证了该技术的有效性和实用性。
朱尔汉,郭 语,范哲铭,张新扬,陆新宇,徐 帅,王锋锋. 基于YOLOv2的微创手术机器人肺结核病灶图像识别研究Research on Image Recognition of Tuberculosis Lesions by Minimally Invasive Surgical Robot Based on YOLOv2[J]. 人工智能与机器人研究, 2024, 13(01): 49-55. https://doi.org/10.12677/AIRR.2024.131006
https://doi.org/10.1016/j.compbiomed.2023.107453
https://doi.org/10.1148/radiol.2017162326
https://doi.org/10.1109/ICBAIE56435.2022.9985817
https://doi.org/10.1007/s10015-023-00885-9