Please wait a minute...
吉林化工学院学报, 2024, 41(11): 24-30     https://doi.org/10.16039/j.cnki.cn22-1249.2024.11.005
  本期目录 | 过刊浏览 | 高级检索 |
基于改进YOLOv8的密集多人脸检测

辛鹏,娄铖
(吉林化工学院 信息与控制工程学院,吉林 吉林 132022)
Intensive multi-face detection based on improved YOLOv8
XIN Peng, LOU Cheng
(School of Information and Control Engineering,Jilin Institute of Chemical Technology,Jilin City 132022,China)
下载:  PDF (5124KB) 
输出:  BibTeX | EndNote (RIS)      
摘要 针对密集多人脸检测效率低下、人脸易受遮挡和尺寸小难以检测等问题,提出一种YOLOv8-IFD密集多人脸检测算法。在YOLOv8基础上,首先在主干网络嵌入DCNv2卷积变体模块,增加调制机制并使用权重进行动态调节,增强模型学习能力来提高检测精度;然后在YOLOv8主干网络尾部和颈部网络引入CA注意力机制模块,强化图像特征提取能力,抑制无关特征对精度影响;最后引入基于动态非单调聚焦机制的损失WIoU Loss作为边界框回归损失函数,加速网络收敛并提高模型的检测准确率。利用Wider Face公开数据集进行实验,结果表明改进后的YOLOv8-IFD算法和原算法相比均值平均精度提升2.4%,计算量相对减少。此外,对比其他算法而言,在密集多人脸检测效果上有了明显提高,验证了本改进方法有效性和可应用性。
服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
辛鹏
娄铖
关键词:  人脸检测      目标检测  深度学习      YOLOv8      注意力机制    
Abstract: Aiming at the problems of inefficiency of dense multi-face detection, faces are easy to be occluded and difficult to be detected with small size, a YOLOv8-IFD dense multi-face detection algorithm is proposed. Based on YOLOv8, firstly, the DCNv2 convolutional variant module is embedded in the backbone network to increase the modulation mechanism and use the weights to adjust dynamically, and enhance the model learning ability to improve the detection accuracy; then, the CA attention mechanism module is introduced in the tail and neck networks of the YOLOv8 backbone network to strengthen the ability of image feature extraction, and inhibit the influence of irrelevant features on the accuracy; finally, a loss WIoD algorithm is introduced based on the dynamic non monotonic focusing mechanism based loss WIoU Loss is introduced as the bounding box regression loss function to accelerate network convergence and improve the detection accuracy of the model. Experiments are conducted using the Wider Face public dataset, and the results show that the improved YOLOv8-IFD algorithm improves the mean average accuracy by 2.4% compared with the original algorithm, and the amount of computation is relatively reduced. In addition, compared with other algorithms, there is a significant improvement in the effect of dense multi-face detection, which verifies the effectiveness and applicability of this improved method.
Key words:  face detection          target detection          deep learning          YOLOv8          attention mechanisms
               出版日期:  2024-11-25      发布日期:  2025-04-09      整期出版日期:  2024-11-25
ZTFLH:  TP391.4  
引用本文:    
辛鹏, 娄铖. 基于改进YOLOv8的密集多人脸检测[J]. 吉林化工学院学报, 2024, 41(11): 24-30.
XIN Peng, LOU Cheng. Intensive multi-face detection based on improved YOLOv8. Journal of Jilin Institute of Chemical Technology, 2024, 41(11): 24-30.
链接本文:  
https://xuebao.jlict.edu.cn/CN/10.16039/j.cnki.cn22-1249.2024.11.005  或          https://xuebao.jlict.edu.cn/CN/Y2024/V41/I11/24
[1] 木合亚提•尼亚孜别克, 古力沙吾利·塔里甫, 邱硕. 基于Android的校园导航系统的设计与实现[J]. 吉林化工学院学报, 2024, 41(9): 22-26.
[2] 辛鹏, 李超然, 张勋, 刘培瑞, 袁成磊. Q-learning算法优化的多种LSTM的超短期风电功率预测[J]. 吉林化工学院学报, 2024, 41(9): 1-8.
[3] 孙虎, 金新凯, 陈柳红. 基于工作任务项目化的高职院校“一能双创四驱动”人才培养体系的研究与实践[J]. 吉林化工学院学报, 2024, 41(6): 63-67.
[4] 李钺, 吕雪飞. 基于Fluent双相流管道的腐蚀仿真分析[J]. 吉林化工学院学报, 2024, 41(5): 72-78.
[5] 李鹏涛, 王海波, 李志峰, 王荣林, 文皓, 刘春杰. 融合正余弦策略的变异蝴蝶算法[J]. 吉林化工学院学报, 2024, 41(5): 35-41.
[6] 刘玉艳, 武敬杰, 吕翠. 人类命运共同体视域下高校大学生家国情怀教育[J]. 吉林化工学院学报, 2024, 41(4): 80-84.
[7] 李晓云 . 理工科院校铸牢中华民族共同体意识融入高校思想政治工作的实践路径[J]. 吉林化工学院学报, 2024, 41(4): 72-75.
[8] 王辅民, 周红娟, 冯国亮, 邢雪. 基于特征融合的空压机故障诊断算法研究[J]. 吉林化工学院学报, 2024, 41(3): 37-41.
[9] 徐示奥. 高校思政课对理工类专业课“课程思政”建设的支撑策略分析 [J]. 吉林化工学院学报, 2024, 41(2): 37-41.
[10] 李茗汐. 吉林省农产品区域公用品牌竞争力提升策略探究[J]. 吉林化工学院学报, 2024, 41(2): 91-94.
[11] 邱佩钰, 王仓. 高校生涯发展中心建设的价值意蕴与实施路径探究[J]. 吉林化工学院学报, 2024, 41(12): 39-44.
[12] 平彦兴, 张亿鑫, 杜海潮, 宋佳诺. 快递纸箱拆分机械臂结构设计及轨迹规划[J]. 吉林化工学院学报, 2024, 41(11): 72-78.
[13] 罗向婷, 李卓书, 张涛, 周鸿立. 灵芝多糖微波辅助提取工艺优化及抗氧化活性研究#br#[J]. 吉林化工学院学报, 2024, 41(11): 1-6.
[14] 赵传哲, 王海波, 宋亚迪, 王荣林. 多策略融合的改进哈里斯鹰算法[J]. 吉林化工学院学报, 2024, 41(11): 60-66.
[15] 李杰, 甘树坤. 基于Fluent循环流化床锅炉SNCR系统模拟及优化研究[J]. 吉林化工学院学报, 2024, 41(11): 47-53.
No Suggested Reading articles found!
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed