工厂质量检测AI Agent搭建过程



解决传统人工质检效率低、易疲劳、标准不一,以及微小缺陷难发现导致的漏检、误检问题。
作为一个自主的“质检专家”,能实时分析产品图像/视频流,自动识别缺陷类型、分类严重等级,并追溯根因、提供工艺调整建议。


数据采集与集成:从生产线摄像头、3D扫描仪、光谱仪等采集图像、点云、光谱数据。同时集成MES(生产执行系统)数据(如设备参数、工艺配方、批次号)和SPC(统计过程控制)数据。
数据预处理与标注:对图像数据进行增强(旋转、裁剪、亮度调整)、归一化。对缺陷区域进行精准像素级或 bounding box 标注,并定义缺陷类型与等级(如划痕、凹陷、污点;Critical, Major, Minor)。这是模型训练的基石。
特征存储:处理后的图像特征和对应的生产参数数据关联存储,用于后续的根因分析。
采用“计算机视觉行业模型 + 通用大模型”的混合架构。
行业视觉模型(核心检测引擎):
选型:选用在工业缺陷检测领域表现优异的计算机视觉模型。对于明显缺陷,可采用高效的YOLO或Faster R-CNN;对于复杂的、微弱的缺陷,常选用Unet或其变体进行像素级分割。这些是专门为图像识别任务设计的“行业模型”。
训练/微调:使用经过精密标注的数据集,对上述模型进行监督学习训练,使其能精准定位和分类缺陷。
通用大模型(分析与决策引擎):
选型:选用具备多模态和强大推理能力的大型语言模型(LLM),如GPT-4V(Vision)或类似模型。其核心作用不是直接“看”图像,而是“理解”和“推理”。
作用:解读视觉模型的输出结果,关联生产参数等上下文信息,进行根因分析,生成质量报告和决策建议。
为LLM注入工厂特有的质量知识,使其建议具备针对性和可操作性。
知识库构建:将产品质量标准手册(AQQL)、缺陷图谱(Goldensample)、历史重大质量事故报告、工艺参数调整指南、专家经验总结等文档进行向量化,存入向量数据库。
检索流程:当视觉模型检测到缺陷时,AI Agent将缺陷类型、批次号、设备ID等作为查询(Query),从向量数据库中检索出相关的质量标准、历史相似案例及处理方案。
价值:确保LLM提出的调整建议严格符合内部标准,并基于历史成功经验,避免凭空生成
设计高效的提示(Prompt)来引导LLM执行高质量的分析任务。
Prompt架构:为LLM设计一个结构化的提示模板,通常包括:
角色定义:你是一名资深的质量工程师,擅长分析[特定产品,如PCB板]的缺陷根本原因。
任务指令:请根据视觉系统提供的缺陷信息、当前生产参数以及检索到的相关知识,生成一份质量分析报告。
上下文注入:动态插入视觉模型的检测结果(缺陷位置、类型、置信度)、实时生产参数(温度、速度、压力)、从RAG模块检索到的相关标准和处理方案。
输出格式要求:
报告需包含:
缺陷描述与等级判定;
可能的生产环节根因分析(如设备X参数Y异常);
immediate action(如隔离批次);
纠正与预防措施(如调整参数Z)。
迭代优化:通过真实缺陷案例不断测试和优化Prompt,确保LLM的输出准确、可靠且可直接用于生产决策。


1、触发

生产线上产品经过视觉检测站,行业视觉模型实时分析图像并识别缺陷。
2、检索

若发现缺陷,Agent自动调用RAG模块,检索与该缺陷类型、产品型号相关的质量知识和历史案例。
3、分析与生成

将视觉结果、实时工艺参数、检索到的知识作为Context,通过预设的Prompt提交给LLM进行推理。
4、行动

LLM生成的结构化报告自动推送至MES系统、触发设备停机或参数调整,并通知质量工程师进行确认。
5、反馈闭环

质检员和工程师的最终确认结果反馈回系统,用于持续优化视觉模型和RAG知识库。
总
结

该质量检测AI Agent的核心架构是:数据治理提供高质量的多模态训练数据,行业视觉模型作为眼睛负责精准识别,RAG提供工厂内部的质量知识体系,Context Engineering引导大模型进行根因分析与决策生成,最终将所有模块集成到一个自动化的闭环质量管控流程中。


END
Leantek.cn
精易会

Leantek.cn
精易会
微信号丨精易会智造
官网丨leantek.cn
电话丨400-690-8780
邮箱丨 info@leantek.cn
地址丨江苏省苏州工业园区裕新路168号脉山龙大厦1号楼402室












