Construction and Application of Emergency Industry Ecological Knowledge Graph Based on Emergency Scenario Requirements of Different Subjects
Accident-driven emergency management has led to a lack of dialog and a disjointed governance of the relevant subjects in the emergency industry. In order to strengthen the safety and emergency preparedness of the whole society, we propose an emergency management paradigm based on “scenario-response” by taking the emergency needs of different subjects as the entry point, constructing a three-dimensional emergency scenario of “individual/family-community-society”, and constructing an ecological knowledge mapping of the emergency industry. The knowledge map of the emergency industry is constructed. Through the semantic understanding and knowledge retrieval function of the knowledge map, an intelligent Q&A platform of the emergency industry is built to recommend emergency product manufacturers and emergency product functions under different emergency scenarios, so that individuals, communities and the government can have stronger collaborative capabilities in the process of disaster response. This research method provides theoretical support and practical guidance for the research paradigm of emergency management, emergency scenario demand, and the in-depth integration and coordinated development of industrial subjects, and promotes the development of China’s emergency industry from “rescue after the fact” to “prevention before the fact”.
Knowledge Graph
长期以来在应急管理上,我们处于一个被动的事故推动型状态
首先,本文以安全应急产业相关标准文件为例,按照“个人/家庭–社区–社会”应急场景需求对应急产业主体进行分类。构建应急产业知识图谱,不仅能够直观地呈现出
在应急管理理论层面,董田甜等
在技术层面,姜仁贵等
在应急产业知识图谱的构建中,对于不同类型灾害的研究内容已经比较丰富,不同场景之间的协同与整合研究相对薄弱。因此,本文提出一种基于多主体应急场景需求的应急产业知识图谱的构建方法,旨在建立更加完善的应急产业知识图谱体系,推动我国应急产业的发展从事后救援向事前预防转型。
知识图谱可以分为自顶向下和自底向上两种构建模式,其中自顶向下的方式适用于具备固定知识体系或可定义固定模式数据的特定行业
通过对应急产业知识进行系统性分析,定义三维场景应急产业的核心类型之后,还需要进一步定义类的属性来明确本体的层次结构。本体对象属性主要用于描述类与类之间的关系,定义域和值域均为类。对象属性的确立便于知识图谱进行语义关联和知识发现。数据属性则描述类的固有属性,定义域为类,值域为某一特定的数据类型,具体定义如
对象属性 |
描述 |
示例 |
authorize |
委托代理 |
无锡市公安局——authorize→江苏博智工程咨询有限公司 |
coorganize |
协办 |
视频图像信息智能分析与共享应用技术国家工程实验室——coorganize→中国国际社会公共安全产品博览会 |
host |
主办 |
中国安全防范产品行业协会——host→中国国际社会公共安全产品博览会 |
ratify |
批准 |
中国人民共和国商务部——ratify→中国国际社会公共安全产品博览会 |
support |
支持 |
中国道路交通安全协会——support→中国国际社会公共安全产品博览会 |
participate in |
参与 |
中国联合网络通信有限公司——participate in→中国国际社会公共安全产品博览会 |
supply |
提供 |
3M中国有限公司——supply→防水防护服 |
demand |
需求 |
无锡市公安局——demand→药品安全检测设备 |
cooperate |
合作 |
青岛立安安全科技有限公司——cooperate→重庆信科设计有限公司 |
is inclusive of |
包括 |
预警监测类——is inclusive of→社会安全事件检测预警类 |
is applied in |
应用于 |
手电筒——is applied in→个人家庭场景 |
通过在模式层已搭建的各类概念之间的语义关联,将经过知识抽取等一系列技术整理完成的应急产品实例数据导入到Neo4j图数据库中,最终构建出三维场景应急产业知识图谱,利用Cypher语句实现知识可视化。
知识抽取是构建知识图谱数据层的第一步,主要是指从多源异构的数据源中抽取出实体、关系以及属性等结构化的数据信息,并将其转换成实体关系三元组。针对本研究中的数据来源,对应急产业各主体的实体属性、关系属性和数据属性先进行梳理和抽取。具体而言,对实体信息的抽取是对概念类的准确描述,如对产品名称、产品应用场景等信息的识别和理解;关系属性的抽取,是对实体间的关系进行解读,抽取出实体和实体之间的语义关系,形成知识图谱三元组结构的基本单位,如(中国安全技术防范认证中心,协办,中国国际社会公共安全产品博览会)、(丹东市应急管理局,委托代理,丹东市公共资源交易中心)以及(湖南煤矿安全装备有限公司,供应,JJB10煤矿用激光甲烷检测报警仪)等。本文选用爬虫技术对国家应急管理局官网、中央与各地区政府官网和安全展会网站等网站中的非结构化数据进行抽取清洗。针对文本资源产生的非结构化数据主要通过人工方法来抽取。
知识存储是知识图谱构建的关键环节,根据图数据库管理系统(DB-Engines Ranking of Graph, DBMS)使用排名,Neo4j是最为普及且扩展性强的高性能图数据库软件,用于存储以节点和关系为对象的图结构数据,能够清晰直观地展示出各节点之间的语义关系。因此,本文选择Neo4j图数据库作为构建知识图谱的工具。由于应急产品类别与实例非常多,手动创建每个实体以及每个实体与实体之间的关系需要耗费很多时间。为了提升知识图谱构建的效率和准确性,完成应急产品本体构建后,用Cellfie语言将实例分别添加到各个类中。在映射过程中,将protégé软件中实例对应的URI (Uniform Resource Identifier,统一资源标识符)作为Neo4j属性图节点ID,RDF (Relational Data Format,关系数据格式)实例所属的OWL (Web Ontology Language,网络本体语言)类作为节点标签,并将实例对应的标签属性、数据类型属性作为节点内属性进行表示,属性图节点之间的边映射来自RDF中的对象属性关系,包含rdfs:label属性进行描述,增强可理解性。本文使用Py2neo自动化构建方式进行数据读取、数据转换和数据导入,进行节点、边和属性创建与匹配功能,构建了多维场景应急产业知识图谱,包含了4735个相关节点和5989条关系,
序号 |
节点颜色 |
节点类别 |
1 |
原材料/产品供应商 |
|
2 |
应急产业 |
|
3 |
应急产品需求商 |
|
4 |
场景 |
以Neo4j图数据库中存储的应急产业知识图谱为基础,本文针对不同场景下应急产品的实际需求,提出基于问题模板的智能问答系统构建方法。该系统以问答交互界面的自然语言问句为输入,Flask作为轻量级Web框架,负责整个系统的后端逻辑。Flask接受前端发送的查询请求后,通过问题解析模块将自然语言映射为Neo4j图数据库的Cypher查询语句,在进行图谱信息检索的基础上,由答案生成模块根据检索结果构建自然语言式的答案短文本在问答交互界面中展示。该系统的整体框架如
问题场景 |
问题模板示例 |
个人家庭场景 |
家里日常需要准备哪些应急物资? |
社区场景 |
社区需要配备什么应急产品? |
社会场景 |
有哪些单位可以为社会面提供应急产品? |
社会场景 |
发生地震救援队需要携带什么仪器? |
社会场景 |
发生火灾时可以用哪些应急产品进行救援? |
本文构建的多维层级应急产品知识图谱问答系统目标用户面向整个社会,在问答交互场景中具有较明确的问题类型和较统一的表达方法,可视为限定域的知识图谱间问答。因此,问题解析模块以自然语言问句作为输入,在分词和主题词提取等任务的基础上,通过问题分类理解问题意图,并进行问题模板匹配。本文选择Han LP工具进行问题文本分词工作,将上文所构建的应急产品信息的字典导入Han LP的自定义词典中,使分词更加准确。对用户输入的自然语言问句进行解析,并准确提取其中的主题实体是实现知识问答的前提,其任务本质是面向问句短文本的命名实体识别问题,因此,本文采用BERT-BiLSTM-CRF神经网络模型。本文围绕不同应急场景需要的应急产品及其需求供应等相关常见问题设计问题模板,共计21小类,部分问题模板示例如
知识检索模块是问题解析和Neo4j图数据库反馈结果的信息交互过程,本文使用python将问题解析模块抽取的问题文本与问题主题匹配,通过Cypher查询引擎在知识图谱中检索问题的答案。问题文本到Cypher语句的映射需要问题模板和Cypher查询语句一一对应,
序号 |
问题文本 |
查询语句 |
1 |
发生火灾时我可以用哪些应急产品进行自救? |
MATCH (n:个人家庭场景应急产品:消防装备) RETURN n.uri AS name ORDER BY rand() LIMIT {limit} |
2 |
家庭日常需要准备哪些应急产品? |
MATCH (n:'个人家庭场景应急产品名称') RETURN n.uri AS name ORDER BY rand() LIMIT {limit} |
3 |
如何购买到这些产品? |
MATCH (n1:个人家庭场景应急产品供应商)-[r:supply]->(n2:个人家庭场景应急产品名称 {{uri: '{product}'}}) RETURN n1.uri AS supplier ORDER BY rand() LIMIT {limit} |
答案生成模块通过对Neo4j图数据库中检索到的细粒度信息进行字符串拼接、去重、排序与融合,以自然语言短文本形式返回给用户,保证了问题和答案类型的一致性。问题解析模块对用户输入的自然语言语句进行问题分类、问题模板匹配后,从用户提问中抽取实体与关系生成Cypher语句来返回查询答案。
本文建立的问答系统采用html (Hyper Text Markup Language,超文本标记语言)、CSS (Cascading Style Sheets,层叠样式表)和JavaScript作为前端进行框架设计。通过JavaScript编程语言,以html网页为载体,CSS负责页面布局和样式,实现页面的响应式布局,JavaScript的应用主要为用户交互和DOM操作。
成功登录后,进入网站主页面。如
本文从应急场景需求出发,基于“个人/家庭–社区–社会”应急场景重构应急产业生态知识图谱。该图谱具有一定的实用性和科学性。通过知识图谱的语义理解和知识检索等功能,设计了不同应急场景下应急产业智能问答系统,为社会群体、相关企业和政府机构推荐产品及其供应渠道等信息,加强整个社会的应急认知与安全应急防范能力,提升社会系统韧性的同时,激发安全应急市场经济增长新动力。
本研究对个人、家庭、社区、社会常用场景进行知识图谱的构建存在一定的局限性。未来应急产业知识图谱可以结合地区的实际情况有针对性地进行调整,沿海地区有必要增加防风防雨产品相关应急产业信息,西部地区可以加入抗旱、储水等应急产业信息,适应当地防灾减灾的具体需求,丰富产业的服务功能的同时拓展应用场景的多样性多元性。