热门毕业论文范文
论文写作技巧
热门职称发表论文
热点期刊发表资源
您所在的位置: 佳作论文网 > 论文资源 > 毕业论文 > 电子信息毕业论文 > 信息安全论文 > >基于领域本体的信息安全漏洞知识库构建

基于领域本体的信息安全漏洞知识库构建

作者:admin  来源:佳作论文网 日期:2020-10-15 16:47 人气:
摘要:研究本体在构建信息安全漏洞专业领域知识库中的应用.分析和确立信息安全漏洞本体知识库的分类体系,定义子类的对象属性和数据属性,给出漏洞实例的表示方法,并利用Protégé,Jena和Java平台实现信息安全漏洞知识库的系统原型.与传统检索相比,基于本体的语义检索方法在保持精确率的同时,能明显提高召回率.利用本体构建信息安全漏洞知识库更有利于挖掘漏洞知识元素的内在联系,为用户提供更为快捷有效的知识服务. 
关键词:本体;信息安全;漏洞;知识库;语义;知识服务;
     信息安全漏洞是网络攻击的入口,是网络攻击者关注的焦点.要做好网络安全防范必须堵住安全漏洞.信息安全漏洞的知识日渐成为网络安全亟需关注的专门领域.截至2020年2月,国家信息安全漏洞共享平台(CNVD)官网上显示的信息安全漏洞达到13.3万余条,国家信息安全漏洞库(CNNVD)官网上则为13.8万余条.漏洞管理机构(如CNVD,CNNVD)在漏洞发现者、涉事单位之间架起了沟通的桥梁,收集的漏洞信息越来越多.对于通用型安全漏洞(如WinRAR压缩软件的漏洞),漏洞管理机构会联系厂商(如WinRAR压缩软件的厂商)进行漏洞消减的处置,然后才在官网上公布.广大的信息系统用户平时往往不会关注漏洞管理机构的网站,涉事厂商也不一定能够及时把漏洞信息传达给每一个用户.由于缺乏信息安全漏洞的知识,信息系统用户有可能不断地积累安全漏洞,面临的安全风险越来越高.
     国内现有的信息安全漏洞库主要是为漏洞发现者、涉事单位提供服务,其目的是进行漏洞消减.对于广大的信息系统用户,他们关心的则是如何快速从数量庞大的漏洞条目中找到与自身相关的漏洞信息.尽管信息安全漏洞库提供搜索功能,但大多都基于布尔量的检索,查全率不高.一般的信息系统用户甚至还不知道该设置什么样的关键字进行检索.简而言之,欠缺知识服务能力是现有信息安全漏洞库的主要不足.
1 相关研究
     信息安全漏洞库是在网络攻防的实践中建立和发展起来的.高寅生[1]、张美超等人[2]在国内较早研究了漏洞库的设计和测试技术;王新喆等人[3]研究了国外CVE漏洞库生存性量化分析数据库和量化算法的设计;张玉清等人[4]研究了国家安全漏洞库的设计与实现,该漏洞库后来正式命名为国家信息安全漏洞库(CNNVD),与国家信息安全漏洞共享平台(CNVD)一道成为国内主要的官方漏洞管理机构.随着全社会对信息安全漏洞日渐重视,诸如漏洞盒子、补天等漏洞平台方兴未艾,但各个漏洞库都是自行设计、各自运转的;温涛等人[5]在研究多个漏洞库设计方式的基础上,提出UVDA自动化融合异构安全漏洞库框架,旨在解决多个漏洞库来源的漏洞信息重叠冗余的问题.
国内信息安全漏洞库的有关研究,大多是在借鉴国外CVE漏洞库的基础上进行本土化.从功能上看,漏洞库主要用于理顺漏洞发现者、涉事单位和漏洞管理机构的关系,在社会层面促进漏洞发现、漏洞消减.漏洞库在设计之初,就没有把服务一般的信息系统用户放在首位.部分学者通过建立案例库的方式,一定程度上增强了服务一般信息系统用户的功能,如黄膺旭等人[6]提出智慧城市背景下信息安全问题案例库设计;李文雄等人[7]提出网络攻击案例库的模型.但这些研究一方面没有针对信息安全漏洞,另一方面欠缺对知识全貌的展现,容易让用户产生“只见树木,不见森林”的感觉.
     建立信息安全漏洞的知识库,为广大信息系统用户提供漏洞知识服务,可弥补当前信息安全漏洞库的不足.而信息安全漏洞知识库的构建,需要确立信息安全漏洞的分类体系,明确子类间的关系和属性划分,进而对安全漏洞进行统一的描述和表示.基于本体(ontology)的研究方法提供了良好的语义关系、语义推理和知识发现等功能,在知识库构建中得到越来越多的应用.闫洪森等人[8]、丁晟春等人[9]提出了基于本体的知识库设计、知识检索的一般性方法;钱智勇[10]把本体应用到张謇专题知识库;卢明纯[11]把本体应用到法律知识库;巩沐歌等人[12]把本体应用到高血压疾病诊断知识库;许鑫等人[13]把本体应用到烹饪文化知识库;唐明伟等人[14]、徐蓓蓓等人[15]把本体应用到突发事件案例知识库.以上关于本体在专业领域知识库构建中的应用,在提供知识服务方面均取得实质性进步.
国内外也有学者尝试把本体应用到网络安全的研究中,如Tang等人[16]把本体应用到信息系统安全策略的语义描述和验证.目前尚未看到关于本体在信息安全漏洞库的研究,本文从构建信息安全漏洞的知识库入手,结合领域本体对漏洞知识库进行建模和应用,为信息系统用户、网络安全从业人员和网络安全学习者提供更为快捷和有效的信息安全漏洞知识服务.
2 信息安全漏洞本体知识库构建
    知识库包含大量的专业领域知识,并能以智能的方式向用户提供所需的知识服务.知识库不是简单的数据库,也不是简单的资源库.知识库应在数据库、资源库的基础上具备挖掘知识元素内在联系的能力,为用户提供快捷有效的知识服务.
2.1 信息安全漏洞本体知识库框架
     一个信息安全漏洞其背后往往蕴藏着深厚的理论知识和高超的操作技能,信息安全漏洞之间也可能存在千丝万缕的联系.本文把本体应用到信息安全漏洞知识库,希望发挥本体的语义网优势,充分挖掘漏洞知识的内在联系.信息安全漏洞本体知识库由知识采集层、知识处理层和知识应用层3部分组成,如图1所示:
知识采集层用于从多个源头采集信息安全漏洞的专业领域知识.常见的漏洞知识来源包括国外的CVE、国内的CNVD和CNNVD这些知名的漏洞库,另外还有诸如漏洞盒子、漏洞银行等第三方漏洞平台.漏洞库和漏洞平台有提供数据接口的,知识采集层可直接对接;没有数据接口的,知识采集层可通过数据爬虫技术进行漏洞信息的采集.
知识处理层是知识库的关键层次,需要对采集到的漏洞信息进行加工、组织和存储,为上层的知识应用提供支撑.经过本体建模、持久化存储后,形成信息安全漏洞本体知识库.为更好地向用户提供知识服务和学习服务,可同时配备信息安全资源库,资源库里可放置信息安全专业领域的标准、案例、课程等相关资源.
知识应用层是面向用户的服务界面,可向用户提供漏洞知识检索、漏洞情报推荐、漏洞学习地图和学习资源推荐等知识服务和学习服务,促进网络安全从业人员的专业学习和专业成长.
2.2 信息安全漏洞本体建模
    本体是对客观事物的系统性描述,自1991年Neches等人提出本体的定义以来,在学术界获得了诸多的认可和应用.
1)本体应用的一般方法和步骤
    本体的描述语言包括:XML(extensible markup language),RDF (resource description framework),OWL(ontology Wed language)等.其中,OWL是应用最为广泛的本体描述语言之一,本文采用该语言对信息安全漏洞本体进行描述.构建好本体后,可用SPARQL(simple protocol and RDF query language)等查询语言对本体进行分析和查询,以获取用户所需的知识.
本体的构建方法包括:IDEF5、骨架法、TOVE法、Methontology法、七步法等.其中,七步法由斯坦福大学医学院提出,是比较成熟的本体构建方法.在构建本体的过程中,需要遵循明确性、客观性、完整性、一致性、最大单调可扩展性、最小约束等原则.
在参考七步法的基础上,本文采用如下方法构建信息安全漏洞本体:
(1)总结出本体对象的关键概念、术语;
(2)确定分类体系;
(3)定义类的对象属性;
(4)定义类的数据属性;
(5)对本体进行实例化.
2)信息安全漏洞知识库本体表示
(1)确定分类体系
以“信息安全漏洞”作为顶级概念类,再按二级类、三级类逐级向下细分.结合国内外主流漏洞库的分类方法,以及参考我国信息安全等级保护的技术要求,提出信息安全漏洞的初步分类体系,如表1所示:
对于物理安全漏洞,在实践中较少出现,本文不再对其划分三级类.对于Web漏洞、APP漏洞等,在实践中相当常见,有必要进一步细分.如Web漏洞,根据CNVD的统计,近年来每年收集的Web漏洞占比达到17%.国际Web安全组织OWASP(Open Web Application Security Project)分别于2013年、2017年发布了“十大Web安全漏洞”的项目报告.综合这2个版本的分类方式,可对Web漏洞进一步划分四级类,如表2所示:
随着移动互联网的盛行,针对手机应用的攻击频频发生,APP漏洞也逐渐成为信息安全漏洞的“重灾区”.参考CNVD年度报告对APP漏洞的分类方式,可对APP漏洞进一步划分四级类,如表3所示:
(2)定义类的对象属性
确立本体的分类体系后,需要对分类概念赋予对象属性和数据属性.对象属性是指上下级分类概念之间以及同级概念之间的关系.分类体系一确定,下级分类概念相对于上级分类概念默认为suClassbOf(下属分类)的关系.根据对象的特点和解决问题的需要,可赋予分类概念之间更为丰富的对象属性,如表4所示:
在表4中,明确了顶级概念和二级概念之间是父类和子类的关系.如C0对于C1是father_of的关系,即C0是C1的父类;C1对于C0是son_of的关系,即C1是C0的子类.为确立父类和子类的互逆关系,需要同步赋予father_of与son_of之间为inverseOf(互逆)的对象属性.数据安全漏洞与主机安全漏洞、应用安全漏洞是紧密联系的(如Web应用都需要数据库配合),但这种关系又不是“兄弟”关系,这时可赋予它们之间存在一种linked_of(关联)的关系.
定义分类概念的对象属性是本体应用的特色,在知识检索、知识推理中可起到关键性的作用.系统开发人员可使用本体推理机或自行编程,在充分挖掘分类概念属性的基础上检索到更精准的结果,开发出更符合用户需求的功能.
表4中关于数据安全漏洞(C5)的对象属性,可用如下的OWL语言进行描述:
(3)定义类的数据属性
数据属性是描述分类概念的基本手段,是知识库的“细胞”.可对各级各类概念赋予相同的属性,也可为某个分类概念再赋予特定的一些属性.属性可以是字符型的,也可以是数值型的,视实际需要而定.CNVD漏洞库对收录的信息安全漏洞作了XML的描述,并提供了数据接口,可把CNVD关于漏洞的XML描述作为数据属性的模板.考虑到新版信息安全等级保护对应用场景(云计算、移动互联网、物联网、大数据、工业控制等)作出不同的附加要求,本项目中的信息安全资源库能为网络安全从业人员学习漏洞的专业知识提供帮助等因素,可增加“产品应用场景”“漏洞产生原因”“信息安全知识标签”等属性,如表5所示:
(4)对本体进行实例化
建立分类体系、定义好分类概念的对象属性和数据属性后,需要对本体进行实例化,即把实例对号入座挂到相应的分类概念之下.本项目中,需要把收集到的漏洞信息分门别类挂接到相应的分类概念下.譬如对于“某CMS网站前台存在SQL注入漏洞”这一信息,先对照本体中的分类体系,发现符合“信息安全漏洞→应用安全漏洞→Web漏洞→注入”这样的分类路径,于是可把这个漏洞实例挂在“注入”四级分类概念之下.相关的OWL语言描述如下.
3)信息安全漏洞本体知识的推理
    语义推理是本体应用的特色与优势.完成推理功能的工具称为推理机,如本体工具软件Jena就自带推理机.推理机可根据公理、规则、对象属性等自动进行语义推理,从而合理扩展语义搜索的结果.这是语义检索比传统检索获得更高召回率(recall ration)的重要原因.
也可以自行制定推理规则,为用户提供符合需求的搜索结果.下面是2条自定义规则的示例:
规则1.(?a,subClassof,?b),(?b,subClassof,?c)→(?a,subClassof,?c).
解释:a是b的子类,b是c的子类,可推出a是c的子类.
实例:注入是Web漏洞的子类,Web漏洞是应用安全漏洞的子类,可推出注入是应用安全漏洞的子类.
规则2.(?a,linked_of,?b),(?c,subClassof,?b)→(?a,linked_of,?c).
解释:a与b有关,c是b的子类,可推出a与c有关.
实例:数据安全漏洞与应用安全漏洞有关,Web漏洞是应用安全漏洞的子类,可推出数据安全漏洞与Web漏洞有关.
3 信息安全漏洞本体知识库的应用实验
3.1 系统实现
    在开源平台上,借助Protégé,Jena,Fuseki等软件实现了信息安全漏洞本体知识库的原型系统,系统开发技术路线如图3所示:
Fuseki是基于Jena平台提供的SPARQL查询工具,可为熟悉SPARQL语言的用户提供专业的查询服务.对于一般用户,可在Tomcat上提供信息安全漏洞知识库服务的Web接口界面.
Fuseki可将本体建模工具生成的模型持久化存储到TDB(Triple DB)数据库中.与关系型数据库不同,TDB使用基于NOSQL的三元组来存储数据.在TDB数据库中,1条数据由主语(subject,记为S)、谓语(pridicate,记为P)和宾语(object,记为O)组成.以下是2条数据的示例.
 
     其中,第1条数据记录的意义为:father_of为对象属性Object Property的一种类型(type);第2条数据记录的意义为:father_of与son_of为inverse_of的关系.TDB数据库三元组具有简洁明快的特点,开发者在熟悉语义推理和三元组的特性后,更容易开发出满足应用需求的系统功能.
3.2 漏洞知识检索
信息安全漏洞本体知识库可提供漏洞知识检索的概念,它使用语义检索的方法.检索性能有2个基本的指标:召回率(记为RR)和精确率(precision ration,记为PR).设关于一个检索的相关信息数量为t,实际检索到的信息数量为s,正确的信息数量为r,则召回率RR有如下计算公式:
为比较语义检索与传统检索(基于布尔量)的性能差别,本文设计了2个问题进行检索:第1个问题(记为S1)是查询某网络教学平台软件的漏洞信息,搜索的关键词为厂商的名字;第2个问题(记为S2)是查询Struts2的漏洞信息,搜索的关键词就是“Struts2”.从CNVD漏洞库中抽取500条漏洞信息进行实验,以实例的方式分门别类挂在本体的分类概念下.实验结果如表6所示:
    实验结果表明:在精确率方面,语义检索与传统检索的精确率达到100%;在召回率方面,传统检索只有约60%的效率,而语义检索的召回率达到100%.实验表明语义检索在保持精确率的同时,可明显提高召回率.
    本实验中,语义检索召回率的提升是由于使用本体后进行了语义扩展.对于第1个问题,本体模型不仅在漏洞标题属性上检索,还在漏洞描述、影响产品等属性上进行推理,从而多获取了2条相关的漏洞信息.对于第2个问题,本体模型不仅使用了“Struts2”作为关键词检索,还推理出“S2-”、“s2-”等可能使用的关键词,从而多发现了28条相关的漏洞信息.
3.3 其他应用
    信息安全漏洞本体知识库还可提供漏洞情报推送的功能.目前需要用户提供兴趣列表或信息资产列表,系统根据列表信息在本体中进行知识推理和检索,从而为用户提供感兴趣的安全漏洞信息或与自身信息资产相关联的漏洞信息.特别是根据用户信息资产关联分析得到的漏洞信息,对用户信息系统的安全防范可起到有效的指导作用.
由于集成了信息安全资源库,系统还可提供漏洞学习地图、学习资源推荐的功能,帮助网络安全从业人员从根本上认识信息安全漏洞、处置信息安全漏洞,达到“既见树木,又见森林”的效果.
4 结语
    基于本体构建信息安全漏洞知识库,发挥了本体在系统性描述和表达客观事物方面的优势.通过结构化的方式定义信息安全漏洞的分类体系、分类概念的对象属性和数据属性等,并通过合理的语义网推理,可充分挖掘信息安全漏洞知识元素的内在联系,向用户提供更为快捷有效的知识服务功能.
下一步工作是不断对信息安全漏洞本体知识库进行实例化,在应用实践中检验本体模型的科学性和有效性,为广大的信息系统用户提供及时、精准的信息安全漏洞知识服务.
 
本文网址: http://www.7bestpaper.com/xxaqlw/5522.html转摘请注明本文来源:佳作论文网专注论文模板下载及论文服务,以质为根,以信为本!
推荐阅读
  毕业论文范文论文资源期刊发表资源论文模版资源论文写作技巧

佳作论文网http://www.7bestpaper.com/ Copyright 2008-2020

Email:177872916@qq.com 佳作论文网拥有毕业论文范文、职称发表论文、论文格式模版、各行业期刊介绍等几个版块,专业提供专本科、硕士、博士毕业论文范文、职称论文发表范文;各大院校毕业论文格式模板下载,范文内容涵盖广,发表期刊多,18年精心服务,值得信赖。



收缩
  • 电话咨询

  • 13838208225