2017年(1)
分类: 大数据
2017-01-17 15:44:02
从信息安全的角度,大数据安全包含两层含义:一是大数据本身的安全问题,即如何保障大数据存储、处理、传输等过程中的安全保护;二是指利用大数据提升安全防护的能力,即利用规模巨大、格式众多,又相互关联的安全事件数据,进行关联分析,发现网络攻击,及时进行安全防御。
一、大数据本身的安全问题
大数据由于数据量巨大,在存储和处理的时候必然要采用分布式存储、分布式计算的架构,这就带来了访问控制、数据加密、隐私保护等一系列的安全问题。
1)分布式计算框架下的安全问题
对大数据进行分析处理,自然需要分布式计算框架,如MapReduce。通常将数据分成许多块,针对每个块先做map处理,得到一系列的key-value对,然后再reduce聚类同一个key值,得到结果。由于最终计算结果的正确性依赖于map运算的正确与否,如果存在恶意map,将导致最终结果的错误。
2)非关系型数据库的安全问题
非关系型数据库是大数据处理非结构化数据的基础技术,但非关系型数据库在设计之处并没有设置安全功能模块,只是将安全功能作为一个中间件来实现,因此访问控制机制和数据加密机制都亟待解决。
3)大数据的隐私保护
由于个人隐私信息分散在大数据中,不能清楚的了解隐私信息的存储位置,只有通过大数据挖掘的方法,才有可能获得这些隐私信息。如何抵抗利用大数据的隐私挖掘,又是一个急需解决的问题。
二、利用大数据解决安全问题
随着网络攻击越来越复杂,及时发现攻击行为的难度也逐渐上升,传统的检测方法难以发现像APT攻击这样的攻击方式,利用大数据发现攻击的蛛丝马迹是唯一有效的方法。同时,攻击者也在利用大数据提升攻击的能力。这永远是一场没有终点的对抗。
1)利用大数据进行网络攻击
大数据强大的分析能力,也被攻击者所利用,一方面攻击者可以利用大数据收集更多的信息,另一方面将攻击行为隐藏在大数据背景下,降低了被检测发现的可能性。
2)利用大数据检测网络攻击
利用大数据可以分析的数据范围更广,时间跨度更大,能够发现更多的网络攻击事件。特别是针对APT攻击的检测,由于攻击者在发动攻击之前针对攻击对象进行长期、有计划和有组织的相关资料、情报的搜集,并且攻击过程极具隐蔽性,攻击特征难以提出,而且社会工程学的方法大量利用,使得攻击空间存在不确定性,这意味着传统的攻击检测难以发现攻击。而大数据分析将为此提供新的解决方案,可以针对一段时间内的多源海量数据进行关联分析,并且从全流量分析角度检测安全事件,提高发现APT攻击的能力。
3)利用大数据进行身份认证
传统的认证方式,认证凭证较为明确,如口令、USB Key、生物特征等,但攻击者总能找到方法来获取用户的认证凭证,从而假冒合法用户。而利用大数据进行身份认证,认证凭证模糊,攻击者难以模仿,很难通过身份认证。具体来说,系统收集用户行为和设备行为数据,对这些数据进行分析,获得用户或设备的行为特征,进而确定其身份。
4)利用大数据检测数据内容
典型的如垃圾邮件检测、网络舆情监控等,利用大数据的分析能力提升检测的效率和准确度。
5)利用大数据提升安全管理
核心问题是如何收集、存储、管理、分析、展示与安全相关的大数据,提升整体安全管理的能力。