背景
数据流转是指数据在应用系统内的不同主体、或者不同应用系统间以及不同安全域之间进行数据交换的行为,包括数据定密、密级变更审批、数据外发(刻录、打印、邮件)、SM网与非密网、SM网与工控网之间的数据交换以及SM网内的跨应用系统或者跨域的数据交换等。
数据流转过程中的安全属性面临多种变化,
一是安全域的变化,数据在多个业务和应用场景下的流动交互,必然会出现跨越不同安全域的使用现象。
二是数据载体的变化,流转过程加速了数据的大量汇聚、加工、使用,必然导致数据在不同载体中的使用和留存。
三是数据主体的变化,数据交互过程的主体角色变化,导致数据权责不明。以上安全属性的变化导致组织难以清晰的梳理数据与访问主体、传输链路、承载环境、安全策略等的关系,进而在数据安全建设时只能以“离散”的补丁方式解决风险问题,而导致全局化、体系化联防联控沦为纸上谈兵。如何开展数据流转过程中的安全防护工作,已成为数据价值释放的重大挑战。
由于数据流转过程关系到数据安全属性和使用范围的变化,所以一旦数据流转过程产生安全疏漏,极易引发数据安全风险,造成涉密信息泄漏等重大安全事故。
概述
针对涉密单位“降密输出”、“输出审批流于形式”、“人工查验工作量大、责任心差”以及“恶意输出行为难发现”等现象,结合多年保密行业的相关经验,公司研发了数据流转风险管控系统,缓解了相关问题,大大提高了查验效率。该系统能够与现有的打印刻录审计系统、邮件系统、OA系统等数据流转审批系统进行整合,为业务系统提供开箱即用的内容检查和密级识别能力。在一个统一系统内查验和管理单位内部通过各种渠道所有输出的文件、光盘、邮件等,统一配置关键词、策略、统一审计,自动查验所有输出或外发的文件,具备大数据分析和学习能力,可逐步建立单位内部领域词库和涉密模型,形成自动化分析能力,杜绝降密输出隐患。
思路
要解决数据流转过程中的安全隐患,需要从全局出发,以整体统一的理念看待和解决数据流转问题,不能以“打补丁”的方式去堵疏漏。
1. 看清数据流转关系
基于数据流转视角,识别具体业务场景,将数据、动作和特定人员或组织进行关联,有针对性的设计安全防护措施。仅仅基于流量的数据安全产品无法获取到业务相关的流转信息,这要求流转监测系统必须和业务系统对接,获取详细的数据流转信息。
2. 识别发现数据安全风险
需要一个统一的检查引擎和判定规则,它能适用于各个不同的业务系统和业务场景,而不是每个系统和场景各自独立为战。它能够统一识别定密流程、打印、刻录、跨域交换等各种场景下的安全风险,应用统一的安全规则,并统一报警。
检查引擎应该足够强大和智能,从而支撑不同场景下的安全风险识别,并做到足够精准,减少误报。仅仅基于关键词的风险文件识别是远远不够的。
检查过程应该足够快速高效,不能影响正常的业务流程。要解决传统的数据识别引擎的性能瓶颈,要从两方面入手:一是解决图片OCR过程中的性能问题,二是面向多业务系统的数据识别应当支持集群化部署,可以简单的增加服务器实现处理能力的线性化提高。
需要根据数据流转关系对数据使用场景进行精准刻画,结合泄露风险监测、用户行为分析等相关技术手段,将风险识别全面深入到数据处理活动内容中。比如,数据内部流转和数据外发所对应的规则严苛程度应该是不同的,重要涉密人员和普通涉密人员的规则也可以是不同的。
3. 实现常态化安全运营
通过常态化的数据流转专项审计工作,实现数据流转安全的常态化运营。,包括审查业务数据流转的各个环节是否存在安全隐患、个人信息及重要数据的保护措施是否满足合规要求、相关安全策略是否定期优化等内容,以实现持续的数据安全保障运营。
系统应当支持统一查看单位内部所有的数据流转行为,按人、部门、业务系统等汇总数据流转风险,重新审计数据流转风险是否真的存在风险或是否误报等。
功能特色
1. 作为一个统一的数据流转监测平台,提供统一的开放API接口,能够接入打印、刻录、邮件、OA、数据交换等各种不同的业务系统,集中管理所有数据流转过程。
2. 强大的数据识别引擎,支持关键词、正则表达式、数据标签(红头文件、疑似涉密、密标文件等)、数据夹带、数据摘抄等多种数据识别方式。
3. 强大的数据识别扩展能力,能够融合业务信息(比如流转过程、用户密级等)进行规则判定,形成精细化的数据识别规则。
4. 数据流转风险阻断能力。当数据流转监测系统发现违规的数据流转过程后,可以进行阻断,防止数据泄漏。
5. 详细的数据审计能力,可以按用户、部门、业务系统等审计所有流转过程,并定期形成审计报告。
6. 支持GPU硬件加速的图片识别,较传统OCR方案性能提高一个数量级,单机识别性能可达250张/分钟,彻底解决图片识别的性能问题。
7. 支持集群化部署,可以线性化提高处理能力,单集群可支持高达64台服务器。
技术方案
系统架构

部署方式

数据流转
