基于机器学习的分布式webshell检测系统

标签:大数据信息业务通信项目

访客:17561  发表于:2017-06-06 09:35:14

fshell 基于机器学习的分布式webshell检测系统

1. 项目简介

该项目从web服务器日志、统计学分析、文件属性分析、静态特征检测以及文件fuzz hash的检测这5个维度对webshell进行了基于支持向量机(SVM)和决策树(DT)的监督学习的机器学习算法,从而分类出支持文件和恶意webshell。 通过在业务web server上安装agent,将采集到的数据定时/实时传输到Server端,经过对采集的元数据加工处理,形成机器学习算法可以处理的特征向量化数据。在机器学习模块将采用SVM和决策树进行机器学习,形成针对webshell的二分类,达到检测效果。

2. 项目整体架构

fshell系统逻辑架构


大数据

fshell 模块功能说明

fs_agent模块:fshell的agent模块,主要实现:(1)对web_log, statistics, file_attribute, danger_func, fuzz_hash元数据的采集,并发送到fs_server;(2)对server下发到agent配置信息进行更新;(3)读取server的文件读取指令,并将文件内容回传给server。

fs_server模块:fshell在Server端的数据通信模块,该模块采用TCP socket 长连接和短连接的方式,监听3个端口。与agent模块实现:元数据data_srv接收入库,配置更新下发,agent上文件读取回传三个功能。

fs_stand_srv模块:fshell的标准化srv模块,主要实现对已经入库的元数据进行特征向量化处理,使机器学习算法能够直接使用。

fs_kernel模块:fshell的机器学习算法的核心模块。该模块采用支持向量机(SVM)和决策树(DT)等算法对特征向量进行监督学习,从而实现webshell与正常文件的分类。

fs_manager模块:fshell的主控制模块。该模块实现:对agent配置管理;用户UI的管理;样本特征库的管理;机器学习检测模块相关配置以及结果的管理;以及其他预警通知、文件传输等的管理。

来源:36大数据

评论(0)

您可以在评论框内@您的好友一起参与讨论!

--> --> -->
<--script type="text/javascript">BAIDU_CLB_fillSlot("927898");