AI Security
本篇用于记录机器学习在安全领域的一些理念和应用技术。
相关术语
- Membership Inference Attack 成员推理攻击
推荐阅读
加国外的其实都没几本书,有精力的可以都看了。目前看过如下几本。
Hands-On Machine Learning for Cybersecurity 《网络安全之机器学习》
-- 今年出了中文版,内容构成挺适合入门的。Machine Learning and Security 机器学习与安全
-- 原则上推荐对英文原版,因为,中文版某页介绍我直接对着原版改了3处翻译问题,后面还不知道有多少问题呢orz- Web安全之机器学习入门 -- 国内出的比较早的,对入门友好,相关系列还有几本。
机器学习与安全
目前机器学习技术是有切实落地到企业安全业务中,所以无论从技术还是业务的方面,都值得好好学习研究。
Some Questions
What is Machine Learning?
Machine Learning is a set of mathematical techniques, implemented on computer systems, that enables a process of information mining, pattern discovery, and drawing inferences from data.
网络安全之机器学习
机器学习架构
典型的机器学习系统及其子流程:
模型引擎
机器学习模型引擎负责管理机器学习框架运行所涉及的端到端过程,包括:数据准备
、特征生成
、模型训练
、模型测试
。 (PS:参考检测模型的构建方法)
性能调整
概率近似正确(PAC)理论:如果算法的广义函数以高概率给出低泛化误差,则认为机器学习系统具有最佳性能。
人工智能安全领域
攻击检测
- 熟悉攻击的过程
- 研究每个过程中的技术
- 思考如何自动化处理
- 手工验证是否可行
检测模型的构建方法
实例1:WebShell检测
实例2:SQL注入检测
检测模型的构建方法
- 常用CyberSecurity DataSet
收集一些用于测试的数据集信息
名称 | URL | 备注 |
---|---|---|
Awesome-Cybersecurity-Datasets | https://github.com/shramos/Awesome-Cybersecurity-Datasets | github |
Kitsune Network Attack Dataset Data Set | https://archive.ics.uci.edu/ml/datasets/Kitsune+Network+Attack+Dataset | |
UNB Dataset | https://www.unb.ca/cic/datasets/index.html | 包含十五种攻击数据集 |
Publicly available PCAP files | https://www.netresec.com/index.ashx?page=PcapFiles | 网络包集合 |
Collection of Pcap files from malware analysis | https://contagiodump.blogspot.com/2013/04/collection-of-pcap-files-from-malware.html | 2015 |
ICS-pcap | https://github.com/automayt/ICS-pcap | 工控pcap包,分类明确 |