AI Security

本篇用于记录机器学习在安全领域的一些理念和应用技术。

相关术语

  • Membership Inference Attack 成员推理攻击

推荐阅读

加国外的其实都没几本书,有精力的可以都看了。目前看过如下几本。

  • Hands-On Machine Learning for Cybersecurity 《网络安全之机器学习》 -- 今年出了中文版,内容构成挺适合入门的。
  • Machine Learning and Security 机器学习与安全 -- 原则上推荐对英文原版,因为,中文版某页介绍我直接对着原版改了3处翻译问题,后面还不知道有多少问题呢orz
  • Web安全之机器学习入门 -- 国内出的比较早的,对入门友好,相关系列还有几本。

机器学习与安全

目前机器学习技术是有切实落地到企业安全业务中,所以无论从技术还是业务的方面,都值得好好学习研究。

Some Questions

What is Machine Learning?

Machine Learning is a set of mathematical techniques, implemented on computer systems, that enables a process of information mining, pattern discovery, and drawing inferences from data.

网络安全之机器学习

机器学习架构

典型的机器学习系统及其子流程:

典型的机器学习系统及其子流程

模型引擎

机器学习模型引擎负责管理机器学习框架运行所涉及的端到端过程,包括:数据准备特征生成模型训练模型测试。 (PS:参考检测模型的构建方法)

性能调整

概率近似正确(PAC)理论:如果算法的广义函数以高概率给出低泛化误差,则认为机器学习系统具有最佳性能。

人工智能安全领域

人工智能背后的技术

攻击检测

  1. 熟悉攻击的过程
  2. 研究每个过程中的技术
  3. 思考如何自动化处理
  4. 手工验证是否可行

检测模型的构建方法

检测模型的构建方法导图

实例1:WebShell检测

实例2:SQL注入检测

检测模型的构建方法

  1. 常用CyberSecurity DataSet

收集一些用于测试的数据集信息

名称 URL 备注
Awesome-Cybersecurity-Datasets https://github.com/shramos/Awesome-Cybersecurity-Datasets github
Kitsune Network Attack Dataset Data Set https://archive.ics.uci.edu/ml/datasets/Kitsune+Network+Attack+Dataset
UNB Dataset https://www.unb.ca/cic/datasets/index.html 包含十五种攻击数据集
Publicly available PCAP files https://www.netresec.com/index.ashx?page=PcapFiles 网络包集合
Collection of Pcap files from malware analysis https://contagiodump.blogspot.com/2013/04/collection-of-pcap-files-from-malware.html 2015
ICS-pcap https://github.com/automayt/ICS-pcap 工控pcap包,分类明确

REF