Many cyber network defense tools rely on the National Vulnerability Database (NVD) to provide timely information on known vulnerabilities that exist within systems on a given network. However, recent studies have indicated that the NVD is not always up to date, with known vulnerabilities being discussed publicly on social media platforms, like Twitter and Reddit, months before they are published to the NVD. To that end, we present a framework for unsupervised classification to filter tweets for relevance to cyber security. We consider and evaluate two unsupervised machine learning techniques for inclusion in our framework, and show that zero-shot classification using a Bidirectional and Auto-Regressive Transformers (BART) model outperforms the other technique with 83.52% accuracy and a F1 score of 83.88, allowing for accurate filtering of tweets without human intervention or labelled data for training. Additionally, we discuss different insights that can be derived from these cyber-relevant tweets, such as trending topics of tweets and the counts of Twitter mentions for Common Vulnerabilities and Exposures (CVEs), that can be used in an alert or report to augment current NVD-based risk assessment tools.


翻译:许多网络防御工具依靠国家脆弱性数据库(NVD)及时提供有关特定网络系统内已知脆弱性的信息,然而,最近的研究表明,NVD并非总能提供最新信息,在将已知脆弱性发布到NVD之前数月,在Twitter和Reddit等社交媒体平台上公开讨论已知脆弱性。为此,我们提出了一个未经监督的分类框架,以过滤与网络安全有关的推文。我们考虑和评估两种未经监督的机器学习技术,以便纳入我们的框架,并表明使用双向和自动反向变换器(BART)模型的零发分比其他技术高83.52%的精确度和83.88分的F1分,从而可以在没有人类干预或贴标签的培训数据的情况下准确筛选推文。此外,我们讨论了从这些与网络有关的推文中获得的不同见解,例如推文的趋势化专题以及通用Vulneribity和曝光量(CVEVES)的Twitter引用的计数,可用于预警或报告,用于增强当前VVD风险工具。

1
下载
关闭预览

相关内容

人工智能顶会WSDM2021优秀论文奖(Best Paper Award Runner-Up)出炉
【干货书】机器学习速查手册,135页pdf
专知会员服务
122+阅读 · 2020年11月20日
商业数据分析,39页ppt
专知会员服务
157+阅读 · 2020年6月2日
【哈佛大学商学院课程Fall 2019】机器学习可解释性
专知会员服务
99+阅读 · 2019年10月9日
计算机 | 国际会议信息5条
Call4Papers
3+阅读 · 2019年7月3日
Hierarchically Structured Meta-learning
CreateAMind
23+阅读 · 2019年5月22日
人工智能 | SCI期刊专刊信息3条
Call4Papers
5+阅读 · 2019年1月10日
无监督元学习表示学习
CreateAMind
26+阅读 · 2019年1月4日
Unsupervised Learning via Meta-Learning
CreateAMind
41+阅读 · 2019年1月3日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
16+阅读 · 2018年12月24日
Disentangled的假设的探讨
CreateAMind
9+阅读 · 2018年12月10日
disentangled-representation-papers
CreateAMind
26+阅读 · 2018年9月12日
【论文】图上的表示学习综述
机器学习研究会
12+阅读 · 2017年9月24日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
Arxiv
0+阅读 · 2021年6月14日
Arxiv
0+阅读 · 2021年6月8日
Arxiv
25+阅读 · 2021年3月20日
Arxiv
3+阅读 · 2018年3月2日
VIP会员
相关VIP内容
相关资讯
计算机 | 国际会议信息5条
Call4Papers
3+阅读 · 2019年7月3日
Hierarchically Structured Meta-learning
CreateAMind
23+阅读 · 2019年5月22日
人工智能 | SCI期刊专刊信息3条
Call4Papers
5+阅读 · 2019年1月10日
无监督元学习表示学习
CreateAMind
26+阅读 · 2019年1月4日
Unsupervised Learning via Meta-Learning
CreateAMind
41+阅读 · 2019年1月3日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
16+阅读 · 2018年12月24日
Disentangled的假设的探讨
CreateAMind
9+阅读 · 2018年12月10日
disentangled-representation-papers
CreateAMind
26+阅读 · 2018年9月12日
【论文】图上的表示学习综述
机器学习研究会
12+阅读 · 2017年9月24日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
Top
微信扫码咨询专知VIP会员