经济代写|博弈论代写Game Theory代考|Smart Internet Probing: Scanning Using Adaptive Machine Learning

Doug I. Jones

Doug I. Jones

Lorem ipsum dolor sit amet, cons the all tetur adiscing elit

如果你也在 怎样代写博弈论Game Theory这个学科遇到相关的难题,请随时右上角联系我们的24/7代写客服。


couryes-lab™ 为您的留学生涯保驾护航 在代写博弈论Game Theory方面已经树立了自己的口碑, 保证靠谱, 高质且原创的统计Statistics代写服务。我们的专家在代写博弈论Game Theory代写方面经验极为丰富,各种代写博弈论Game Theory相关的作业也就用不着说。

我们提供的博弈论Game Theory及其相关学科的代写,服务范围广, 其中包括但不限于:

  • Statistical Inference 统计推断
  • Statistical Computing 统计计算
  • Advanced Probability Theory 高等概率论
  • Advanced Mathematical Statistics 高等数理统计学
  • (Generalized) Linear Models 广义线性模型
  • Statistical Machine Learning 统计机器学习
  • Longitudinal Data Analysis 纵向数据分析
  • Foundations of Data Science 数据科学基础

经济代写|博弈论代写Game Theory代考|Smart Internet Probing: Scanning Using Adaptive Machine Learning

Network scanning is a widely studied topic, ranging from partial scans of the Internet (Fan and Heidemann 2010; Murdock et al. 2017), to global scans of the IPv4 address space (Leonard and Loguinov 2010; Durumeric et al. 2013, 2015). This has led to the development of network scanning tools such as ZMap (Durumeric et al. 2013) and NMap (Lyon 2009), which have provided researchers with large amounts of information on arbitrary Internet hosts. Data resulting from network scans have been used in a wide range of security studies, e.g., to probe and characterize machines utilized in the Mirai botnet (Antonakakis et al. 2017), to gauge the security posture of networks for cyber-risk forecasting (Liu et al. 2015), and to study hosts susceptible to the Heartbleed vulnerability (Durumeric et al. 2014). Internet scanning is a crucial tool for giving visibility into the security of Internet-connected entities, as it can measure the attack surface of networks by revealing (potentially misconfigured/vulnerable) networked devices accessible on the public Internet. Additionally, network scanning has been used in many Internet measurement studies, including studies for examining trends and adoption rates of different technologies (Felt et al. 2017; Kotzias et al. 2018; Kumar et al. 2018), to detect discoverable hosts and to categorize them (e.g., IoT devices) (Bano et al. 2018; DeMarinis et al. 2018; Feng et al. 2018; Scheitle et al. 2018), and to map network topologies (Shavitt and Shir 2005; Claffy et al. 2009; Beverly et al. 2018).

However, the current approach to Internet scanning involves exhaustively sending probes to every scanned IP address (possibly the entire IPv4 address space), regardless of whether the target host is reachable on the public Internet. Therefore, network scans strain the targeted networks/hosts, as they can produce large amounts of traffic, especially when multiple ports of a host are being probed. In addition, global scanning of the IPv6 address space is not feasible using such exhaustive methods, forcing researchers to come up with techniques for producing scan targets, in order to obtain a representative subset of publicly discoverable hosts for characterizing and studying IPv6 networks (Murdock et al. 2017; Gasser et al. 2018).

Note that a large majority of probes sent during a scan will go unanswered, since most IP addresses are inactive, meaning that they are not running any Internet-facing service, or do not respond to outside probes. This gets more pronounced as multiple ports are scanned, since a single active IP address may only have a few number of active/open ports, i.e., ports that respond to probes. In fact, the Censys database (Durumeric et al. 2015) which contains global scans of IPv4 address space across 37 different port contains roughly 161 million records in its snapshots on $1 / 1 / 2019$, meaning that $\sim 94.3 \%$ of the announced Border Gateway Protocol (BGP) prefixes ( $\sim 170 / 8$ blocks, or $\sim 2.8$ billion addresses) are inactive, or do not respond to requests on any of the scanned ports. For active IP addresses, the corresponding hosts are only responding to requests for 1.8 ports on average.

经济代写|博弈论代写Game Theory代考|Data Curation

To evaluate our framework, we generate information for randomly drawn IP addresses in the following manner. We first select 17.5 million random IP address from announced Border Gateway Protocol (BGP) prefixes corresponding to each snapshot date, captured by CAIDA from Routeviews data (CAIDA 2021), about 170/8 blocks or $\sim 2.8$ billion addresses. This is done to remove reserved and private IP addresses, as well as address spaces not announced on BGP. For each selected IP address, we then check whether it has a corresponding record in a Censys snapshot. For IP addresses that do have a Censys record (i.e., an active IP), we append the Censys record to our curated data set. For addresses that do not have a corresponding Censys record (i.e., an inactive IP), we query its geolocation and autonomous system information from Censys using the following technique. We first find the two closest active IPs in Censys to the inactive IP, i.e., one with a smaller IP address, and one with a larger IP address. We then find the smallest Classless Inter-Domain Routing (CIDR) blocks that contain the inactive IP address and each of its active neighbors. If the corresponding CIDR block for one neighbor is smaller than the other, we then decide that the inactive IP belongs to the same network as that neighbor, and use the AS and geolocation properties of the corresponding neighbor for the inactive IP. If all three addresses are contained within the same CIDR block, then we copy AS and geolocation information from the closest neighbor, or the one with a larger IP address if both neighbors have the same distance to the inactive IP address.

The above procedure yields about one (16.5) million randomly drawn active (inactive) IP addresses from each snapshot (note that only $\sim 5.7 \%$ of all IP addresses are active according to Censys probes). We further sub-select one million addresses from the inactive IPs to obtain a more balanced data set, resulting in a curated data set containing roughly one million active and one million inactive IPs for each snapshot. We use these data sets for training and evaluating the performance of our scanning techniques.


经济代写|博弈论代写Game Theory代考|Smart Internet Probing: Scanning Using Adaptive Machine Learning

网络扫描是一个广泛研究的主题,范围从互联网的部分扫描(Fan 和 Heidemann 2010;Murdock 等人 2017)到 IPv4 地址空间的全局扫描(Leonard 和 Loguinov 2010;Durumeric 等人 2013、2015) . 这导致了 ZMap (Durumeric et al. 2013) 和 NMap (Lyon 2009) 等网络扫描工具的开发,它们为研究人员提供了关于任意 Internet 主机的大量信息。网络扫描产生的数据已用于广泛的安全研究,例如,探测和表征 Mirai 僵尸网络中使用的机器(Antonakakis 等人,2017 年),衡量网络安全状况以进行网络风险预测(Liu et al. 2015),并研究易受 Heartbleed 漏洞影响的宿主 (Durumeric et al. 2014)。互联网扫描是让互联网连接实体的安全可见性的重要工具,因为它可以通过揭示可在公共互联网上访问的(可能配置错误/易受攻击的)网络设备来衡量网络的攻击面。此外,网络扫描已用于许多互联网测量研究,包括检查不同技术的趋势和采用率的研究(Felt 等人 2017 年;Kotzias 等人 2018 年;Kumar 等人 2018 年),以检测可发现的主机并对它们进行分类(例如物联网设备)(Bano 等人,2018 年;DeMarinis 等人,2018 年;Feng 等人,2018 年;Scheitle 等人,2018 年),并绘制网络拓扑图(Shavitt 和 Shir,2005 年;Claffy 等人,2009 年) ;Beverly 等人,2018 年)。因为它可以通过揭示可在公共互联网上访问的(可能配置错误/易受攻击的)网络设备来衡量网络的攻击面。此外,网络扫描已用于许多互联网测量研究,包括检查不同技术的趋势和采用率的研究(Felt 等人 2017 年;Kotzias 等人 2018 年;Kumar 等人 2018 年),以检测可发现的主机并对它们进行分类(例如物联网设备)(Bano 等人,2018 年;DeMarinis 等人,2018 年;Feng 等人,2018 年;Scheitle 等人,2018 年),并绘制网络拓扑图(Shavitt 和 Shir,2005 年;Claffy 等人,2009 年) ;Beverly 等人,2018 年)。因为它可以通过揭示可在公共互联网上访问的(可能配置错误/易受攻击的)网络设备来衡量网络的攻击面。此外,网络扫描已用于许多互联网测量研究,包括检查不同技术的趋势和采用率的研究(Felt 等人 2017 年;Kotzias 等人 2018 年;Kumar 等人 2018 年),以检测可发现的主机并对它们进行分类(例如物联网设备)(Bano 等人,2018 年;DeMarinis 等人,2018 年;Feng 等人,2018 年;Scheitle 等人,2018 年),并绘制网络拓扑图(Shavitt 和 Shir,2005 年;Claffy 等人,2009 年) ;Beverly 等人,2018 年)。

然而,当前的 Internet 扫描方法涉及向每个扫描的 IP 地址(可能是整个 IPv4 地址空间)发送详尽的探测,而不管目标主机是否可以在公共 Internet 上访问。因此,网络扫描会对目标网络/主机造成压力,因为它们会产生大量流量,尤其是在探测主机的多个端口时。此外,使用这种详尽的方法对 IPv6 地址空间进行全局扫描是不可行的,这迫使研究人员想出产生扫描目标的技术,以获得具有代表性的可公开发现的主机子集,用于表征和研究 IPv6 网络(Murdock 等人) al. 2017 年;Gasser 等人 2018 年)。

请注意,在扫描期间发送的大部分探测都不会得到答复,因为大多数 IP 地址都处于非活动状态,这意味着它们没有运行任何面向 Internet 的服务,或者不响应外部探测。这在扫描多个端口时变得更加明显,因为单个活动 IP 地址可能只有少数活动/开放端口,即响应探测的端口。事实上,包含 37 个不同端口的 IPv4 地址空间全局扫描的 Censys 数据库(Durumeric 等人,2015 年)在其快照中包含大约 1.61 亿条记录1/1/2019, 意思是∼94.3%已公布的边界网关协议 (BGP) 前缀(∼170/8块,或∼2.8十亿个地址)处于非活动状态,或者不响应任何扫描端口上的请求。对于活跃的 IP 地址,相应的主机平均只响应 1.8 个端口的请求。

经济代写|博弈论代写Game Theory代考|Data Curation

为了评估我们的框架,我们通过以下方式为随机抽取的 IP 地址生成信息。我们首先从 CAIDA 从 Routeviews 数据(CAIDA 2021)中捕获的每个快照日期对应的已公布边界网关协议(BGP)前缀中选择 1750 万个随机 IP 地址,大约 170/8 块或∼2.8十亿个地址。这样做是为了删除保留和私有 IP 地址,以及 BGP 上未公布的地址空间。对于每个选定的 IP 地址,我们然后检查它是否在 Censys 快照中有相应的记录。对于确实有 Censys 记录的 IP 地址(即活动 IP),我们将 Censys 记录附加到我们的精选数据集中。对于没有相应 Censys 记录的地址(即非活动 IP),我们使用以下技术从 Censys 查询其地理位置和自治系统信息。我们首先在 Censys 中找到与非活动 IP 最接近的两个活动 IP,即一个 IP 地址较小的 IP 地址和一个 IP 地址较大的 IP 地址。然后,我们找到包含非活动 IP 地址及其每个活动邻居的最小无类域间路由 (CIDR) 块。如果一个邻居的相应 CIDR 块小于另一个,则我们确定非活动 IP 与该邻居属于同一网络,并使用非活动 IP 对应邻居的 AS 和地理定位属性。如果所有三个地址都包含在同一个 CIDR 块中,那么我们从最近的邻居复制 AS 和地理位置信息,或者如果两个邻居到非活动 IP 地址的距离相同,则复制 IP 地址较大的那个。

上述过程从每个快照中产生大约一 (16.5) 万个随机抽取的活动(非活动)IP 地址(请注意,只有∼5.7%根据 Censys 的调查,所有 IP 地址中的 50% 处于活动状态)。我们进一步从非活动 IP 中选择一百万个地址以获得更平衡的数据集,从而为每个快照生成一个包含大约一百万个活动 IP 和一百万个非活动 IP 的精选数据集。我们使用这些数据集来训练和评估我们的扫描技术的性能。

统计代写请认准statistics-lab™. statistics-lab™为您的留学生涯保驾护航。







术语 广义线性模型(GLM)通常是指给定连续和/或分类预测因素的连续响应变量的常规线性回归模型。它包括多元线性回归,以及方差分析和方差分析(仅含固定效应)。



有限元是一种通用的数值方法,用于解决两个或三个空间变量的偏微分方程(即一些边界值问题)。为了解决一个问题,有限元将一个大系统细分为更小、更简单的部分,称为有限元。这是通过在空间维度上的特定空间离散化来实现的,它是通过构建对象的网格来实现的:用于求解的数值域,它有有限数量的点。边界值问题的有限元方法表述最终导致一个代数方程组。该方法在域上对未知函数进行逼近。[1] 然后将模拟这些有限元的简单方程组合成一个更大的方程系统,以模拟整个问题。然后,有限元通过变化微积分使相关的误差函数最小化来逼近一个解决方案。





随机过程,是依赖于参数的一组随机变量的全体,参数通常是时间。 随机变量是随机现象的数量表现,其时间序列是一组按照时间发生先后顺序进行排列的数据点序列。通常一组时间序列的时间间隔为一恒定值(如1秒,5分钟,12小时,7天,1年),因此时间序列可以作为离散时间数据进行分析处理。研究时间序列数据的意义在于现实中,往往需要研究某个事物其随时间发展变化的规律。这就需要通过研究该事物过去发展的历史记录,以得到其自身发展的规律。


多元回归分析渐进(Multiple Regression Analysis Asymptotics)属于计量经济学领域,主要是一种数学上的统计分析方法,可以分析复杂情况下各影响因素的数学关系,在自然科学、社会和经济学等多个领域内应用广泛。


MATLAB 是一种用于技术计算的高性能语言。它将计算、可视化和编程集成在一个易于使用的环境中,其中问题和解决方案以熟悉的数学符号表示。典型用途包括:数学和计算算法开发建模、仿真和原型制作数据分析、探索和可视化科学和工程图形应用程序开发,包括图形用户界面构建MATLAB 是一个交互式系统,其基本数据元素是一个不需要维度的数组。这使您可以解决许多技术计算问题,尤其是那些具有矩阵和向量公式的问题,而只需用 C 或 Fortran 等标量非交互式语言编写程序所需的时间的一小部分。MATLAB 名称代表矩阵实验室。MATLAB 最初的编写目的是提供对由 LINPACK 和 EISPACK 项目开发的矩阵软件的轻松访问,这两个项目共同代表了矩阵计算软件的最新技术。MATLAB 经过多年的发展,得到了许多用户的投入。在大学环境中,它是数学、工程和科学入门和高级课程的标准教学工具。在工业领域,MATLAB 是高效研究、开发和分析的首选工具。MATLAB 具有一系列称为工具箱的特定于应用程序的解决方案。对于大多数 MATLAB 用户来说非常重要,工具箱允许您学习应用专业技术。工具箱是 MATLAB 函数(M 文件)的综合集合,可扩展 MATLAB 环境以解决特定类别的问题。可用工具箱的领域包括信号处理、控制系统、神经网络、模糊逻辑、小波、仿真等。


hurry up

15% OFF

On All Tickets

Don’t hesitate and buy tickets today – All tickets are at a special price until 15.08.2021. Hope to see you there :)