统计代写|线性回归分析代写linear regression analysis代考|Missing at Random

Doug I. Jones

Doug I. Jones

Lorem ipsum dolor sit amet, cons the all tetur adiscing elit

如果你也在 怎样代写线性回归Linear Regression 这个学科遇到相关的难题,请随时右上角联系我们的24/7代写客服。线性回归Linear Regression在统计学中,是对标量响应和一个或多个解释变量(也称为因变量和自变量)之间的关系进行建模的一种线性方法。一个解释变量的情况被称为简单线性回归;对于一个以上的解释变量,这一过程被称为多元线性回归。这一术语不同于多元线性回归,在多元线性回归中,预测的是多个相关的因变量,而不是一个标量变量。

线性回归Linear Regression在线性回归中,关系是用线性预测函数建模的,其未知的模型参数是根据数据估计的。最常见的是,假设给定解释变量(或预测因子)值的响应的条件平均值是这些值的仿生函数;不太常见的是,使用条件中位数或其他一些量化指标。像所有形式的回归分析一样,线性回归关注的是给定预测因子值的反应的条件概率分布,而不是所有这些变量的联合概率分布,这是多元分析的领域。

couryes-lab™ 为您的留学生涯保驾护航 在代写线性回归分析linear regression analysis方面已经树立了自己的口碑, 保证靠谱, 高质且原创的统计Statistics代写服务。我们的专家在代写线性回归分析linear regression analysis代写方面经验极为丰富,各种代写线性回归分析linear regression analysis相关的作业也就用不着说。

统计代写|线性回归分析代写linear regression analysis代考|Missing at Random

统计代写|线性回归分析代写linear regression analysis代考|Missing at Random

The most common solution to missing data problems is to delete either cases or variables so the resulting data set is complete. Many software packages delete partially missing cases by default, and fit regression models to the remaining, complete, cases. This is a reasonable approach as long as the fraction of cases deleted is small enough, and the cause of values being unobserved is unrelated to the relationships under study. This would include data lost through an accident like dropping a test tube, or making an illegible entry in a logbook. If the reason for not observing values depends on the values that would have been observed, then the analysis of data may require modeling the cause of the failure to observe values. For example, if values of a measurement are unrecorded if the value is less than the minimum detection limit of an instrument, then the value is missing because the value that should have been observed is too small. A simple expedient in this case that is sometimes helpful is to substitute a value less than or equal to the detection limit for the unobserved values. This expedient is not always entirely satisfactory because substituting, or imputing, a fixed value for the unobserved quantity can reduce the variation on the filled-in variable, and yield misleading inferences.

As a second example, suppose we have a clinical trial that enrolls subjects with a particular medical condition, assigns each subject a treatment, and then the subjects are followed for a period of time to observe their response, which may be time until a particular landmark occurs, such as improvement of the medical condition. Subjects who do not respond well to the treatment may drop out of the study early, while subjects who do well may be more likely to remain in the study. Since the probability of observing a value depends on the value that would have been observed, simply deleting subjects who drop out early can easily lead to incorrect inferences because the successful subjects will be overrepresented among those who complete the study.

In many clinical trials, the response variable is not observed because the study ends, not because of patient characteristics. In this case, we call the response times censored; so for each patient, we know either the time to the landmark or the time to censoring. This is a different type of missing data problem, and analysis needs to include both the uncensored and censored observations. Book-length treatments of censored survival data are given by Kalbfleisch and Prentice (1980) and Cox and Oakes (1984), among others.

统计代写|线性回归分析代写linear regression analysis代考|Alternatives

All the alternatives we briefly outline here require strong assumptions concerning the data that may be impossible to check in practice.

Suppose first that we combine the response and predictors into a single vector $Z$. We assume that the distribution of $Z$ is fully known, apart from unknown parameters. The simplest assumption is that $Z \sim N(\boldsymbol{\mu}, \Sigma)$. If we had reasonable estimates of $\boldsymbol{\mu}$ and $\Sigma$, then we could use (4.15) to estimate parameters for the regression of the response on the other terms. The EM algorithm (Dempster, Laird, and Rubin , 1977) is a computational method that is used to estimate the parameters of the known joint distribution based on data with missing values.

Alternatively, given a model for the data like multivariate normality, one could impute values for the missing data and then analyze the completed data as if it were fully observed. Multiple imputation carries this one step further by creating several imputed data sets that, according to the model used, are plausible, filled-in data sets, and then “average” the analyses of the filled-in data sets. Software for both imputation and the EM algorithm for maximum likelihood estimate is available in several standard statistical packages, including the “missing” package in S-plus and the “MI” procedure in SAS.

The third approach is more comprehensive, as it requires building a model for the process of interest and the missing data process simultaneously. Examples of this approach are given by Ibrahim, Lipsitz, and Horton (2001), and Tang, Little, and Raghunathan (2003).

The data described in Table 4.2 provides an example. Allison and Cicchetti (1976) presented data on sleep patterns of 62 mammal species along with several other possible predictors of sleep. The data were in turn compiled from several other sources, and not all values are measured for all species. For example, $P S$, the number of hours of paradoxical sleep, was measured for only 50 of the 62 species in the data set, and $G P$, the gestation period, was measured for only 58 of the species. If we are interested in the dependence of hours of sleep on the other predictors, then we have at least three possible responses, $P S, S W S$, and $T S$, all observed on only a subset of the species. To use case deletion and then standard methods to analyze the conditional distributions of interest, we need to assume that the chance of a value being missing does not depend on the value. For example, the four missing values of GP are missing because no one had (as of 1976) published this value for these species. Using the imputation or the maximum likelihood methods are alternatives for these data, but they require making assumptions like normality, which might be palatable for many of the variables if transformed to logarithmic scale. Some of the variables, like $P$ and $S E$ are categorical, so other assumptions beyond multivariate normality might be needed.

统计代写|线性回归分析代写linear regression analysis代考|Missing at Random

线性回归代写

统计代写|线性回归分析代写linear regression analysis代考|Missing at Random

丢失数据问题最常见的解决方案是删除大小写或变量,这样得到的数据集就完整了。许多软件包默认删除部分缺失的案例,并将回归模型拟合到剩余的完整案例中。这是一种合理的方法,只要被删除的案例的比例足够小,并且未被观察到的值的原因与所研究的关系无关。这包括因意外事故而丢失的数据,比如掉下试管,或者在日志上写了一个难以辨认的条目。如果未观测值的原因取决于本应观测到的值,则数据分析可能需要对未观测值的原因进行建模。例如,如果测量值小于仪器的最小检测限而未记录,则该值因本应观察到的值太小而丢失。在这种情况下,有时有用的一个简单权宜之计是用小于或等于检测极限的值代替未观察到的值。这种权宜之计并不总是完全令人满意,因为用一个固定的值代替未观察到的量可以减少所填变量的变化,并产生误导性的推论。

作为第二个例子,假设我们有一个临床试验,招募具有特定医疗状况的受试者,为每个受试者分配一种治疗方法,然后对受试者进行一段时间的跟踪,观察他们的反应,这段时间可能是一段时间,直到出现特定的里程碑,例如医疗状况的改善。治疗效果不佳的受试者可能会提前退出研究,而效果良好的受试者可能更有可能留在研究中。由于观察到某个值的概率取决于本应观察到的值,因此简单地删除早期退出的受试者很容易导致错误的推断,因为成功的受试者在完成研究的受试者中所占的比例过高。

在许多临床试验中,没有观察到反应变量是因为研究结束,而不是因为患者的特征。在这种情况下,我们称响应时间为审查;所以对于每个病人,我们要么知道到里程碑的时间,要么知道到检查的时间。这是另一种类型的缺失数据问题,分析需要包括未审查和审查的观察结果。Kalbfleisch和Prentice(1980)以及Cox和Oakes(1984)等人对删减后的生存数据进行了整本书的处理。

统计代写|线性回归分析代写linear regression analysis代考|Alternatives

我们在这里简要概述的所有替代方案都需要对数据进行强有力的假设,而这些假设在实践中可能无法验证。

首先假设我们将响应和预测器组合成一个向量$Z$。我们假设除了未知参数外,$Z$的分布是完全已知的。最简单的假设是$Z \sim N(\boldsymbol{\mu}, \Sigma)$。如果我们对$\boldsymbol{\mu}$和$\Sigma$有合理的估计,那么我们可以使用(4.15)来估计其他项响应的回归参数。EM算法(Dempster, Laird, and Rubin, 1977)是一种基于缺失值数据估计已知联合分布参数的计算方法。

或者,给定数据模型(如多元正态性),可以为缺失的数据计算值,然后分析完整的数据,就像完全观察到的那样。多重输入通过创建几个输入数据集(根据所使用的模型,这些数据集是可信的、填充的数据集),然后对填充数据集的分析进行“平均”,从而进一步实现了这一点。用于最大似然估计的imputation和EM算法的软件可在几个标准统计软件包中获得,包括S-plus中的“missing”软件包和SAS中的“MI”程序。

第三种方法更加全面,因为它需要同时为感兴趣的过程和缺失的数据过程构建模型。Ibrahim, Lipsitz, and Horton(2001)以及Tang, Little, and Raghunathan(2003)给出了这种方法的例子。

表4.2提供了一个示例数据。Allison和Cicchetti(1976)提供了62种哺乳动物的睡眠模式数据,以及其他几种可能的睡眠预测因素。这些数据依次来自其他几个来源,并不是所有物种的所有值都被测量出来。例如,在数据集中的62个物种中,只有50个物种测量了$P S$(矛盾睡眠的小时数),而只有58个物种测量了$G P$(妊娠期)。如果我们对睡眠时间对其他预测因素的依赖性感兴趣,那么我们至少有三种可能的反应,$P S, S W S$和$T S$,它们都只在物种的一个子集上观察到。为了使用用例删除,然后使用标准方法来分析感兴趣的条件分布,我们需要假设值丢失的机会不依赖于值。例如,GP的四个缺失值之所以缺失,是因为(截至1976年)没有人发表过这些物种的GP值。使用imputation或最大似然方法是这些数据的替代方法,但它们需要做出正态性等假设,如果转换为对数尺度,这可能对许多变量都是可取的。一些变量,如$P$和$S E$是分类的,因此可能需要在多元正态性之外的其他假设。

统计代写请认准statistics-lab™. statistics-lab™为您的留学生涯保驾护航。

金融工程代写

金融工程是使用数学技术来解决金融问题。金融工程使用计算机科学、统计学、经济学和应用数学领域的工具和知识来解决当前的金融问题,以及设计新的和创新的金融产品。

非参数统计代写

非参数统计指的是一种统计方法,其中不假设数据来自于由少数参数决定的规定模型;这种模型的例子包括正态分布模型和线性回归模型。

广义线性模型代考

广义线性模型(GLM)归属统计学领域,是一种应用灵活的线性回归模型。该模型允许因变量的偏差分布有除了正态分布之外的其它分布。

术语 广义线性模型(GLM)通常是指给定连续和/或分类预测因素的连续响应变量的常规线性回归模型。它包括多元线性回归,以及方差分析和方差分析(仅含固定效应)。

有限元方法代写

有限元方法(FEM)是一种流行的方法,用于数值解决工程和数学建模中出现的微分方程。典型的问题领域包括结构分析、传热、流体流动、质量运输和电磁势等传统领域。

有限元是一种通用的数值方法,用于解决两个或三个空间变量的偏微分方程(即一些边界值问题)。为了解决一个问题,有限元将一个大系统细分为更小、更简单的部分,称为有限元。这是通过在空间维度上的特定空间离散化来实现的,它是通过构建对象的网格来实现的:用于求解的数值域,它有有限数量的点。边界值问题的有限元方法表述最终导致一个代数方程组。该方法在域上对未知函数进行逼近。[1] 然后将模拟这些有限元的简单方程组合成一个更大的方程系统,以模拟整个问题。然后,有限元通过变化微积分使相关的误差函数最小化来逼近一个解决方案。

tatistics-lab作为专业的留学生服务机构,多年来已为美国、英国、加拿大、澳洲等留学热门地的学生提供专业的学术服务,包括但不限于Essay代写,Assignment代写,Dissertation代写,Report代写,小组作业代写,Proposal代写,Paper代写,Presentation代写,计算机作业代写,论文修改和润色,网课代做,exam代考等等。写作范围涵盖高中,本科,研究生等海外留学全阶段,辐射金融,经济学,会计学,审计学,管理学等全球99%专业科目。写作团队既有专业英语母语作者,也有海外名校硕博留学生,每位写作老师都拥有过硬的语言能力,专业的学科背景和学术写作经验。我们承诺100%原创,100%专业,100%准时,100%满意。

随机分析代写


随机微积分是数学的一个分支,对随机过程进行操作。它允许为随机过程的积分定义一个关于随机过程的一致的积分理论。这个领域是由日本数学家伊藤清在第二次世界大战期间创建并开始的。

时间序列分析代写

随机过程,是依赖于参数的一组随机变量的全体,参数通常是时间。 随机变量是随机现象的数量表现,其时间序列是一组按照时间发生先后顺序进行排列的数据点序列。通常一组时间序列的时间间隔为一恒定值(如1秒,5分钟,12小时,7天,1年),因此时间序列可以作为离散时间数据进行分析处理。研究时间序列数据的意义在于现实中,往往需要研究某个事物其随时间发展变化的规律。这就需要通过研究该事物过去发展的历史记录,以得到其自身发展的规律。

回归分析代写

多元回归分析渐进(Multiple Regression Analysis Asymptotics)属于计量经济学领域,主要是一种数学上的统计分析方法,可以分析复杂情况下各影响因素的数学关系,在自然科学、社会和经济学等多个领域内应用广泛。

MATLAB代写

MATLAB 是一种用于技术计算的高性能语言。它将计算、可视化和编程集成在一个易于使用的环境中,其中问题和解决方案以熟悉的数学符号表示。典型用途包括:数学和计算算法开发建模、仿真和原型制作数据分析、探索和可视化科学和工程图形应用程序开发,包括图形用户界面构建MATLAB 是一个交互式系统,其基本数据元素是一个不需要维度的数组。这使您可以解决许多技术计算问题,尤其是那些具有矩阵和向量公式的问题,而只需用 C 或 Fortran 等标量非交互式语言编写程序所需的时间的一小部分。MATLAB 名称代表矩阵实验室。MATLAB 最初的编写目的是提供对由 LINPACK 和 EISPACK 项目开发的矩阵软件的轻松访问,这两个项目共同代表了矩阵计算软件的最新技术。MATLAB 经过多年的发展,得到了许多用户的投入。在大学环境中,它是数学、工程和科学入门和高级课程的标准教学工具。在工业领域,MATLAB 是高效研究、开发和分析的首选工具。MATLAB 具有一系列称为工具箱的特定于应用程序的解决方案。对于大多数 MATLAB 用户来说非常重要,工具箱允许您学习应用专业技术。工具箱是 MATLAB 函数(M 文件)的综合集合,可扩展 MATLAB 环境以解决特定类别的问题。可用工具箱的领域包括信号处理、控制系统、神经网络、模糊逻辑、小波、仿真等。

Days
Hours
Minutes
Seconds

hurry up

15% OFF

On All Tickets

Don’t hesitate and buy tickets today – All tickets are at a special price until 15.08.2021. Hope to see you there :)