恩佐2登录 > SEO案例 > 新宝7恩佐娱乐平台招商ppt

新宝7恩佐娱乐平台招商ppt

admin SEO案例 2020年01月01日

  登录成功,如需使用密码登录,请先进入【个人中心】-【账号管理】-【设置密码】完成设置

  *若权利人发现爱问平台上用户上传内容侵犯了其作品的信息网络传播权等合法权益时,请按照平台侵权处理要求书面通知爱问!

  全国最大的共享资料库,等您下载。本资料为新宝7恩佐娱乐平台招商.ppt文档,由爱问共享资料用户提供,以下为正文内容。

  第九章stata与离散被解释变量模型华宇娱乐主管新宝恩佐娱乐平台招商主要内容二值选择模型多值选择模型排序数据模型条件logit模型嵌套logit模型实验:二值选择模型一实验基本原理二实验内容和数据来源根据某统计资料得到美国妇女就业的数据统计集形成数据文件“womenworkdta”用来研究影响美国妇女就业的因素。被解释变量是work(就业work=不就业work=)解释变量是age(年龄)married(婚否)children(子女数)education(教育年限)。完整的数据在本书附带光盘里的data文件夹的“womenworkdta”工作文件中。利用以上数据建立合适模型对就业的影响因素进行计量分析由于被解释变量取值有两个可以建立二值选择模型来分析问题。三实验操作指导建立logit模型分析()使用logit模型回归Stata中使用logit模型回归的命令语句格式如下:logityxx…ifinweight,options该命令中logit表示使用logit模型进行回归相应y表示模型的被解释变量x表示模型的解释变量if表示logit的回归条件in表示回归的范围weight表示给观测值的加入权重options的内容如下表所示:本实验中在Stata命令窗口中输入如下命令。usewomenwork,clear输入此命令来打开需要的数据文件。logitworkageeducationmarriedchildren输入此命令对被解释变量为work解释变量为age、education、married、children的模型使用logit模型进行回归估计。在这个回归结果图中loglikelihood即对数似然值不断的试错迭代是logit模型的估计方法在逐步进行回归时通过比较不同模型的LL判断模型的拟合优度选择取值更小的模型。恩佐2登录LRchi()是卡方检验的统计量也就是回归模型无效假设所对应的似然比检验量其中为自由度Probchi是其对应的P值在这个估计结果显示以p=显著说明模型的有效性。其实这两个指标与线性回归结果中F统计量和P值的功能是大体一致的。另外结果中的PseudoR是准R虽然不等于R,但可以用来检验模型对变量的解释力因为二值选择模型是非线性模型无法进行平方和分解所以没有但是准衡量的是对数似然函数的实际增加值占最大可能增加值的比重所以也可以很好的衡量模型的拟合准确度。此logit模型中拟合优度为。coef是自变量对应的系数估计值OLS通过t检验来检验估计量是否显著logit模型通过z检验来判断其显著性通过z检验结果可以看到此模型中系数均以p=显著不为。()由于估计系数不像线性模型能够表示解释变量的边际效应所以Stata中有额外的命令语句来计算解释变量的边际效应:mfxcomputeifin,options此命令语句中mfx表示对回归之后的模型计算解释变量的边际效应其中options内容如下表所示:本实验中在进行logit模型回归估计后在Stata命令窗口中输入如下命令:mfx此命令计算模型回归之后解释变量取值在样本均值处的边际效应。此输出结果显示了每一个解释变量的平均边际影响另外读者可以自己设定计算在边际影响的点其原理就是命令语句options中的at(atlist)将其具体化例如“mfx,at(x=)”表示计算x取值为其他解释变量取值在样本均值处的边际效应而“mfx”默认是在所有解释变量在样本平均值处的边际效应。()计算模型预测的百分比来计算模型的拟合优度。如果要检验这个分类的依据或者要获得每个预测值可以利用此二值模型进行预测分析Stata中二值选择模型的预测的命令语句如下所示:predicttypenewvarifin,singleoptions其中predict是表示对模型进行预测的命令newvar表示预测新变量的名称type可以表明设定新变量的类型if和in表示对此预测设定的条件和范围singleoptions的内容以下表所示:本实验中在Stata命令窗口中输入如下预测命令可以得到预测结果图:predictp,pr此命令可以获得此模型的个体估计的值并记为新变量plistworkp此命令可以将实际值与估计值对应罗列对比看到预测值和实际值的一致程度。()ROC曲线(受试者操控曲线)此曲线是指图提到的敏感性与(特异性)的散点图即预测值等于的准确率与错误率的散点图。Stata中绘画该ROC曲线命令语句为:lrocxifinweight,options其中lroc表示绘图ROC曲线命令if和in表示对绘制图时的条件和范围的设定weight表示对观测值的权重设定另外命令中的自变量x不能单独使用必须与options中beta(matname)同时使用而options的内容如下表所示:本实验中在以上工作后在命令窗口中输入如下命令绘制ROC曲线图lroc因为准确率就是曲线下面的面积读此图可以看到ROC曲线是完全在度直线上面所以准确率高于错误率即准确率大于。此图曲线下方面积=就是预测的准确率是。()goodnessoffit拟合优度检验此检验是考察该模型对所用数据的拟合优度在Stata中命令语句为:estatgofifinweight,group(#)alloutsampletable其中if和in表示对检测拟合优度时的条件和范围的设定weight表示对观测值的权重设定group(#)表示使用合理的#分位数进行检验all表示对所有观测值进行检验若无后面可选项则默认就是alloutsample表示对估计区间外的样本调整自由度table表示各组列表。本实验中在Stata命令窗口输入如下命令检验此模型的拟合优度然后可以得到检验结果:estatgof读此图的方法是P值越大说明模型的拟合优度越好。建立probit模型分析前面是使用logit模型对womenworkdta进行分析现在使用probit模型对此问题进行分析。两种方法在Stata中的操作是很一致的。在Stata命令窗口中输入如下命令:usewomenwork,clear使用此命令打开所需要文件。probitworkageeducationmarriedchildren此命令表示使用probit模型进行回归。此图的解读方法与Logit模型结果图是完全一样的probit模型估计结果显示系数估计值相比logit估计值发生了很大变化且均显著通过了模型系数的显著性检验另外模型的准R是相比logit模型稍有改进。由于logit与probit模型得出的参数估计值不可直接比较根据本节开始介绍的原理已了解到两模型的边际效应可以比较。Stata中probit模型的边际效应得出方法与logit是相同的。在Stata命令窗口中输入如下命令计算probit模型回归后解释变量在样本均值处的边际效应:mfx可以看到与前面的logit模型比较两模型分析的边际效应是大致相同的。然后来计算probit模型的拟合优度具体操作方法也与logit模型是一致的。计算准确预测百分比Stata命令窗口输入如下命令:estatclas此图的解读方法与上面logit模型得到的是完全一样的显然可以得到:sensitivity(敏感性)=specificity(特异性)=correctlyclassified(正确预测百分比)=。可以看到这个结果与logit模型是完全一致的。另外为了检验这个结果可以同样输入如下命令:predictp,pr此命令可以获得此模型的个体估计的值并记为新变量plistworkp其次是使用ROC曲线来检测预测的准确度在Stata命令窗口中输入如下命令可以得到ROC曲线:lroc此图的读法与logit的ROC图是一致的由于logit模型与probit模型的sensitivity与specificity是相同的那么ROC曲线一定是相同的且曲线下方的面积同样是。最后是godnessoffit拟合优度检验在Stata命令窗口中输入如下命令:estatgof二值选择模型的异方差问题Stata中对probit二值选择模型进行异方差检验和回归的命令语句如下:hetprobyxx…ifinweight,het(varlistoffset(varname)),options其中hetprob表示对模型进行异方差probit模型估计和异方差检验if和in表示对检测拟合优度时的条件和范围的设定weight表示对观测值的权重设定选择项het(varilist)是影响扰动项的变量清单在该命令语句的输出结果里会汇报LR检验的结果据此判断是否应该使用此异方差模型options的内容如下表所示:本实验中在Stata命令窗口中输入如下命令进行异方差模型估计和检验可以得到图的运行结果:hetprobworkageeducationmarriedchildren,het(ageeducationmarriedchildren)结果显示LR检验的结果是接受原假设即模型不存在异方差问题。所以回归不应使用异方差回归模型可以直接应用probit模型进行估计。实验:多值选择模型一实验基本原理多值选择模型有时候人们面临的选择是多个的比如交通选择入读大学的选择等等。假设个体可以选择的y=,,,…,J,其中J是正整数。当研究的被解释变量是这样多值离散的建立的模型就是多值选择模型而当J=时就是上节所说的probit或者logit模型。若将上面的二值logit模型推广开来可以得到二实验内容和数据来源本实验来自某统计资料统计在购物时所选品牌与性别、年龄的关系。变量主要有brand(品牌)female(性别)age(年龄)。完整的数据在本书附带光盘data文件夹下“branddta”中。本实验用此数据来以female和age为解释变量brand为被解释变量brand的取值是离散的且有三个取值应建立多值选择模型进行相关分析。二实验操作指导选择合理模型在Stata中将数据按照某个或某几个变量进行分类并按这个变量获得其频数分布的命令如下:tabvarlist其中varlist表示按照其分类的变量或者变量组合。在本实验中打开数据文件并将数据按brand取值分类在Stata命令窗口中输入如下命令usebrand,cleartabbrand读图可知brand取值有三个分别是。由于所要探究的问题female和age对brand的影响且假定了选择各个品牌之间是相互独立的那么建立多值选择模型来分析问题是合理的。模型回归多值选择模型有logit和probit多值选择模型Stata中使用多值logit和probit模型的命令语句是:mlogityxx…ifinweight,options(multinomiallogit模型)mprobityxx…ifinweight,options(multinomialprobit模型)此命令中if和in表示对检测拟合优度时的条件和范围的设定weight表示对观测值的权重设定options的内容如下表所示:经常使用的命令语句是“mlogityxx…base(#)”或者“mprobityxx…base(#)”其中#是指被解释变量的某个取值其可以根据需要变动此参照组。本实验中由于logit模型与probit模型操作相似以多值logit为例进行操作。在Stata命令窗口中输入如下命:mlogitbrandagefemale,base()此命令表示以age和female为解释变量brand为被解释变量以brand=为参照组的多值logit模型回归。根据前面原理部分的介绍该题的多值logit模型是由三个方程组成的。Stata回归结果图显示出了j=和j=时对应的模型估计结果自然由三种选择概率之和为可得到j=时模型结果。Stata中得出多值选择模型个体选择被解释变量每个取值的概率的命令语句格式():predicttype{stub*newvars}ifin,statisticoutcome(#,#,…)nooffset该预测命令语句中type表示预测设定新变量的类型{stub*newvars}表示预测的新变量名称if和in表示对检测拟合优度时的条件和范围的设定outcome表示需要对其指定的类别进行概率预测。如果不设定outcome选项则需设定k个新变量。如果是预测指数或者指数的标准差则需设定个新变量。outcome()中outcome可以直接用类别的取值也可以用##等表示类别的序号当然也可用数值标签来表示。nooffset表示预测时的约束statistic的内容主要包括:预测命令格式():predicttype{stub*newvarlist}ifin,scores此命令中type表示预测设定新变量的类型{stub*newvarlist}表示预测的新变量名称if和in表示对检测拟合优度时的条件和范围的设定score表示对数似然函数对每个方程的一阶导数第、、…、k个变量为对数似然函数对地、、、…、k个方程的一阶导数。在本实验中在Stata命令窗口中输入如下命令语句预测brand三个取值的概率然后列出如图的预测结果:predictpppList此图可以看出很多时候根据模型预测选择某个品牌的概率最大但是实际上此个体未选择此品牌就是预测失败了。若读整个个体选择的概率图会有一个很明显的结论年轻的人倾向于选择brand(选择brand的概率较大)随着年龄增加选择brand和brand的概率增加年龄越大的人倾向选择brand。实验:排序数据模型一实验基本原理运用计量经济学建立多值选择模型去解释一个取值离散的变量时有时候这个变量的取值可能是有顺序的比如银行的信用评级学生奖学金等等这些选择的取值代表了一定的优劣即数字是有顺序的。多值选择模型所能研究的问题是变量选择的取值之间是无序的排序对其无意义的。所以对于有序数据的探究应该用本节的排序数据模型。二实验内容和数据根据GSS统计调查数据得到数据文件ordwarmdta不同的家庭母子(女)之间的关系是不同的有的比较紧张有的比较融洽。这种关系在数据文件ordwarmdta变量warm(关系融洽度)中体现文件中其他的变量educ=子女接受教育的程度age=子女年龄male=儿子prst=职业威望white=白人yr=年受调查与否。完整的数据在本书附带光盘的data文件夹下的“ordwarmdta”。此数据文件中变量warm取值表示融洽度逐步上升warm作为这个问题的被解释变量其取值是离散不连续且是有顺序的所以可以建立一个排序数据模型分析不同因素对warm的影响。二实验操作指导选择合理模型warm是模型的被解释变量从数据文件中看到其是一排序数据。在Stata命令窗口中输入如下命令打开文件并观察数据和其变量特点:useordwarm,cleartabwarm此命令表示按warm变量将数据分类且获得其频数分布。可见所有数据都分在warm的种取值类别中由于种取值有顺序的所以分析时应该使用排序数据模型。模型回归排序选择模型分为排序logit模型和排序probit模型在Stata中命令语句分别为:oprobityxx…ifinweight,options此命令语句表示使用orderedprobit模型对y、x进行回归if和in表示回归的条件和范围weight表示观测值的权重options内容如下表所示。ologityxx…ifinweight,options此命令语句表示使用orderedlogit模型对y,x进行回归if和in表示回归的条件和范围weight表示观测值的权重options内容如下表。本实验Stata分别使用两种模型进行回归在命令窗口中输入如下命令:oprobitwarmedagemaleprstwhiteyr此命令表示解释变量为edagemaleprstwhiteyr被解释变量是warm的排序probit模型回归。若使用排序ologit模型对此问题进行回归则在命令窗口中输入如下命令:ologitwarmedagemaleprstwhiteyr此命令表示解释变量为edagemaleprstwhiteyr被解释变量是warm的排序logit模型回归。此图分析与上图一样的同样给出了重要的参数估计量包括模型系数估计值和三个临界点。利用多值选择模型同样可以预测样本个体选择warm每个取值的概率此模型在Stata中命令语句与多值选择模型是一样的所以其预测命令语句()仍为:predicttype{stub*newvars}ifin,statisticoutcome(#,#,…)nooffset该预测命令语句中type表示预测设定新变量的类型{stub*newvars}表示预测的新变量名称if和in表示对检测拟合优度时的条件和范围的设定outcome表示需要对其指定的类别进行概率预测。如果设定outcome选项则需设定k个新变量否则只需设定个新变量。如果是预测指数或者指数的标准差则需设定个新变量。outcome()中outcome可以直接用类别的取值也可以用##等表示类别的序号当然也可用数值标签来表示。nooffset表示预测时的约束statistic的内容主要包括:预测命令格式():predicttype{stub*newvarlist}ifin,scores此命令中type表示预测设定新变量的类型{stub*newvarlist}表示预测的新变量名称if和in表示对检测拟合优度时的条件和范围的设定score表示对数似然函数对每个方程的一阶导数第、、…、k个变量为对数似然函数对地、、、…、k个方程的一阶导数。本实验中预测样本个体选择warm每个取值的概率时可以在Stata命令窗口中输入如下命令:predictpppplistpppp图中pppp分别代表warm的、、、四个取值的概率。若要单独看符合某些条件的个体的warm取某个值的概率也可在Stata命令窗口输入如下命令:predictmaleif(male==yr==white==),proutcome()表示符合括号条件的个体取warm=时的概率。读者可以根据自己分析问题需要来定义条件然后预测符合条件的被解释变量的取值。实验:条件logit模型一实验基本原理前面分析人们在面临多个选择时选择的依据是个体的特点比如考察人们购物选择的品牌时模型考虑的是个体的年龄和性别但有时候个体选择受外部因素的影响很大即选择特征(备选方案的特征变量)比如某个品牌在这个城市进驻的销售商数量等等此时用多值logit模型会影响分析结果。本章介绍的条件logit模型可以解决解释变量中存在选择特征的问题。根据条件概率定义多值选择logit模型可以改写为:二实验内容和数据来源本实验的数据来自某统计资料关于研究初生婴儿体重的影响因素的统计数据整个数据在本书附带的光盘中data文件夹中“lowbirthdta”中。数据中的变量有parid(个体识别变量)low(婴儿低体重若体重低则取值否则)age(母亲的年龄)lowt(母亲最近一个月的体重)smoke(母亲怀孕期间是否吸烟若吸烟为否则为)ptd(母亲以前有早产经历若有则反之为)ht(母亲高血压若是则取值否则为)ui(母亲是否子宫敏感若是则取值否取值)race(母亲是白种人若是则取值反之)race(母亲是黑种人若是取值反之)race(母亲是其他色种人若是取值反之取值)。此实验中被解释变量是low,以上的解释变量均是婴儿妈妈的因素那么这些因素就是与选择特征变量所以应该建立条件logit模型进行回归。三、实验操作指导建立模型首先是观察变量的特点发现解释变量是选择特征变量然后在Stata中输入如下命令打开数据文件观察变量特点:uselowbirth,cleartablow此命令表示按warm变量将数据分类且获得其频数分布。可见到所有数据都在两个类别中且解释变量均为选择特征变量pairid是个体识别变量所以建立条件logit模型分析问题是合理的。模型回归Stata中使用条件logit模型的回归命令语句如下所示:clogityxx…ifinweight,group(varname)options其中clogit表示对y、x进行条件logit模型回归if和in表示回归的条件和范围weight表示观测值的权重值group设定个体识别变量options内容如下表所示:本实验中使用条件logit模型回归时由于raceracerace均做解释变量会产生完全的多重共线性这里的解决方法是:gennonwhite=racerace然后选取nonwhite与race中一个加入模型这样模型得到的结果是白种人和非白种人对婴儿体重的解释。所以在Stata中输入如下命令:clogitlowlwtnonwhitesmokeptd,group(pairid)此命令表示的是被解释变量是low解释变量是lwtnonwhitesmokeptd个体识别变量是pairid的条件logit模型回归。回归结果给出了模型的拟合优度和模型系数估计值为了保证参数的可识别性Stata对参数进行了标准化因此不包含常数项。显然模型lowt与nonwhite估计系数的p值未通过显著性检验。若是模型中引入的解释变量是race而不是nonwhite则系数估计值会是现在估计值的相反数。在本实验中在Stata命令窗口中输入如下命令就可以看到此模型的机会比情况:clogitor结果与图比较可见oddsRatio等于上图中系数估计值取自然指数的值。其意义是lowt每增加单位婴儿体重重的概率相对轻的概率会增加nonwhite每增加单位(即成为race)婴儿体重重概率相对轻的概率增加。利用条件选择模型同样可以预测样本个体选择每个取值的概率Stata中命令语句如下所示:predicttypenewvarifin,statisticnooffset该预测命令语句中type表示预测设定新变量的类型newvars表示预测的新变量名称if和in表示对检测拟合优度时的条件和范围的设定nooffset表示预测时的约束statistic的内容主要包括:本实验中在Stata命令窗口中输入如下命令可得到预测结果:predictp此预测命令可以得到婴儿初生时体重较重的概率listlowp将被解释变量与预测的概率罗列可以看到预测结果与实际结果的对比情况即预测的准确度。实验:嵌套Logit模型一实验基本原理多值选择模型和二值模型使用的一个重要的前提就是被解释变量取值之间的无关独立性这个前提使它们在实际分析问题中使用受到很大限制。有很多时候个体的选择是分层次的下面层次的选择受到上面层次的限制。比如个体外出旅游时首先选择去的地方然后才能选择看的风景名胜。比如下图所示的一个选择过程:显然在选择最终选择的过程中有两个层次。相同层次之间的选择是具有替代性的而层次之间的选择又是不相关的第一层决策为北京或者上海这两个选择是相互替代的第一层的选择与第二层选择无关第二层显然分为两组在每组内部的选择是不相关的而组间具有相关性。也就是将条件Logit模型中隐含的齐次方差性条件放松允许方差在组间可以不同但在组内仍然是同方差的这样的模型被称为NestedLogit模型。二实验内容及数据来源根据某统计资料得到考察家庭选择酒店的影响因素的数据文件restaurantdta。数据中变量包括:familyid(家庭识别变量)restaurant(酒店)income(家庭收入)cost(每人的平均餐饮费用)kids(家庭小孩)rating(酒店星级)distance(家庭与酒店的距离)chosen(选择餐厅的识别变量)。完整的数据文件在本书附带光盘下的data文件夹中的“restaurantdta”数据文件中。在本数据中人们的选择包含两个水平:类型和餐馆就是所人们先决定去什么类型的餐馆就餐然后再根据各种因素确定具体的餐馆。认为incomekids是个体特征变量决定个体选择的第一水平类型costrating为选择变量决定个体选择的第二水平具体餐馆。所以应该使用嵌套logit模型来分析此问题。三实验操作指导选择合理的模型首先在Stata中输入如下命令打开所需数据文件:userestaurant,clear观察变量的特点餐厅选择有两个层次类型和餐馆。类型有三种fastfamily和fancy可以使用嵌套logit模型分析此问题。模型回归()Stata中生成水平识别变量的命令语句如下所示:nlogitgennewvar=alvar(branchlist),nolog此命令语句中nlogitgen表示嵌套模型中生成水平识别变量newvar生成新变量的名称alvar表示被分类的变量名称branchlist表示各水平包含的怎样的取值nolog表示窗口不显示生成的水平识别变量结果。branchlist的形式为:branch,branch…branch的形式为:label:alternativealternativealternative…在本实验中使用Stata生成水平识别变量时在Stata窗口中输入如下命令可以得到图所示的结果:nlogitgentype=restaurant(fast:FreebirdsMamasPizza,family:CafeEccellLosNortenosWingsNmore,fancy:ChristophersMadCows)此命令生成此模型的第一水平变量fast,family和fancy。()在设定了水平变量后可以在Stata中输入如下命令显示出其树状结构:nlogittreealtervarlistifinweight,choice(y)nloabelnobranchesnlogittree表示显示树状结构altervarlist表示两个层次的变量名称但是一定是底层变量名称在前面然后依次向后if和in表示显示的条件和范围weight表示对观测值加入的权重choice(y)表示显示被解释变量在各个水平下出现的频数nloabelnobranches是对显示出图形形式的要求。在本实验中在Stata命令窗口中输入如下命令:nlogittreerestauranttype,choice(chosen)此命令表示显示二层选择变量是restaurant一层选择变量是type的树状结构。()进行嵌套logit模型的回归:Stata中进行嵌套logit模型回归的命令语句如下所示:nlogityxx…ifinweightlevequationlevequation…altar:byaltvarlistcase(varname),options其中nologit表示对y,x进行嵌套logit模型回归if和in表示回归的条件和范围weight表示观测值加入的权重case(varname)表示个体识别变量。levkequation的形式如下:altar:byaltvarlist,base(#label)estconstaltvar为每个水平上决策者选择的识别变量。byaltvarlist设定不同水平上的解释变量。在一个水平上每一个解释变量都有k个回归系数k为类别个数即每一个选择都有一个回归系数。如果变量为常数(比如反映决策者特征的个体特定变量)基础选择的回归系数是不能识别的。通过base()选项设定每个水平的基础类别默认选项为频数最高的类别。estconst用于除了底层水平之外的某一个水平。其作用是在设定的水平上除了基础类别外其他选择都带有常数项。由于只能在其中一个水平上存在常熟项Stata默认值是底层水平是带有常数项的(当然除了基础类别)。即如果设定了这个选项那么底层水平必须通过noconstant选项设定不能含常数项。命令中options的内容如下表:在本实验中在Stata命令窗口中输入如下命令可以得到回归估计结果:nlogitchosencostdistanceratingtype:incomekids,base(family)restaurant:,noconstcase(familyid)此命令表示一个一层水平是type且其解释变量是incomekids二层选择水平是restaurant其解释变量是costdistancerating的嵌套回归模型。且要求在一层水平上的基础类别是family底层水平的估计不含有常数项。此回归图显示了嵌套回归模型是通过不断迭代最终找到最大化的估计量。结果图给出了每个层次的回归的系数估计值和显著性检验结果可以用来分析问题。比如结果显示收入(income)越高的人越倾向选择fancy这个就餐类型在第二水平的选择上成本低距离近等级高的餐馆容易被选择但是rating这个变量的系数没有通过显著性检验。)预测:使用嵌套模型对其估计结果进行预测的Stata命令格式如下所示:predicttypenewvarifin,statisticshlevel(#)altwisepredicttype{stub*newvarlist}ifin,scores对于第一个命令type表示预测出这个新变量newvar的类型if和in表示回归的条件和范围hlevel(#)表示在水平#上的预测概率altwise表示当存在缺失值时根据预测的替代选择删除观测值。statistics所代表内容如下表所示。第二个命令可以是用来预测每一个水平的概率。此命令中type表示预测设定新变量的类型{stub*newvarlist}表示预测的新变量名称if和in表示对检测拟合优度时的条件和范围的设定score表示对数似然函数对每个方程的一阶导数第、、…、k个变量为对数似然函数对地、、、…、k个方程的一阶导数。在本实验中在回归后在Stata命令窗口中输入如下命令语句:predictpr此命令可以用来预测底层水平的各个选择的概率。listfamilyidrestaurantpr输入此命令显示个体识别变量被解释变量和预测概率结果。要预测每个水平的概率可以在Stata中输入如下命令:predictp*,prlistfamilyidrestauranttypep*从上图可以看出显然p表示的是第一水平的选择概率p表示的概念与pr是一致的。观察可以得到p表示的是层次概率且三个层次概率的和是。而p表示的是底层选择概率其所有底层选择的概率之和亦是。当然如果在list语句中加入chosen变量就可以和前面几个实验中一样来观察和计算模型对数据的拟合优度了。如果要在第一水平的基础上计算第水平的各个选择的概率在Stata命令窗口中输入如下命令:predictcondp,condphlevel()此命令就是预测模型选择的条件概率就是既定第一水平后第二水平的选择概率。由于在既定第一水平下预测的条件概率各水平之间的选择是互不相关的所以预测的条件概率是在每个第一水平下其包含的最终选择的概率就是。习题使用data文件夹下的数据lbwdta,研究出生婴儿体重的影响因素以low(若婴儿体重小于克low=若大于克low=)为被解释变量agelwt,race,race,smoke,ptl,ht,ui为解释变量使用logit模型探究解释变量对被解释变量low的影响。图列示了该文件部分数据:仍然运用branddta数据改变实验的参照组重复多值选择回归将得到的结果与实验的结果比较。使用本书附带光盘data文件夹中的统计美国健康险投保情况的数据文件sysdsndta以insure(个体投保情况)为被解释变量以age(投保人年龄)male(投保人性别)nonwhite(投保人人种)site(投保人是否位于地点)site(投保人是否位于地点)为解释变量使用多值选择模型进行回归然后对结果进行分析。该数据文件的部分数据如下图所示:利用实验中lowbirthdta数据使用稳健标准条件logit模型重新回归并与实验比较结果差异。使用data文件夹下uniondta数据以union为被解释变量age,grade,notsmsa为解释变量使用条件logit模型探究解释变量对union的解释作用。图列示了该文件部分数据:对于实验利用数据restaurantdta,若约束每个水平的包含值相同(即条件logit模型)重新进行估计,并比较结果差异。

  小学语文_数学_英语最新教学课件大汇总,近1000个优质教学课件,供教师备课教学使用。涵盖语文课件、数学课件、英语课件等各方面资源,VIP全免费,欢迎各位教师下载使用。

标签: 新宝7恩佐注册