如何用R语言标记一列变量中大于前一个变量10%的数，比如用虚拟变量陷阱1标记

羽毛球技术 | 体育赛事 | 英文歌曲 | 住宅风水 | 用户界面设计师 | 六爻 | 书籍改编电影 | 德国足球甲级联赛 | 欧美明星 | PLC | 中国足球 | aj1 | 国家队 | 拜仁慕尼黑足球俱乐部 | 小说创作 | 配音 | iOS应用 | NBA 2K | 古典音乐 | 面相 | 火影忍者 | 武汉大学 | 土拨鼠 | 营销策划 | 秦时明月之天行九歌 | 设计师 | 巴塞罗那足球俱乐部 | 尤文图斯 | 实况足球（游戏） | 少帅 | 罗玉凤 | 比利时 | 跑鞋 | 冷知识 | 肖战 | 李元胜 | 古琴 | 按键精灵 | 罗兰 | 徐波 | 激光手术 | 角色扮演 | 关晓彤 | 微电影 | safari | 北京国安 | 古汉语 | 曼彻斯特联 | 玄幻小说 | 科幻小说 | 双眼皮手术 | 主题曲 | 年会 | 检测仪 | 徒步 | 互联网公司 | 百度输入法 | 镜头 | 宜昌市 | 自拍 | 金蝶 | 电子烟 | 网站建设 | 广播体操 | 文身 | nba篮球 | 索尼(sony) | 天体物理学 | 痛风 | 象棋 | 牛皮癣 | 皮肤护理 | 周星驰（人物） | 试管婴儿 | 亚足联亚洲杯（AFC Asian Cup） | 健美 | 美术生 | 迅雷（软件） | 战斗机 | 穿越小说 | 张璐 | 姓氏 | 诸葛亮 | 后宫·甄嬛传（书籍） | 虎牙直播 | snh48 | 阿迪达斯 | 投影仪 | 组装机 | 微信群 | 阿迪达斯(adidas) | 网球王子 | 分子生物学 | 耽美 | 武磊 | 婚礼 | 表演 | 中国武术 | 动画电影 | Air Jordan | 张子枫 | 免费软件 | 相声演员 | 摩羯座 | 宿舍 | ansys | 法国足球甲级联赛 | 户外 | 剧场版 | 杨凡 | 科幻电影 | galgame | 融资 | 关节炎 | NBA季后赛 | 神话 | 王力宏（人物） | 建模 | 计算机病毒 | 广州恒大淘宝足球俱乐部 | 北京奥运会 | 电脑电源 | 百度翻译 | 字幕 | 讯飞输入法 | 海关 | 易烊千玺 | 深度学习 | 编辑器 | 澳门特别行政区 | 直播 | 流氓软件 | 事故 | 大片 | 李景亮 | 郭富城 | 日语歌曲 | 卡牌游戏 | 小品 | 东京 | 花卉 | 音乐剧 | 互联网创业 | 占卜 | 羽毛球拍 | 婆媳关系 | 日本动画 | 巴黎 | 拳击比赛 | 东南亚 | 足球经理（FM）（游戏） | youtube | 胡歌（演员） | 地铁跑酷 | 植发 | 张继科 | 三国 | 用户界面 | 演技 | 百度竞价 | 青梅竹马 | 移动硬盘 | 韩晓鹏 | 马龙 | 瘦腿 | 宠物医疗 | 巨蟹座 | 徐峥 | 天蝎座 | 胸肌 | 赵丽颖（演员） | adidas阿迪达斯 | 低音炮 | 星际争霸（游戏） | 豆瓣电影 | 微信开放平台 | 手绘 | 吉他学习 | 江苏卫视 | 模特 | 创意 | 团队管理 | 奢侈品 | 王源 | TANK | 笛子 | 偶像 | 莱斯特城 | 维生素 | 新百伦 | 国际物流 | 前女友 | 李小龙 | 华语流行音乐 | 猎头公司 | crm | 搏击项目 | 网站运营 | 鼻炎 | 篮球游戏 |

你的位置：网站首页 >> 频道首页 >>其他编程语言 >>如何用R语言标记一列变量中大于前一个变量10%的数，比如用虚拟变量陷阱1标记

如何用R语言标记一列变量中大于前一个变量10%的数，比如用虚拟变量陷阱1标记

来源：蜘蛛抓取(WebSpider) 时间：2012-06-26 13:54 标签：虚拟变量陷阱

当前位置：
＞＞＞写出下列各随机变量可能的值，并说明随机变量取的值所表示的随机..
写出下列各随机变量可能的值，并说明随机变量取的值所表示的随机试验的结果。&&（1）从一个装有编号为1号到10号的10个球的袋中，任取1个球，被取出的球的编号为X；&（2）一个袋中装有10个红球，5个白球，从中任取4个球，其中所含红球的个数为X；（3）投掷两枚骰子，所得点数之和为X，所得点数之和是偶数为Y。
题型：解答题难度：中档来源：同步题
解：（1）X的可能取值为1，2，3，…，10，X=k（k=1，2，…，10）表示取出第k号球；&&（2）X的可能取值为0，1，2，3，4，X=k表示取出k个红球，4-k个白球，其中k=0，1，2，3，4；（3）X的可能取值为2，3，4，…，12；若以（i，j）表示投掷甲、乙两枚骰子后骰子甲得i点且骰子乙得j点，则X=2表示（1，1）；X=3表示（1，2），（2，1）；X=4表示（1，3），（2，2），（3，1）；…；X=12表示（6，6）。Y的可能取值为2，4，6，8，10，12。
马上分享给同学
据魔方格专家权威分析，试题“写出下列各随机变量可能的值，并说明随机变量取的值所表示的随机..”主要考查你对&&离散型随机变量及其分布列&&等考点的理解。关于这些考点的“档案”如下：
现在没空？点击收藏，以后再看。
因为篇幅有限，只列出部分考点，详细请访问。
离散型随机变量及其分布列
随机变量：
随着试验结果变化而变化的变量，常用字母ξ，η等来表示随机变量。
离散型随机变量：
所有取值可以一一列出的随机变量；
离散型随机变量的分布列：
如果离散型随机变量ξ可能取的值为x1，x2，x3，…，xn，…，而ξ取每一个值xi（i=1，2，3，…）的概率P（ξ＝xi）=pi，以表格的形式表示如下：&上表称为离散型随机变量ξ的概率分布列，简称为ξ的分布列。任一随机变量的分布列都具有下列性质：
（1）0≤pi≤1，（i=1，2，3，…）；（2）p1+p2+p3+…+pn+…=1；（3）离散型随机变量在某一范围内取值的概率等于它取这个范围内各个值的概率之和。求离散型随机变量分布列：
(1)先判断一个变量是否为离散型随机变量，主要看变量的值能否按一定的顺序一一列举出来．(2)明确随机变量X可取哪些值．(3)求x取每一个值的概率．(4)列成分布列表，
发现相似题
与“写出下列各随机变量可能的值，并说明随机变量取的值所表示的随机..”考查相似的试题有：
275621275226261038271157851569795205请问，我在XXX1.JSP中定义了一个变量比如：String strN我要在XXX2.JSP中想访问这个变量的话，如果我不用SESSION要怎么做？
[问题点数：0分]
请问，我在XXX1.JSP中定义了一个变量比如：String strN我要在XXX2.JSP中想访问这个变量的话，如果我不用SESSION要怎么做？
[问题点数：0分]
不显示删除回复
显示所有回复
显示星级回复
显示得分回复
只显示楼主
相关帖子推荐：
本帖子已过去太久远了，不再提供回复功能。R语言基础教程1：数据类型
R语言是面向对象的。面向对象的理论一两句话说不清楚（我不清楚），但对于数据至少应该了解三个：
1、R能处理的东西（包括数据）都称为object。这个英文单词的意思原本很清楚，就是物体、物件的意思，但被计算机专家们翻译成“对象”以后就很玄乎了。
物（object）以类聚。一个object都应该能找到它所归属的某个类（class）。“类”是抽象的概念，一个类至少有一个特征是这类数据所共有
的。根据应用需求、目的等不同可以定义不同的类。比如做生物信息的可以定义出DNA类、RNA类，为了高效处理这类数据，定义这些类是非常必要的。所以R
里面有很多的“类”。
3、类可以继承产生儿孙类。
我们不可能也没必要去了解所有的“类”，但R语言定义的一些基本数据类得了解，而且得较详细地了解。这包括向量、因子、矩阵、列表、数据框和一些特殊值数据。
一、向量（vector）
我们通常接触的数据主要是数字、字符和逻辑（真和假，是或不是）类型的。数据有一个个的，也有一串串一批批的。在R里面，最基本的数据类是向量，即一串有序数据；但vector是虚拟类，没有父类型，它包含了在其他语言里面常说的基本数据类型如整型、字符型和逻辑型等:
&&getClass("vector")
Virtual&Class&"vector"&[package&"methods"]
No&Slots,&prototype&of&class&"logical"
Known&Subclasses:&#已知子类
Class&"logical",&directly
Class&"numeric",&directly
Class&"character",&directly
Class&"complex",&directly
Class&"integer",&directly
Class&"raw",&directly
Class&"expression",&directly
Class&"list",&directly
Class&"structure",&directly,&with&explicit&coerce
Class&"array",&by&class&"structure",&distance&2,&with&explicit&coerce
Class&"matrix",&by&class&"array",&distance&3,&with&explicit&coerce
Class&"signature",&by&class&"character",&distance&2
Class&"className",&by&class&"character",&distance&2
Class&"ObjectsWithPackage",&by&class&"character",&distance&2
Class&"mts",&by&class&"matrix",&distance&4,&with&explicit&coerce
Class&"ordered",&by&class&"factor",&distance&3
Class&"namedList",&by&class&"list",&distance&2
Class&"listOfMethods",&by&class&"namedList",&distance&3
R语言处理数据的最基本单位是向量，而不是原子数据。所以向量又称为原子向量（atomic
vector），R语言的数据单位里面它最小（也最大，没有谁是它的父母）。但由于vector是虚拟类，不管用什么方式你都不可能获得类型名称叫“vector”的对象，只能获得它的直接子类的对象。下面的x是一个矩阵，虽然我们用as.vector函数进行转换，但获得对象的类名称是integer而不是vector：
& x &- matrix(1:4, nrow=2)
& class(x)
[1] "matrix"
& class(as.vector(x))
[1] "integer"
一个向量可以是一串数字（n个数字，向量长度为n），也可以是1个数字（向量长度为1）：
&[1]&&1&&2&&3&&4&&5&&6&&7&&8&&9&10&11&12&13&14&15&16&17&18&19&20&21&22&23&24
[25]&25&26&27&28&29&30&31&32&33&34&35&36&37&38&39&40
等于号可以用于向量赋值，但符号“&-”更常用，更好，更专业：
&&x&&-&c(1,2,3)
&&y&&-&c("赵匡胤",&"钱学森",&"孙思邈")
[1]&"赵匡胤"&"钱学森"&"孙思邈"
是R的一个函数，表示将括号里面的内容连接起来成为一个向量。R提供了一些产生特殊向量的函数，如seq(&)和rep(&)，具体用法直接在R里面先输
入问号（?）和函数名去查询。vector是虚拟类，本身不指定数据的存储类型，但赋值以后就马上会有数字型（numeric）、字符型
（character）、逻辑型（logical）等实际类别，比如上面的变量x和y，用class(&)函数获得的类型分别是数值型和字符型：
&&class(x)
[1]&"numeric"
&&class(y)
[1]&"character"
一个向量只属于一种类型，如果改变了一个元素的值可能会改变该向量的类型：
&&x&&-&seq(10)
[1]&&1&&2&&3&&4&&5&&6&&7&&8&&9&10
&&class(x)
[1]&"integer"
&&x[2]&&-&"Adam"
[1]&"1"&&&&"Adam"&"3"&&&&"4"&&&&"5"&&&&"6"&&&&"7"&&&&"8"&&&&"9"&&&&"10"&
&&class(x)
[1]&"character"
向量元素的引用/提取用下标法如&x[2]，R语言的下标从1开始编号（而不是0）。
二、因子（factor）
R定义了一类非常特殊的数据类型：因子。比如我们的实验获得了10个数据，前5个数据来自对照样品CK，其余属于处理样品TR，R语言中可以用下面方法标识这10个数据的样品属性：
&&sample&&-&rep(c("CK","TR"),&each=5)
&&sample&-&factor(sample)
&[1]&CK&CK&CK&CK&CK&TR&TR&TR&TR&TR
Levels:&CK&TR
因子的种类称为水平（level）。上面的样品sample因子有两个水平：CK和TR。因子类数据很特殊：
&&getClass("factor")
Class&"factor"&[package&"methods"]
Slots:&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&
Name:&&& .Data&& levels&&& .S3Class
Class:&&&integer&character&character
Class&"integer",&from&data&part
Class&"oldClass",&directly
Class&"numeric",&by&class&"integer",&distance&2
Class&"vector",&by&class&"integer",&distance&2
Known&Subclasses:&"ordered"
使用因子类数据是因为R是针对统计应用的语言。使用因子以后，数据的统计会完全不同。比如上面的两个样品10个测定数值如果是：
&&value&&-&rnorm(10)
&[1]&&1.&-1.&&0.&&0.&&1.&-0.
&[7]&-0.&&1.&-0.&-0.
求样品的平均值就可以这么做：
&&tapply(value,&sample,&mean)
&&&&&&&&&CK&&&&&&&&&&TR&
gl(&)函数也可以方便地产生因子：
&&sample&&-&gl(2,&5,&labels&=&c("CK",&"TR"))
&[1]&CK&CK&CK&CK&CK&TR&TR&TR&TR&TR
Levels:&CK&TR
三、矩阵（matrix）
矩阵的继承关系比较复杂，它和数组（array）的关系既是父亲又是儿子，还是孙子：
&&getClass("matrix")
Class&"matrix"&[package&"methods"]
No&Slots,&prototype&of&class&"matrix"
Class&"array",&directly
Class&"structure",&by&class&"array",&distance&2
Class&"vector",&by&class&"array",&distance&3,&with&explicit&coerce
Known&Subclasses:&
Class&"array",&directly,&with&explicit&test&and&coerce
Class&"mts",&directly
如果你愿意，也可以把矩阵称为数组，但事实上它们是不同的类。生物类数据以二维数组/矩阵居多。
向量数据可以转成矩阵，下面代码将10个元素的x转成2行5列的矩阵：
&&x&&-&1:10
&&dim(x)&&-&c(2,5)
&&&&&[,1]&[,2]&[,3]&[,4]&[,5]
[1,]&&&&1&&&&3&&&&5&&&&7&&&&9
[2,]&&&&2&&&&4&&&&6&&&&8&&&10
dim(&)是一个函数，它获取或设置数据的维度。注意x数据的行列排列顺序：先列后行。但是矩阵内数据的下标读取方式是先行后列。x[2,&1]是第2行第1列的值，x[2,&]表示第2行的所有数据，x[&,2]表示第2列的所有数据。
[1]&&2&&4&&6&&8&10
把1个向量转成矩阵还可以使用matrix(&)函数，参数nrow设置行数，ncol设置列数：
&&matrix(1:10,&nrow=2)
&&&&&[,1]&[,2]&[,3]&[,4]&[,5]
[1,]&&&&1&&&&3&&&&5&&&&7&&&&9
[2,]&&&&2&&&&4&&&&6&&&&8&&&10
几个长度相同的向量也可以合并到一个矩阵，cbind(&)函数将每个向量当成一列（按列）合并，rbind(&)按行合并：
&&x&&-&3:6
&&y&&-&4:7
&&z&&-&1:4
&&cbind(x,y,z)
&&&&&x&y&z
[1,]&3&4&1
[2,]&4&5&2
[3,]&5&6&3
[4,]&6&7&4
&&rbind(x,y,z)
&&[,1]&[,2]&[,3]&[,4]
x&&&&3&&&&4&&&&5&&&&6
y&&&&4&&&&5&&&&6&&&&7
z&&&&1&&&&2&&&&3&&&&4
不同向量的数据类型要相同，否则转换成矩阵后数据类型会变样。下面代码将height内的数字全都转成了字符类型，这可能不是你想要的结果：
&&name&&-&c("赵匡胤",&"钱学森",&"孙思邈")
&&height&&-&c(172,&175,&168)
&&info&&-&rbind(name,height)
&&&&&&&[,1]&&&&&[,2]&&&&&[,3]&&&&
name&&&"赵匡胤"&"钱学森"&"孙思邈"
height&"172"&&&&"175"&&&&"168"&&
&&class(info)
[1]&"matrix"
身高是数值，但跟姓名混合组成矩阵后就变成字符型了（输出结果中用双引号引起来）。
矩阵元素可通过下标引用,多维矩阵可以只用一个下标，请注意info[3]获得的数据：
&&info[1,]
[1]&"赵匡胤"&"钱学森"&"孙思邈"
&&info[,1]
&&&&name&&&height&
"赵匡胤"&&&&"172"&
[1]&"钱学森"
四、列表（list）
列表由向量直接派生而来，nameList是它的子类，listOfMethods是它家孙子：
&&getClass("list")
Class&"list"&[package&"methods"]
No&Slots,&prototype&of&class&"list"
Extends:&"vector"
Known&Subclasses:&
Class&"namedList",&from&data&part
Class&"listOfMethods",&by&class&"namedList",&distance&2
那么列表是什么样子的呢？看这：
&&gene&&-&list(agi="AT1G00010",&gene.mode=c("AT1G00010.1",&"AT1G00010.2",&"AT1G00010.3"),&expression=matrix(1:10,&ncol=2))
[1]&"AT1G00010"
$gene.mode
[1]&"AT1G00010.1"&"AT1G00010.2"&"AT1G00010.3"
$expression
&&&&&[,1]&[,2]
[1,]&&&&1&&&&6
[2,]&&&&2&&&&7
[3,]&&&&3&&&&8
[4,]&&&&4&&&&9
[5,]&&&&5&&&10
列表可以组合不同的数据类型，甚至可以是其他列表，各组成数据的类、长度、维数都可以不一样。
五、数据框（data&frame）
语言中，一个矩阵内的数据类型要求都要相同，这对生物类数据不大适用，因为我们的数据经常是既有数字又有字符类标记。R语言提供了另外一种更灵活的数据类
型：数据框。可以将几个不同类型但长度相同的向量用data.frame(&)函数合并到一个数据框，它的模样就像二维数组。但要注意：合并的几个向量长
度必需一致。
&&name&&-&c("赵匡胤",&"钱学森",&"孙思邈")
&&height&&-&c(172,&175,&168)
&&info&&-&data.frame(name,height)
&&&&name&height
1&赵匡胤&&&&172
2&钱学森&&&&175
3&孙思邈&&&&168
用as.data.frame(&)函数可以将二维矩阵转成数据框，但鉴于矩阵的数据类型限制，在生物类数据中用得少一些。
虽然数据框的外观和二维矩阵差不多，但它却不是从矩阵而是从列表派生来的，它是数据（.data）是列表数据，列名称（names）就是列表中各项的名称，另外还有行名称（row.names）：
&&getClass("data.frame")
Class&"data.frame"&[package&"methods"]
Slots:&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&
Name:&&&&&&&&&&&&&&&&.Data&&&&&&&&&&&&&&&names&&&&&&&&&&&row.names
Class:&&&&&&&&&&&&&&&&list&&&&&&&&&&&character&data.frameRowLabels
Name:&&&&&&&&&&&&&.S3Class
Class:&&&&&&&&&&&character
Class&"list",&from&data&part
Class&"oldClass",&directly
Class&"data.frameOrNULL",&directly
Class&"vector",&by&class&"list",&distance&2
数据框的每列是一个向量，称为列向量。列向量只有两种类型，要么是数字型，要么是因子型。从文件读取或其他类型数据转换成数据框的数据，如果不是数值型，会被强制转换成因子型。有时候数值型（尤其是整型）向量也会被转成因子，这点应该注意。
数据框可以用数字下标取数据，也可以用列名称下标取数据，但是两种方式所获数据的类型是不一样的，按列名称下标方式取得的数据仍然是数据框：
&&info[,1]
[1]&赵匡胤&钱学森&孙思邈
Levels:&钱学森&孙思邈&赵匡胤
&&class(info[,1])
[1]&"factor"
&&info["name"]
&&class(info["name"])
[1]&"data.frame"
为什么要注意这个区别？因为看起来像是同样的数据，在一些对类型要求很严格的操作（比如作图）中得到完全不一样的结果。数据框还有一种数据提取方式，得到因子或向量：
&&class(info$name)
[1]&"factor"
&&class(info$height)
[1]&"numeric"
六、特殊值数据
为确保所有数据都能被正确识别、计算或统计等，R定义了一些特殊值数据：
NULL：空数据
NA：表示无数据
NaN：表示非数字
inf：数字除以0得到的值
判断一个object&（x）是不是属于这些类型有相应的函数：
is.null(x)
is.infinite(x)
七、获取数据类型信息的一些有用函数
R语言的对象“类”很多，虽然我们不可能一一去详细学习，但接触到一类新数据时我们需要了解一些基本信息才能进行进一步的操作。R提供了一些非常有用的方法（函数）。
getClass(&)函数我们前面已经见过了，它的参数是表示类的字符串。
class(&)可获取一个数据对象所属的类，它的参数是对象名称。
str(&)可获取数据对象的结构组成，这很有用。
mode(&)和storage.mode(&)可获取对象的存储模式。
typeof(&)获取数据的类型或存储模式。
要了解这些函数能干什么可以在R里面查询，方法是用问号加上面的函数名就可以，如：?str
已投稿到：
以上网友发言只代表其个人观点，不代表新浪网的观点或立场。

如何用R语言标记一列变量中大于前一个变量10%的数，比如用虚拟变量陷阱1标记

我要回帖

更多关于虚拟变量陷阱的文章

随机推荐

如何用R语言标记一列变量中大于前一个变量10%的数，比如用虚拟变量陷阱1标记

我要回帖

更多关于 虚拟变量陷阱 的文章

随机推荐

更多关于虚拟变量陷阱的文章