SPSSspss中如何筛选数据去掉重复数据

羽毛球技术 | 体育赛事 | 英文歌曲 | 住宅风水 | 用户界面设计师 | 六爻 | 书籍改编电影 | 德国足球甲级联赛 | 欧美明星 | PLC | 中国足球 | aj1 | 国家队 | 拜仁慕尼黑足球俱乐部 | 小说创作 | 配音 | iOS应用 | NBA 2K | 古典音乐 | 面相 | 火影忍者 | 武汉大学 | 土拨鼠 | 营销策划 | 秦时明月之天行九歌 | 设计师 | 巴塞罗那足球俱乐部 | 尤文图斯 | 实况足球（游戏） | 少帅 | 罗玉凤 | 比利时 | 跑鞋 | 冷知识 | 肖战 | 李元胜 | 古琴 | 按键精灵 | 罗兰 | 徐波 | 激光手术 | 角色扮演 | 关晓彤 | 微电影 | safari | 北京国安 | 古汉语 | 曼彻斯特联 | 玄幻小说 | 科幻小说 | 双眼皮手术 | 主题曲 | 年会 | 检测仪 | 徒步 | 互联网公司 | 百度输入法 | 镜头 | 宜昌市 | 自拍 | 金蝶 | 电子烟 | 网站建设 | 广播体操 | 文身 | nba篮球 | 索尼(sony) | 天体物理学 | 痛风 | 象棋 | 牛皮癣 | 皮肤护理 | 周星驰（人物） | 试管婴儿 | 亚足联亚洲杯（AFC Asian Cup） | 健美 | 美术生 | 迅雷（软件） | 战斗机 | 穿越小说 | 张璐 | 姓氏 | 诸葛亮 | 后宫·甄嬛传（书籍） | 虎牙直播 | snh48 | 阿迪达斯 | 投影仪 | 组装机 | 微信群 | 阿迪达斯(adidas) | 网球王子 | 分子生物学 | 耽美 | 武磊 | 婚礼 | 表演 | 中国武术 | 动画电影 | Air Jordan | 张子枫 | 免费软件 | 相声演员 | 摩羯座 | 宿舍 | ansys | 法国足球甲级联赛 | 户外 | 剧场版 | 杨凡 | 科幻电影 | galgame | 融资 | 关节炎 | NBA季后赛 | 神话 | 王力宏（人物） | 建模 | 计算机病毒 | 广州恒大淘宝足球俱乐部 | 北京奥运会 | 电脑电源 | 百度翻译 | 字幕 | 讯飞输入法 | 海关 | 易烊千玺 | 深度学习 | 编辑器 | 澳门特别行政区 | 直播 | 流氓软件 | 事故 | 大片 | 李景亮 | 郭富城 | 日语歌曲 | 卡牌游戏 | 小品 | 东京 | 花卉 | 音乐剧 | 互联网创业 | 占卜 | 羽毛球拍 | 婆媳关系 | 日本动画 | 巴黎 | 拳击比赛 | 东南亚 | 足球经理（FM）（游戏） | youtube | 胡歌（演员） | 地铁跑酷 | 植发 | 张继科 | 三国 | 用户界面 | 演技 | 百度竞价 | 青梅竹马 | 移动硬盘 | 韩晓鹏 | 马龙 | 瘦腿 | 宠物医疗 | 巨蟹座 | 徐峥 | 天蝎座 | 胸肌 | 赵丽颖（演员） | adidas阿迪达斯 | 低音炮 | 星际争霸（游戏） | 豆瓣电影 | 微信开放平台 | 手绘 | 吉他学习 | 江苏卫视 | 模特 | 创意 | 团队管理 | 奢侈品 | 王源 | TANK | 笛子 | 偶像 | 莱斯特城 | 维生素 | 新百伦 | 国际物流 | 前女友 | 李小龙 | 华语流行音乐 | 猎头公司 | crm | 搏击项目 | 网站运营 | 鼻炎 | 篮球游戏 |

你的位置：网站首页 >> 频道首页 >> >>SPSSspss中如何筛选数据去掉重复数据

SPSSspss中如何筛选数据去掉重复数据

来源：蜘蛛抓取(WebSpider) 时间：2014-10-23 10:14 标签：

&& 查看话题
spss软件数据分析，怎样实现三个重复之间的显著性差异比较？
最近在做单因素的数据分析，实验时，每个水平都有三个重复，怎样用spss软件来实现这三个数据之间是否有显著性差异的比较？或者用其他的方法，有木有？急！各位大侠帮帮俺！
分析-比较均值-单因素anova-选择因素，然后检查方差齐性
选择适合的分析方法检测不同水平间的差异性。
同一个水平中的三个数据无法检查差异性平行数据之间不用比较差异性吧？你说的是因素之间的差异性吧，要是这样的话，用文字不太好描述，你随便找个教程都有的，模仿着做比较简单。要是找不到可以传给你一份 : Originally posted by hnwjj87 at
平行数据之间不用比较差异性吧？你说的是因素之间的差异性吧，要是这样的话，用文字不太好描述，你随便找个教程都有的，模仿着做比较简单。要是找不到可以传给你一份是的是这样的把因子放一列，然后实验数据放一列（原始数据，不要放平均值），然后按照二楼的方法，选单因素ANOVA方差分析，在弹出的对话框中，根据你实验要求选择重复检验的方法，然后执行就行了 : Originally posted by hnwjj87 at
平行数据之间不用比较差异性吧？你说的是因素之间的差异性吧，要是这样的话，用文字不太好描述，你随便找个教程都有的，模仿着做比较简单。要是找不到可以传给你一份那，在试验的所有单因素里面怎样选择对实验结果影响比较重要的几个因素？用SPSS分析之后，是根据P值的大小来判断吗？做重复应该是为了减小每个水平自身所带来的误差，只需求出3个数据的平均值即可，不需要进行显著性差异的比较，不知道我的理解对不对 : Originally posted by 马奇虎 at
做重复应该是为了减小每个水平自身所带来的误差，只需求出3个数据的平均值即可，不需要进行显著性差异的比较，不知道我的理解对不对是这样的，但是我做的三个重复之间数值差别较大，作图插入的误差线太长，是不是实验结果就不准确，这样的图能发文章吗？ : Originally posted by junnan123 at
是这样的，但是我做的三个重复之间数值差别较大，作图插入的误差线太长，是不是实验结果就不准确，这样的图能发文章吗？... 你可以用均值作图啊，没必要把所有数据展示出来 : Originally posted by junnan123 at
那，在试验的所有单因素里面怎样选择对实验结果影响比较重要的几个因素？用SPSS分析之后，是根据P值的大小来判断吗？... 每个因素不同水平间的数据是否有显著性是用p值来表示的，用spss分析的时候可直接选定是P〈0.05或〈0.01. 二楼正解，可以采用单因素方差分析，我这边从网上下了点资料，:hand:要的话可以把邮箱发给我，给你发过去。:hand: : Originally posted by junnan123 at
那，在试验的所有单因素里面怎样选择对实验结果影响比较重要的几个因素？用SPSS分析之后，是根据P值的大小来判断吗？... p&0.01肯定极其重要了，&0.05重要，&0.05就不重要不知道对不对，希望大家批评，求回应 : Originally posted by 随风而逝szw at
二楼正解，可以采用单因素方差分析，我这边从网上下了点资料，:hand:要的话可以把邮箱发给我，给你发过去。:hand: 真的吗？那真是太好了、我的邮箱是看你问的真纠结啊，就问你个很现实的问题1,2中间有差异吗？但是1&&2& &3 与 1.5&&2&&2.5这两组数据之间有差异吗？用spss分析的时候& &是一组数据与另一组数据的分析&&不是一个数与另一个数的比较&&那样没意义。你一个水平为什么做3个重复？你会回答：减少误差。怎么就减少误差？实质上就是验证数据的准确性，保证数据不会因为误差因素过大使得实验出现非正常结果 : Originally posted by 雨中的雕塑 at
看你问的真纠结啊，就问你个很现实的问题1,2中间有差异吗？但是1&&2& &3 与 1.5&&2&&2.5这两组数据之间有差异吗？用spss分析的时候& &是一组数据与另一组数据的分析&&不是一个数与另一个数的比较&&那样没意义。你一 ... 你好
可是确实有 2个数之间的比较，即最大值与最小值的比较，
在溫忠麟、叶宝娟的《有调节的中介模型检验方法：竞争还是替补?》一文中，有如下：
“中介效应(a1+a3U)(b1+b2U)是U 的二次函数, 在有了系
数估计值后, 可以在U 值正常区间(例如均值上下
两个标准差)内计算二次函数最大值和最小值, 使
用Bootstrap 法检验它们的差异。如果(a1+a3U)
(b1+b2U)的最大值和最小值之差显著, 则中介效应
受到调节, 并做出报告。”
我现在一直苦恼怎么做···基础不好 : Originally posted by azaz432 at
可是确实有 2个数之间的比较，即最大值与最小值的比较，
在溫忠麟、叶宝娟的《有调节的中介模型检验方法：竞争还是替补?》一文中，有如下：
“中介效应(a1+a3U)(b1+b2U)是U 的二次函数, 在有了系
数估 ... 亲，我们说的是一个问题吗？粗略的看了一下，你说的中介效应好吗？这可不是两个数的比较，统计分析是建立在一定数据基础上从而对某些事物的发展方向或者事物之间的影响给出数学的证明，我的理解是这样。中介效应是说的M为中介，由A产生的，然后对B产生影响，最这个过程中B肯定间接的受到A数据的影响，但是是否M这个中介对B产生其他调节性影响你并不知道，所以这个公式就是检验中介效应是否受调节的公式。你说的这篇文献也是在检验中介效应的，目测你有误解。Bootstrap法检验是把所有数据利用这个公式算一遍，然后看最大值与最小值的距离，差值越大说明中介M对B调节的越多，而差值越小说明，M对B调节的越少而数据的产生大部分是由于A数据导致的。再强调点，统计不是研究2个个体之间的差异的。比如你要研究20岁男性的平均身高是否大于20岁女性的平均身高，你不可能用一个样本代表一个群体。至于选择多少，是根据你研究的两个群体的总量大小来确定的。比如你研究一个大学中20岁男性的身高是否显著大于20岁女性，或者一个国家20岁男性的身高是否显著大于20岁女性，又或者全球20岁男性身高是否显著大于20岁女性，你随机抽取的样本量是不一样的。
var cpro_id = 'u1216994';
欢迎监督和反馈：本帖内容由
提供，小木虫仅提供交流平台，不对该内容负责。欢迎协助我们监督管理，共同维护互联网健康，如果您对该内容有异议，请立即发邮件到
联系通知管理员，也可以通过QQ周知，我们的QQ号为：8835100
我们保证在1个工作日内给予处理和答复，谢谢您的监督。
小木虫，学术科研第一站，为中国学术科研研究提供免费动力
广告投放请联系QQ： &
违规贴举报删除请联系邮箱：或者 QQ:8835100
Copyright &
eMuch.net, All Rights Reserved. 小木虫版权所有统计分析学习，SPSS数据分析，R语言数据分析，Python数据分析，SAS统计分析...
最近一直想入门数据分析的小伙伴问我，如果要入事数据分析一直来说要学那些语言呢？其实小编跟企业部门部门与侯选人接触下来，给我的感觉是对于这个初级的数据分析师来，一般前二年做差不多都是老大让你做的是处理临时需求为主，如果小明给我做个报表，给市场部那边拉一些流量情况，所以主要前两年可能如果精通SQL与EXCEL再会点SPSS就差不多了，2年以后，老大会把一些:经营性分析需求与竞品分析给你，这里你可能你要...
今天发现一个很不错的博客()，博主致力于研究R语言在数据挖掘方面的应用
下面列出了可用于数据挖掘的R包和函数的集合。其中一些不是专门为了数据挖掘而开发，但数据挖掘过程中这些包能帮我们不少忙，所以也包含进来。
常用的包： fpc，cluster，pvclust，mclust
基于划分的方法: kmean...
5.1　SAS表达式简介
　　１．SAS常数表达式
　　(1)数值常数　如: 1.23、 -5、 0.5E-10。
　　(2)字符常数　如: name1='TOME'、 name2='MARY'、name3='JOHN'。
　　(3)日期(d)、时间(t)、日时(dt)常数　如: d1='01JAN80'd、t1='9:25:19't、
　　dt1='18JAN80:9:27:05'dt...
SPSS.NET .NET FOR SPSS 生成SPSS数据(.sav)文件
C#使用SPSS.NET操作SPSS数据文件
SPSS二次开发（.NET平台）...
中午与一同事吃饭，他是在学数据统计和数据挖掘的，所以他对SPSS和SAS非常熟练，跟他交流中无意中了解到统计分析中与软件开发相关的知识。首先，听他说SPSS被IBM收购后，加强了与各方面的支持，包括现在支持python和.net去编写和调用SPSS，未来可能支持更多，对于做软件开发人来说未来只要学习点统计分析的知识，也可以用自己熟悉的语言去做一些统计模型的工作了。另外一个就是听他说还有一种语言跟S...
访问：305662次
积分：5061
积分：5061
排名：第2164名
原创：184篇
转载：73篇
评论：191条
关注互联网、移动互联网、大数据分析
联系邮箱：
(2)(2)(1)(1)(1)(1)(1)(2)(1)(5)(2)(1)(6)(1)(1)(3)(1)(2)(2)(1)(3)(3)(8)(3)(2)(6)(3)(6)(2)(7)(3)(2)(8)(5)(3)(2)(6)(7)(19)(10)(3)(3)(7)(3)(5)(6)(6)(7)(14)(28)(1)(2)(2)(2)(3)(6)(12)(3)(2)查看: 1559|回复: 4
阅读权限18威望0 级论坛币295 个学术水平0 点热心指数0 点信用等级0 点经验172 点帖子14精华0在线时间21 小时注册时间最后登录
积分 46, 距离下一级还需 39 积分
道具: 彩虹炫, 雷达卡, 热点灯, 雷鸣之声, 涂鸦板, 金钱卡, 显身卡下一级可获得
权限: 自定义头衔
购买后可立即获得
权限: 隐身
道具: 金钱卡, 雷鸣之声, 彩虹炫, 雷达卡, 涂鸦板, 热点灯
我要处理个大约2万条信息的数据框，但是突然发现里面有些重复的数据，必须把重复的数据抛出，教授催得紧，我实在想不出办法。请高手们指导一下，不胜感激。
大概如下面表格的结构，要分别去掉每个公司中重复的数据。
年月公司名利率 2000 1 A a 2000 1 A a 2001 2 A b 2001 3 A c 2000 1 B d 2000 2 B e 2000 2 B e
R中有函数可以做到吗，还是必须写程序控制，
载入中......
阅读权限28威望0 级论坛币1720 个学术水平29 点热心指数42 点信用等级9 点经验15469 点帖子310精华0在线时间681 小时注册时间最后登录
积分 1030, 距离下一级还需 345 积分
权限: 自定义头衔, 签名中使用图片, 隐身
道具: 彩虹炫, 雷达卡, 热点灯, 雷鸣之声, 涂鸦板, 金钱卡, 显身卡, 匿名卡, 抢沙发下一级可获得
权限: 设置帖子权限道具: 提升卡
购买后可立即获得
权限: 隐身
道具: 金钱卡, 雷鸣之声, 彩虹炫, 雷达卡, 涂鸦板, 热点灯
苦逼签到天数: 34 天连续签到: 4 天[LV.5]常住居民I
用unique函数即可
阅读权限18威望0 级论坛币295 个学术水平0 点热心指数0 点信用等级0 点经验172 点帖子14精华0在线时间21 小时注册时间最后登录
积分 46, 距离下一级还需 39 积分
道具: 彩虹炫, 雷达卡, 热点灯, 雷鸣之声, 涂鸦板, 金钱卡, 显身卡下一级可获得
权限: 自定义头衔
购买后可立即获得
权限: 隐身
道具: 金钱卡, 雷鸣之声, 彩虹炫, 雷达卡, 涂鸦板, 热点灯
谢谢，我去试试。
阅读权限30威望0 级论坛币10 个学术水平3 点热心指数18 点信用等级0 点经验24747 点帖子963精华0在线时间412 小时注册时间最后登录
积分 1453, 距离下一级还需 772 积分
权限: 自定义头衔, 签名中使用图片, 设置帖子权限, 隐身
道具: 彩虹炫, 雷达卡, 热点灯, 雷鸣之声, 涂鸦板, 金钱卡, 显身卡, 匿名卡, 抢沙发, 提升卡下一级可获得
权限: 设置回复可见道具: 沉默卡
购买后可立即获得
权限: 隐身
道具: 金钱卡, 雷鸣之声, 彩虹炫, 雷达卡, 涂鸦板, 热点灯
开心签到天数: 271 天连续签到: 1 天[LV.8]以坛为家I
unique( )& && && && && &
不过之后要重新整理数据格式
最好的医生是自己，最好的药物是时间……
阅读权限32威望0 级论坛币2191 个学术水平49 点热心指数73 点信用等级36 点经验77981 点帖子1196精华0在线时间1164 小时注册时间最后登录
积分 2505, 距离下一级还需 1095 积分
权限: 自定义头衔, 签名中使用图片, 设置帖子权限, 隐身, 设置回复可见
道具: 彩虹炫, 雷达卡, 热点灯, 雷鸣之声, 涂鸦板, 金钱卡, 显身卡, 匿名卡, 抢沙发, 提升卡, 沉默卡下一级可获得
道具: 千斤顶
购买后可立即获得
权限: 隐身
道具: 金钱卡, 雷鸣之声, 彩虹炫, 雷达卡, 涂鸦板, 热点灯
苦逼签到天数: 133 天连续签到: 1 天[LV.7]常住居民III
& & 年月公司名利率
1 2000&&1& && &A& & a
2 2000&&1& && &A& & a
3 2001&&2& && &A& & b
4 2001&&3& && &A& & c
5 2000&&1& && &B& & d
6 2000&&2& && &B& & e
7 2000&&2& && &B& & e
& unique(rt)
& & 年月公司名利率
1 2000&&1& && &A& & a
3 2001&&2& && &A& & b
4 2001&&3& && &A& & c
5 2000&&1& && &B& & d
6 2000&&2& && &B& & e
& unique(rt,fromLast=TRUE)
& & 年月公司名利率
2 2000&&1& && &A& & a
3 2001&&2& && &A& & b
4 2001&&3& && &A& & c
5 2000&&1& && &B& & d
7 2000&&2& && &B& & e
以上是根据你的数据得到的，R中默认的是fromLast=FALSE,即若样本点重复出现，则取首次出现的；否则去最后一次出现的。列名不变，去掉重复样本值之后的行名位置仍为原先的行名位置。
共享是一种彼此的快乐
论坛好贴推荐打开微信扫一扫，关注圣才：
sc100xuexi
认证官方微博
认证官方微博
在SPSS里删除重复ID的记录
发布人：&&发布日期： 09:37&&共3993人浏览
如果在SPSS数据库里有一个变量是对case的编号，现在有可能某些case 是重复出现的，我想要将重复出现的case只保留一个，其余重复则删除掉，怎么完成这个任务？（除了手动的以外。）
　　SPSS13版或之后的Data菜单下有一个&Identifying Duplicate Cases&的程序，应该可以解决你的问题。但我没有用过那个程序，而是用下述的syntax写一个程序来做，自己写的程序放心一点，不会错杀无辜的个案。（注：以下syntax其中的&ROW&和&ROW2&是两个临时变量，事后可以删去。如果你case的编号变量名不叫&ID&，请修改ID。）
　　sort cases by ID.
　　compute ROW=$casenum.
　　aggregate outfile 'c：\temp.sav'/break ID/ROW2=first（ROW）.
　　match files file */table 'c：\temp.sav'/by ID.
　　select if ROW=ROW2.
　　delete variable ROW ROW2.
　　强烈建议你运行前，请先用下述模拟数据试一下，以检验上述程序是否对（即没有放过任何需要删的个案、也没有错删任何需要保留的个案）。
　　input program.
　　loop #i=1 to 10.
　　loop #j=1 to 3.
　　compute ID=#i.
　　end case.
　　end loop.
　　end loop.
　　end file.
　　end input program.
　　sort cases by ID.
　　compute ROW=$casenum.
　　aggregate outfile 'c：\temp.sav'/break ID/ROW2=first（ROW）.
　　match files file */table 'c：\temp.sav'/by ID.
　　select if ROW=ROW2.
　　delete variable ROW ROW2.
　　上述syntax的第1-11句生成一个含有两个变量（ID和ROW）、30个个案（其中仅10个独立个案，但每个个案重复3次）的数据（见下图数据a）。第12句将数据a中每三个重复个案中的第一条记录的ID和行序号ROW抽出来保存到临时文件temp.sav中（见数据b）。第13句将数据a和数据b合并成数据c。第14句将数据c中的ROW（即数据a中的行序号）与ROW2（即数据b中的每个个案第一行的行序号）相等者选出；也就是说，将ROW和ROW2不相等者（即每个个案的重复行）删除。最后，第15句将临时变量ROW和ROW2删除，结果就是你想要的数据d。
e书题库免费下载
推荐的课程SPSS简明教程实例及方法(相当有用)_百度文库
两大类热门资源免费畅读
续费一年阅读会员，立省24元！
评价文档：
喜欢此文档的还喜欢
SPSS简明教程实例及方法(相当有用)
SPSS简明教程实例及方法(相当有用)  方法步骤详细简介
阅读已结束，如果下载本文需要使用
想免费下载本文？
把文档贴到Blog、BBS或个人站等：
普通尺寸(450*500pix)
较大尺寸(630*500pix)
你可能喜欢

SPSSspss中如何筛选数据去掉重复数据

我要回帖

随机推荐