欢迎您访问我爱IT技术网,今天小编为你分享的是oracle数据库教程:【利用ORACLE实现数据的抽样_Oracle_领测软件测试网】,通过学习这些教程,你能够更深层次的掌握Oracle数据库!
利用ORACLE实现数据的抽样_Oracle_领测软件测试网
数据准备:利用ORACLE实现数据抽样 做数据分析的,免不了碰到记录数据量很大,怎么办?做全面分析是不现实也没有必要。 介绍一下抽样方法及实现 几种常用的抽样方法:
数据准备:利用ORACLE实现数据抽样
做数据分析的,免不了碰到记录数据量很大,怎么办?做全面分析是不现实也没有必要。
介绍一下抽样方法及实现
几种常用的抽样方法:
1.简单随机抽样(simple random sampling)
将所有调查总体编号,再用抽签法或随机数字表随机抽取部分观察数据组成样本。
优点:操作简单,均数、率及相应的标准误计算简单。
缺点:总体较大时,难以一一编号。
2.系统抽样(systematic sampling)
又称机械抽样、等距抽样,即先将总体的观察单位按某一顺序号分成n个部分,再从第一部分随机抽取第k号观察单位,依次用相等间距从每一部分各抽取一个观察单位组成样本。
优点:易于理解、简便易行。
缺点:总体有周期或增减趋势时,易产生偏性。
3.整群抽样(cluster sampling)
先将总体依照一种或几种特征分为几个子总体(类。群),每一个子总体称为一层,然后从每一层中随机抽取一个子样本,将它们合在一起,即为总体的样本,称为分层样本
优点:便于组织、节省经费。
缺点:抽样误差大于单纯随机抽样。
4.分层抽样(stratified sampling)
将总体样本按其属性特征分成若干类型或层,然后在类型或层中随机抽取样本单位,合起来组成样本。有按比例分配和最优分配(过度抽样是否就是最优分配方法?)两种方案。
特点:由于通过划类分层,增大了各类型中单位间的共同性,容易抽出具有代表性的调查样本。该方法适用于总体情况复杂,各类别之间差异较大(比如金融客户风险/非风险样本的差异),类别较多的情况。
优点:样本代表性好,抽样误差减少。
我们需要使用抽样的方法从总量用户中随机抽取100W个样本记录。
down到本机然后进行sas抽样,不可能!
直接sas联机抽样,更不可能!
直接提交服务器进行抽样,然后链接到本机进行分析
现在介绍一下ORACLE抽样方法:
Oracle取随机数据实现
随机查看前N条记录
SELECT * FROM (SELECT * FROM TB_PHONE_NO ORDER BY SYS_GUID())
WHERE ROWNUM < 10;
SELECT * FROM (SELECT * FROM chifan ORDER BY dbms_random.random) WHERE ROWNUM<=5
SQL> SELECT * FROM (SELECT * FROM A SAMPLE(0.01)) WHERE ROWNUM<=1;
注意每次取得的值都不同。
SAMPLE 是随机抽样,后面的数值是采样百分比。
另附SAS 抽样实现
DATA COMMON.OTHER_200909(WHERE=(RANUNI(1)<.042));
SET COMMON.FIN_200909;
WHERE PV IS NULL;
RUN;
效率非常低,不推荐
关于利用ORACLE实现数据的抽样_Oracle_领测软件测试网的用户使用互动如下:
相关问题:自学软件测试
相关问题:Oracle中如何删除某个用户下的所有数据呢?
答:再sql*plus中使用system身份登陆数据库 然后执行下面语句: DROP USER user_name CASCADE; 这样你该用户包括该用户下的表,试图,同义词,过程,索引,及相关的一切就都不见了。 然后再新建一个同名用户,赋予相应权限就可以了。 祝好运~~ >>详细
相关问题:delphi中用intraweb做个系统,怎么调用oracle数据...
答:query1连接好Oracle数据库,拖一个个bitbtn控件到form上,在双击事件中写: procedure TForm1.BitBtn1Click(Sender: TObject); begin with Query1 do begin close; sql.Clear; sql.Add('insert into 数据库表 (栏位a,栏位b) values (:c,:d) '); ... >>详细
- 软件测试开发技术之Oracle数据库维护的前瞻性_Ora
- 数据库中教你如何修改ORACLE最大连接数_Oracle_领
- Oracle9i 数据库设计指引全集_Oracle_领测软件测
- 数据库中Oracle索引的优化设计_Oracle_领测软件测
- 化整为零访问大表的三种方式_Oracle_领测软件测试
- Oracle数据库编写有效事务指导方针_Oracle_领测软
- Oracle 数据库唯一约束中的NULL的处理_Oracle_领
- oracle字符集理解_Oracle_领测软件测试网
- Oracle数据库10gR2中stream多源复制方法_Oracle_
- oracle性能Statspack使用之命中率调整_Oracle_领
- 评论列表(网友评论仅供网友表达个人看法,并不表明本站同意其观点或证实其描述)
-
