找回密码
 骑士注册

QQ登录

微博登录


随机数是骗人的,.Net、Java、C为我作证

2014-05-30 15:21    评论: 16 收藏: 7 分享: 6    

四、各语言的实现

    我们看到.Net的Random类有一个int类型参数的构造函数:

public Random(int Seed)

就是和我们写的MyRand一样接受一个"随机数种子"。而我们之前调用的无参构造函数就是给Random(int Seed)传递Environment.TickCount类进行构造的,代码如下:

 public Random() : this(Environment.TickCount)
 {
 }

    这下我们终于明白最开始的疑惑了。  

同样道理,在C/C++中生成10个随机数不应该如下调用:

int i; 
for(i=0;i<10;i++) 
{     srand( (unsigned)time( NULL ) );     printf("%d\n",rand()); }

 而应该:

srand( (unsigned)time( NULL ) ); //把当前时间设置为"随机数种子" 
int i; 
for(i=0;i<10;i++) 
{
    printf("%d\n",rand()); 
}

 五、"奇葩"的Java

Java学习者可能会提出问题了,在Java低版本中,如下使用会像.Net、C/C++中一样产生相同的随机数: 

for(int i=0;i<100;i++) 
{
     Random rand = new Random();
     System.out.println(rand.nextInt()); 
}

 因为低版本Java中Rand类的无参构造函数的实现同样是用当前时间做种子:

public Random() 
{
     this(System.currentTimeMillis()); 
} 

但是在高版本的Java中,比如Java1.8中,上面的"错误"代码执行却是没问题的:

    为什么呢?我们来看一下这个Random无参构造函数的实现代码:

public Random() 
{ 
    this(seedUniquifier() ^ System.nanoTime()); 
}
private static long seedUniquifier() { 
    for (;;) 
    { 
        long current = seedUniquifier.get(); 
        long next = current * 181783497276652981L; 
        if (seedUniquifier.compareAndSet(current, next))  return next; 
     } 
 } 
 
privatestaticfinal AtomicLong seedUniquifier  = new AtomicLong(8682522807148012L); 

     这里不再是使用当前时间来做"随机数种子",而是使用System.nanoTime()这个纳秒级的时间量并且和采用原子量AtomicLong根据上次调用构造函数算出来的一个数做异或运算。关于这段代码的解释详细参考这篇文章《解密随机数生成器(2)——从java源码看线性同余算法

最核心的地方就在于使用static变量AtomicLong来记录每次调用Random构造函数时使用的种子,下次再调用Random构造函数的时候避免和上次一样。

六、高并发系统中的问题

    前面我们分析了,对于使用系统时间做"随机数种子"的随机数生成器,如果要产生多个随机数,那么一定要共享一个"随机数种子"才会避免生成的随机数短时间之内生成重复的随机数。但是在一些高并发的系统中一个不注意还会产生问题,比如一个网站在服务器端通过下面的方法生成验证码:

Random rand = new Random();
Int code = rand.Next();

    当网站并发量很大的时候,可能一个毫秒内会有很多个人请求验证码,这就会造成这几个人请求到的验证码是重复的,会给系统带来潜在的漏洞。

     再比如我今天看到的一篇文章《当随机不够随机:一个在线扑克游戏的教训》里面就提到了"由于随机数产生器的种子是基于服务器时钟的,黑客们只要将他们的程序与服务器时钟同步就能够将可能出现的乱序减少到只有 200,000 种。到那个时候一旦黑客知道 5 张牌,他就可以实时的对 200,000 种可能的乱序进行快速搜索,找到游戏中的那种。所以一旦黑客知道手中的两张牌和 3 张公用牌,就可以猜出转牌和河牌时会来什么牌,以及其他玩家的牌。"  

    这种情况有如下几种解决方法:

  1. 把Random对象作为一个全局实例(static)来使用。Java中Random是线程安全的(内部进行了加锁处理);.Net中Random不是线程安全的,需要加锁处理。不过加锁会存在会造成处理速度慢的问题。而且由于初始的种子是确定的,所以攻击者存在着根据得到的若干随机数序列推测出"随机数种子"的可能性。
  2. 因为每次生成Guid的值都不样,网上有的文章说可以创建一个Guid计算它的HashCode或者MD5值的方式来做种子: new Random(Guid.NewGuid().GetHashCode()) 。但是我认为Guid的生成算法是确定的,在条件充足的情况下也是可以预测的,这样生成的随机数也有可预测的可能性。当然只是我的猜测,没经过理论的证明。
  3. 采用"真随机数发生器",快看下一节分解!

 七、真随机数发生器

    根据我们之前的分析,我们知道这些所谓的随机数不是真的"随机",只是看起来随机,因此被称为"伪随机算法"。在一些对随机要求高的场合会使用一些物理硬件采集物理噪声、宇宙射线、量子衰变等现实生活中的真正随机的物理参数来产生真正的随机数。

当然也有聪明的人想到了不借助增加"随机数发生器"硬件的方法生成随机数。我们操作计算机时候鼠标的移动、敲击键盘的行为都是不可预测的,外界命令计算机什么时候要执行什么进程、处理什么文件、加载什么数据等也是不可预测的,因此导致的CPU运算速度、硬盘读写行为、内存占用情况的变化也是不可预测的。因此如果采集这些信息来作为随机数种子,那么生成的随机数就是不可预测的了。

在Linux/Unix下可以使用"/dev/random"这个真随机数发生器,它的数据主来来自于硬件中断信息,不过产生随机数的速度比较慢。

Windows下可以调用系统的CryptGenRandom()函数,它主要依据当前进程Id、当前线程Id、系统启动后的TickCount、当前时间、QueryPerformanceCounter返回的高性能计数器值、用户名、计算机名、CPU计数器的值等等来计算。和"/dev/random"一样CryptGenRandom()的生成速度也比较慢,而且消耗比较大的系统资源。

当然.Net下也可以使用RNGCryptoServiceProvider 类(System.Security.Cryptography命名空间下)来生成真随机数,根据StackOverflow上一篇帖子介绍RNGCryptoServiceProvider 并不是对CryptGenRandom()函数的封装,但是和CryptGenRandom()原理类似。  

八、总结

有人可能会问:既然有"/dev/random" 、CryptGenRandom()这样的"真随机数发生器",为什么还要提供、使用伪随机数这样的"假货"?因为前面提到了"/dev/random" 、CryptGenRandom()生成速度慢而且比较消耗性能。在对随机数的不可预测性要求低的场合,使用伪随机数算法即可,因为性能比较高。对于随机数的不可预测性要求高的场合就要使用真随机数发生器,真随机数发生器硬件设备需要考虑成本问题,而"/dev/random"、CryptGenRandom()则性能较差。

万事万物都没有完美的,没有绝对的好,也没有绝对的坏,这才是多元世界美好的地方。 

via: http://www.cnblogs.com/rupeng/p/3723018.html 

12
查看其它分页:

最新评论

我也要发表评论

来自 - 辽宁沈阳 的 Chrome/Windows 用户 2015-06-10 09:29 回复
很明显!随机数种子就是当前时间,随机数序列a[]={12,12,1223,324524,245,435}是不变的,给这个数列加上一个偏移量(就是时间).其实就是一种平移.
toknow_linux 2014-06-27 22:20 回复
一切算法产生的随机都是伪随机
tenght 2014-06-19 14:08 回复
确实如此~
游客 2014-06-10 11:27 回复
哈哈,在我眼里,所谓的“真随机”依然是伪随机。伪随机利用数学算法,真随机利用物理随机事件。但是两者表
游客 2014-06-02 23:21 回复
请搜索梅森旋转算法
游客 2014-06-01 00:24 回复
骗子,流氓
炳晓彤xiaoB 2014-06-01 00:03  新浪微博网友评论 回复
@BuLL酱_傻又呆 这个好好玩 你一定要看呀
[1]
发表于 2014-05-30 22:48 的评论:
说实话:你这还是伪随机数。电脑真正的理论随机数是非常难模拟的。
游客 2014-05-31 00:09 回复
一般要进行物理实验
[1]
发表于 2014-05-30 21:18 的评论:
随机数不是出现随意的数据,而是数据出现的概率要相等。例如,随机数产生的结果是1、2、3、4、5、6,但是在
游客 2014-05-31 00:08 回复
不是相等
wangweizhu 2014-05-30 22:05 回复
醍醐灌顶!
到时候再起名字 2014-05-30 17:33  新浪微博网友评论 回复
@0o旋oo旋o0
Linux中国 2014-05-30 16:33  新浪微博网友评论 回复
[嘻嘻]//@farseerfc:講僞隨機的時候不提一下真隨機都是耍流氓!
farseerfc 2014-05-30 16:03  新浪微博网友评论 回复
講僞隨機的時候不提一下真隨機都是耍流氓!
晓張童學 2014-05-30 16:03  新浪微博网友评论 回复
原来如些啊

收藏

返回顶部

分享到微信

打开微信,点击顶部的“╋”,
使用“扫一扫”将网页分享至微信。