NumPy 现在建议新代码使用
default_rng()
实例而不是 numpy.random
作为新代码,这一事实让我思考应该如何使用它来产生良好的结果,无论是性能方面还是统计方面。
第一个例子是我最初想写的:
import numpy as np
class fancy_name():
def __init__(self):
self.rg = np.random.default_rng()
self.gamma_shape = 1.0
self.gamma_scale = 1.0
def public_method(self, input):
# Do intelligent stuff with input
return self.rg.gamma(self.gamma_shape, slef.gamma_scale)
但我也考虑过在每个函数调用中创建一个新实例:
import numpy as np
class fancy_name():
def __init__(self):
self.gamma_shape = 1.0
self.gamma_scale = 1.0
def public_method(self, input):
# Do intelligent stuff with input
rg = np.random.default_rng()
return rg.gamma(self.gamma_shape, slef.gamma_scale)
第三种选择是将 rng 作为函数调用中的参数传递。这样,相同的 rng 也可以用在代码的其他部分。
这用于经常调用以采样的模拟环境,例如转换时间。
我想问题是这三种方法中的任何一种是否有论据以及是否存在某种实践?
此外,任何有关使用这些随机数生成器的更深入解释的参考(NumPy 文档和随机采样文章除外)都非常有趣!
default_rng()
不是单例。它创建了一个由默认 BitGenerator 类的 new 实例支持的 new 生成器。引用文档:
使用默认 BitGenerator (PCG64) 构造一个 new 生成器。
...
如果种子不是 BitGenerator 或 Generator,则会实例化一个 new BitGenerator。 此函数不管理默认的全局实例。
这也可以通过经验来测试:
In [1]: import numpy
In [2]: numpy.random.default_rng() is numpy.random.default_rng()
Out[2]: False
这个很贵。您通常应该在程序中调用一次
default_rng()
并将生成器传递给任何需要它的地方。 (是的,这很尴尬。)