马太效应的数学描述
与布拉夫特一齐普夫分布系
李 洲 康 耀红
布位夫特定律 、 齐普夫定律和 洛持卡定律是计量情报学中的三大 定律 。 付于它
们 的研 完国 内外学者发
了大量的 文章 , 现在仍处 于争论之中 。 三大 定律最初 都是
通过时统计数据 的
而 得出的 。 它们赖 以 成立的机制 目前公认为是马太 效应影响
的结 果 。 本 文用马尔可夫过程理论时 马太效应进行 了数学描述 , 通过严 密的数学推
导 , 得 出 了一些 结果 , 对布拉夫特一 齐普夫分布 系作 了解释 ; 并和西 蒙的数学模
型作了比较 ; 最后 , 指 出 了一 些有待于今后研 究的问题 。
一 、 布拉夫特一齐普夫分布系
布拉夫特分布
R ( n ) = K ln ( 1 + ; 1 /
5 ) ( 1 ) K
, 5 为参数
R
, n )表示杂志按载文率高低排序之后 , n 级杂志以前所有杂志 发丧的相关论 义 总 数。
)目r ( n ) 丧示第 n 级杂志上发表的
数
r (n ) = R (n ) 一 R (n 一 1 )
、、,了
J.‘
= !、 11 , f
_
n + 、
一 \ 1 1 + S 一 令 r (: 1 ) = X
. 川 / u 十 S 、
* 二 l\ ‘n 、。石一二一 1 夕
n + S =
l 一 e 一 下
由 一j二K 近 似等 J“相关杂志总数 , 一般来讲K 是很大的 。
一 x / k _ x
工一 c 局下
k
11 + S = 一
X
王5
情 报 科 学 V o l . 7 N o 1 9 8 色
n + S
用相关论文总数 R 除等式两边 , 并令 P ( x ) 二
_签一 R
k一一一
P (X ) ==
C
n 十 S ( 2 )
此式当n充分大 时 , P (x )二盒服从负幕分布 。 下面证明指出 ( 1 ) 与 ( 2 ) 是全等价
的两个式子 , 故可把 (2 ) 式看作是 ( 1 ) 式的变形 。
由 ( 2 ) 成立 , 则有
X 二
K
n + S
第n 级杂志以前所有杂志发表的论文总数
R ( n )
K
11 一 l + S
K
1 + S
二 K
(;
+ 孟+ ~ 一众)一 K (}十孟‘ “ · + : )
ha 式
1 + 叠十 ; + ~ · + 二二 In n + b
b 为欧拉常数 , 约等 I: 0 . 5 7 7 2
R (n )澎 K In ( n + s ) + b 一 K In s 一 b
= K ln (1 + n /
s )
: 这就是 ( 1 ) 式 。
上 面的推导假定了 s为自然数 , 实际上对 s > O 也是成立的。
齐普夫分布
f = k / : (式中 k近似为常数 )
某篇文章 ‘卜一单词按频率出现的递减顺序排序之后 , 频率 f和序 一号r满足的关系方程 。
洛特 卜分布
r l 、 C
i 、人 , = 2盖 一
写 X 篇论文的作者的频率f(x )满足的方程。
显然 , 齐普夫分布和洛特卡分布服从负幂分布 , 所 以三大定律的分布都服从负幕分布
f( x ) = k / x 么 式中k和 P 为参数 。
布氏分 布、 齐普夫分布和洛特卡分布是很相似的 , 可 以看作是一个定律的不同 表 现 形
式。 布氏和齐氏分布是按某一具体事项在其主体来源中出现频率—位次而 导出的 , 而洛特卜分布仅仅是没有考虑位次而得到的 , 在许多社会领域内是一 种常见的分布现象 。 布—齐分布的特点在 一于我们所考察的具体对象的绝大多数集中于少数主题来源 。 资本主义国家的物
质财富集中在少数人手里 , 少数作者一生巨著连篇 , 大多数作者一生只能发表几篇文章 , 大
城 市总是人口密度大的地方。 为什么会产生这种现象呢 ? 据认为 , 在这方面存在着所谓 “ 一‘今
马太效应的效学描述与布拉夫特一齐普夫分布系
太效应 ” 。 根据是马太在新约 中写的 a. · ·⋯谁若有 , 就给他 , 并不断增加 , 而谁没有 , 则连
已有的都要被夺走 。 ” 按照这种说法 , 高产作者发表一篇文章十分容易 , 百万富翁要增加一点
收入毫无困难 , 声望高的杂志更易获得高质量的稿件 ; 大城市总是人们向往的地方 。 在自然
过程中 , 当一系列同类现象可供选择时 , 每一现象被选中的概率都是相等的。 例如 , 一个布
中有 R 个同样的刁、球 , 当你用手去摸时 , 每个球被摸中的概率都是责, 掷一枚均匀的硬币 , ; :
反面出现的概率各为合。 但在社会科学方‘的现象中 , 人的因素起很大作用 , 有的经常被选
中 , 有的很少选 中 , 而上一次选择的结果又会影响对 一F一次的选择结果。 下面将对这种 “成
功 ” 产生 “成功” 的现象进行描述 。
二 、 予备知识
在这里我们考虑的随机过程是时间连续的 、 状态离散的齐次马氏过程 。
设 { X (t ) , t 任 T }是上面定义的过程 , 根据定义 , T == 〔o , 一 oo ) , 令 N = { o , i ,
2
, ⋯ } X (t)任 N 。 用 P ;J ( , , t) 表示概率 P { X (t ) = j } X ( , ) = i } , 即已知 在 时
刻 : 时过程处于状态i , 当经过一段时间后 , 在时刻t的过程处于状态 j的概率 , 也称 为 转 移
概率。
设 。感 t : 感 t : 三⋯压 t、
11 , i : , i⋯ ⋯ i、 N
由马尔可夫性
P { X (t
、) = i
‘
I X (t
: ) = i :
,
X (t : ) = i : ⋯ , X (t一 : ) = ik一 :
= P { X (t
k
) = i , X (t
k一 : ) = i‘
. 一 :
}
由齐次性
P { X (t + h ) = j } X (t ) = i }
二 ’P { X (h ) = j } X ( o ) = i }
P
: ·
(h ) = P { X (h ) = j } X ( 0 )
=
P
: ,
(h ) = P
,
,(t
, t + h )
令则
因此在齐次的均合由P 、.(h )表示转移概率就足够了。
定理 1 下列的极限总存在
! i位
b, 吞+
1 气P ij(权) 玉 q i 三co
且对一切 , > 。 , 总有1 一挥一必’“
由于证明比较复杂 , 本文的定理都不会出证明 , 具体证明请看考参文献 。
定理 2 一F列极限总存在
情 报 科 学 v o ! . 7 N o . 盆 1 0 台6
1二m
t
‘卜 0 +架鱼三qij