数字分析是一种相对来说较新的计算机辅助审计技术,它有助于出单个数字和数字组合的异常重复或者数据中的其他情况。审计人员可以应用这一技术检查包含描述类似现象规模的数字的大量业务。 物理学家佛兰克·班夫得(Frank Benford)在20世纪20年代发现的班夫得定律(Benford’s law),是审计人员应用的一种最普通的数字分析形式。根据这一定律,一万或以上次交易中的每个数,其首位数字是“1”的机会要比是“2”的大,是“2”的机会要比是“3”的大,依此类推。也就是说,一个数中的首位数字预计出现的频率会随着这一数字数值的增加而减少。据班夫得定律,各数字预计出现于第一位和第二位的期望频率如下(精确到小数点后三位): 频 率
数字 | 首位数字 | 第二位数字 | 备注 |
0 | -- | 0.120 | |
1 | 0.301 | 0.114 | |
2 | 0.176 | 0.109 | |
3 | 0.125 | 0.104 | |
4 | 0.097 | 0.100 | |
5 | 0.079 | 0.097 | |
6 | 0.067 | 0.093 | |
7 | 0.058 | 0.090 | |
8 | 0.051 | 0.088 | |
9 | 0.046 | 0.085 | |
| | | |
当这一定律应用到舞弊调查时,合法的、未被改动的数据就应该遵循预期的频率,而与这些频率不符的数据则可能包含舞弊。然而,这些数据必须不包括预先设定上下限、分段或经过挑选的数值,例如政策数字或社会保险数字等。因为这一定律并不适用于这些事先指定的、有规律的信息。
无论是信用卡交易、合同值还是应收账款账户的数据,都应遵循班夫得定律。举个例子说,假设一个审计人员想要检查合同中数据的合法性。如果数字分析显示合同金额首位数字出现“4”的频率是16%,这将提醒审计人员警惕潜在的错误,因为这一数字出现于首位的期望频率是9.7%。对雇员办理的合同中所有首位数字是“4”的数进行详查,可能会发现某个人办理的金额在40000美元到49999美元内的合同要比预期的多。此时,审计人员就可集中审查这个雇员所签定的合同,寻舞弊的证据,例如合同分拆、未经批准直接签定合同或者存在利益冲突等。
即使在一些没有明确发现舞弊的例子中,数字分析也可揭示不寻常的趋势,提醒审计人员注意那些极少数的、可能反映问题的交易。但是,审计人员应用这一方法时要谨慎,毕竟这并不适用于所有数据分析的情况。
万苏林
本福特定律
,自由的百科全书
本福特定律说明一堆从实际生活得出的数据中,以1为首位数字的数的出现机率约为总数的三成,接近期望值1/9的紫禁城论坛3倍。推广来说,越大的数,以它为首几位的数出现的机率就越低。它可用于检查各种数据是否有。
在十进制首位数字的出现机率(%,小数点后一个位):
1. 30.1
2. 17.6
3. 12.5
4. 9.7
5. 7.9
6. 6.7
7. 5.8
8. 5.1
9. 4.6
目录 [隐藏] ∙ 1 数学 ∙ 2 不完整的解释 ∙ 3 应用 ∙ 4 历史 ∙ 5 另见 ∙ 6 参考 |
|
[编辑]
数学
本福特定律说明在b进制制中,以数n起头的数出现的机率为logb(n我们都是大导演 + 1) − logb(n)。本福特定律不但适用于个位数字,连多位的数也可用。
[编辑]
不完整的解释
一组平均增长的数据开始时,增长得较慢,由最初的数a增长到另一个数字a + 1起首的数的时间,必然比a + 1超导失超起首的数增长到a + 2,需要更多时间,所以出现率就更高了。
从数数目来说,顺序从1开始数,1,2,3,...,9,从这点终结的话,所有数起首的机会似乎相同,但9之后的两位数10至19,以1起首的数又大大抛离了其他数了。而下一堆9起首的数出现之前,必然会经过一堆以2,3,4,...,8起首的数。若果这样数法有个终结点,以1起首的数的出现率一般都比9大。
这个定律的严格证明,可以参见Hill, T. P. "A Statistical Derivation of the Significant-Digit Law." Stat. Sci. 10, 354-363, 1996.。
[编辑]
应用
lw25-126
1972年,Hal Varian提出这个定律来用作检查支持某些公共计划的经济数据有否欺瞒之处。1992年Mark J. Nigrini便在其博士论文"The Detection of Income Tax Evasion Through an Analysis of Digital Frequencies."(Ph.D. thesis. Cincinnati, OH: University of Cincinnati, 1992.)提出以它检查是否有伪帐。
推而广之,它能用于在会计、金融甚至选举中出现的数据。
若所用的数据有指定数值范围;或不是以机率分布出现的数据,如正态分布的数据;这个定律则不准确。
[编辑]
历史
1881年,天文学家西蒙·纽康伯发现对数表包含以1起首的数那首几页较其他页破烂。可是,
亦可以以任何书起首数页也会较破烂这个观点解释。这个故事可能是虚构的。
1938年,物理学家法兰克·本福特重新发现这个现象,还通过了检查许多数据来证实这点。
海淀走读大学[编辑]
另见
∙ 齐普夫定律
[编辑]
参考
∙ 2005年6月2日明报D15版,《假帐克星——本福特定律》,吴端伟博士[1]
∙ 部分翻译自本页英文版,以下为其参考:
∙ Frank Benford: The law of anomalous numbers, Proceedings of the American Philosophical Society, 78 (1938), p. 551
∙ Ted Hill: The first digit phenomenon, American Scientist 86 (July-August 1998), p. 358. 10页的pdf文件
∙ Hal Varian: Benford's law, American Statistician 26, p.65.
取自"/wiki/%E6%9C%AC%E7%A6%8F%E7%89%B9%E5%AE%9A%E5%BE%8B"
通用电器公司(GE)的物理学家Frank Benford于上世纪二十年代发现了一个令人震惊数学规律,即在任何一组给定的数据中,排在数据第一或第二位的数字是存有一个可预测到的概率。例如,在一组数据中1排在第一位的概率约为31%,而9排在第一位的概率仅有5%。Benford测试了多种来源的数据组发现存在这样的概率。
利用Benford发现的规律为审查会计开辟了一条思路(者的数据通常不会遵循Benford发现的统计规律)。目前这个定律相当便于用于定期检查会计账目,发现假账的基本思路正变得越来越流行。精准的软件配以高性能计算机使得人们较容易揭露财会文件内的数据。