幂次定律与微观动态:台北捷运系统为例

Author: 赖世刚 同济大学建筑与城市规划学院Upload date: 2020-03-12
Country: Professional Area : Intelligent PlanningKeywords : 幂次定律、自我组织、排名流动、台北捷运系统

        城市被视为一复杂的有机体,具有自我组织的现象,终将呈现出一稳定的秩序结构,如幂次定律,考虑研究资料的严谨性,是故本研究提出以台北捷运系统车站进出人次规模,来检证幂次定律。

       幂次定律现象的产生,是复杂系统内「自我组织」后展现的稳定秩序结构,其主要乃是通过组织内的个体互动行为,突现出的不可测的秩序结构,模式充满高度的「不可重复性及不确定性」,但个体之间具有自我相似性,通过系统的调适与学习,终将呈现一稳定的秩序结构。

      「幂次定律」乃是描述对象出现的规模与其出现的频率,具有一直线关系,由语言学家George Zipf,发现此定律之后,引起广泛的讨论,包含自然科学及社会科学等许多领域,亦有发现此一现象,如地震规模、股市涨跌等,也有许多理论在探讨其形成的背后机制,但目前为止尚未有令人满意之解答。

      在幂次定律显著性的检证上,采用直线回归,并以公元2002年至公元2007年进出人次规模数据,取得回归式y=20.49409-0.97665x,幂次值为-0.97665,调整的r-squared为0.7619,本研究并发现如果资料采用前65%的车站进出人次规模数据,将会使调整的r-squared达到最高为0.9643。

        在排名流动性分析之部份,整理了台北捷运系统在公元2002年至公元2007年有关进出人次规模的成长率与集中率。并且通过排名分组为前十大、前二十大、前三十大、前四十大及前五十大,辅以五种排名流动状况-新进该组、名次上升、名次不变、名次下降及退出该组,探讨排名流动之机率,同时建构马可夫链模式,形成移转机率预测矩阵,再加上通过多元线性回归模式,针对个别车站的排名加以预测。

1  前言

        复杂性科学是近年来快速发展的一门新兴学科,藉由研究方法及计算机技术的进步,许多学者通过实证或模拟等方式,不管是在天气变化或股市涨跌等领域,皆可发现复杂系统具有「自我组织(self-organization)」的现象,即系统中众多组成因子的相互作用,最终将突现(emergent)出一些共同的秩序。

        以城市为例,城市常被视为一复杂有机体,城市系统内相当多的人文、经济、社会等因素会互相变动影响,终将形成一个稳定的状态。所谓稳定的状态,即自我组织展现的状态。

        其中幂次定律(power law)和碎形结构(fractal structure),皆是复杂系统中自我组织的最佳展现,因此本研究拟以幂次定律作为研究的主要对象,首先通过台北捷运系统各车站的进出站人次规模,经由实证加以检验进出人次规模和排序,是否符合幂次定律的法则,并且加以探讨捷运系统内的排名流动状况,使研究的成果能对捷运系统之规划有所帮助。

        幂次定律,最早在一百多年前即被发现,是复杂系统中自我组织展现的结果,该定律指出,事物的规模和其排序呈现幂次方的反比关系,在自然科学领域里,从著名的沙堆实验,到古腾堡-芮氏法则(Gutenberg-Richter law)用来描述地震的规模与频率,以及陨石撞击出现的规模与频率,皆有幂次定律现象的产生。在社会科学领域里,从股市的涨跌规模与出现频率,或是文字出现的次数与频率,到解释所得分配的帕列斯法则(Paretos law)等,皆是幂次定律现象的最好例子。

        幂次定律的展现在复杂城市系统中的探讨,首推戚普夫(Zipf)于1949年提出的等级大小法则(Rank-Size rule),乃以数学式描述一国或一区域内之城市人口规模,其大小等级顺序排列呈现者如下的关系(辛晚教,1982):pr=p1/rq=pi*rq,其中,pr代表第r级城市之人口规模,p1代表第一级(即最大)城市人口规模,r为等级顺序,q为指数。另外Krugman(1996)利用美国的城市统计资料,将美国的城市,依规模的大小加以排序,并将规模和排序皆取对数,发现城市规模和排序之间确实呈现线性关系,证实戚普夫(Zipf)所提出的等级大小法则。

        至于目前台湾地区在城市规划领域里,对于以幂次定律为主要研究对象的探讨,尚属少数,包括薛明生及赖世刚(2002)利用台湾的人口数据加以实证,以及赖世刚、吕正中及王昱智(2015)利用台湾天然灾害的规模加以探讨等。有鉴于过去之研究多以台湾地区性的尺度探讨,本研究则拟以台湾地区之地方到区域的等级,因此选定台北都会区,再进而利用台北捷运系统的捷运车站,探讨幂次定律在此一行政区划分等级下,捷运系统是否亦然呈现幂次定律该有的秩序。

        实证对象选择台北捷运系统,乃是对于实证的数据来说,必须具有完整性及严谨性,本研究拟依据台北市政府主计处,所发布有关「捷运中运量及高运量各站进出人次」,其进出人次的取得,由于是通过各旅客进出验票闸门时,经过计算机统计系统处理,而取得进出人次,是故对于研究的本质来说,该进出人次的统计资料具有严谨性;除此之外,台北捷运系统由1996年以来,营运至今(公元2008年)已有十余载,由于每年皆有统计资料,是故该份统计资料亦具有完整性,因此选择以台北捷运系统进出人次规模,作为实证分析的对象,通过完整且严谨的数据,将使实证之分析结果更具有说服力。

2  幂次定律

        有关幂次定律的介绍,首先必须谈到哈佛大学语言学家Geoorge Zipf,在统计Brown语库的单词时发现,整个Brown语库最常出现的单词为「the」,其次为「of」,其中the出现的次数大约是of的两倍,也就是最常出现频率的单词大约为第二出现频率的单词数量之两倍,同样的状况,第二出现频率的单词大约为第四频率出现单词数量的两倍,当年Zipf统计the共出现了69971次(整个语库十万个单词中约占7%),of则是出现36411次(占整个语库约3.5%),非常接近前述所提出之比率关系,统计的结果亦发现最常出现频率的单词前135名排名之单字,就占了整个语库的一半,整个概念非常类似所谓的「八十/二十法则(80/20 rule)」,八成的语库所出现的单词,来自最关键的两成单字所构成。

        幂次定律现象的发生之后,引起学界相当大的广泛讨论,该定律发展至今,常用来解释生物学、物理学、天文学及社会科学等各领域的现象,即使城市领域亦不例外,在1949年Zipf提出等级大小法则(Rank-Size rule),说明城市规模与其等级之关系,P(r)=K*r-q,其中P(r)为第r级城市的人口数,K为区域内最大城市的人口数,q被称为戚普夫系数(Zipf Force),通常假设q值等于一。也就是第二大的城市人口规模为第一大的城市人口规模之ㄧ半,第三大之城市人口规模则为第一大的城市人口规模的三分之一,得依此类推下去。

  幂次定律的法则用来衡量对象出现的规模与其出现的频率为一线性关系,该该现象已为学界所接受,但尚无法合理解释其形成的原因。Krugman(1996)亦指出幂次定律之现象确实存在,但是形成的原因仍待持续验证与探讨。自我组织的稳定秩序状态之形成,与内部之吸引子有极大之关系,以城市等级大小法则为例,最大城市之形成,通常为一国之首都,具有丰富的城市机能,其形成的背后机制,可能为地利之便或是占有自然资源之优势,亦或是人为资本的投入,然而这些因素皆属于区域系统里的吸引子,因此系统内的各个城市受到这些吸引子的作用,彼此经过互动与学习之后,将形成一「暂时性的稳定之秩序结构」,即如城市等级大想法则所描述的城市等级与人口之结构关系。

        Krugman(1996)认为目前最佳的解释戚普夫法则的模型为Simon在1955年所提出的城市随机成长模型(Random growth model),假设城市成长是一次增加一个区块(lump),可以是加入现有城市或是成立新聚落,而该区块成立新聚落的机率为固定值,至于加入现有城市的机率则与城市规模成正比,即隐含「报酬递增」之观念,但是在推导系数值的过程中,为与前述介绍的系数值为「一」相同,即必须等于零,亦即无法产生新的城市,当然也无从形成城市体系,因此该模型仍无法完整解释幂次定律形成的背后原因。虽然幂次定律的形成之背后机制,尚无法有一具体之解释,然而该现象确实普遍的存在于这个世界当中,以下兹针对过去有关幂次定律现象,所观察到一些著名的实证例子,简要介绍之。

2.1 沙堆崩塌实验

        物理学家巴克(Per Bak)、汤超(Chao Tang)及魏森菲尔德(Kurt Weisenfeld),在1987年通过计算机仿真沙堆的崩塌实验,由高点处投掷一颗颗的沙粒,可能堆积形成一座沙堆,然而当沙堆过高时,也有可能随时会面临崩塌。结果发现每一场的沙堆崩塌,竟然没有完全相同的组成之沙粒数目,也就是有时候竟然只有十粒沙,也会产生崩塌,一百粒沙、一千粒沙乃至一万粒沙皆有可能,但有时候竟然累积到数百万粒沙也未产生崩塌。这些沙堆崩塌的规模与沙堆崩塌的出现频率,即符合幂次定律。

2.2 地震规模或陨石撞击

  物理学家巴克(Per Bak)(1996)指出包括前述的沙堆实验,或是地震规模以及陨石撞击同样呈现幂次定律之现象。在地震的规模频率当中,大规模的地震其出现的次数是相对较少的,小规模的地震则是相对较常出现。同样的情事亦出现在陨石撞击的现实当中。古腾堡(Gutenberg)和芮氏(Richter)通过研究世界各地的地震,提出了古腾堡-芮氏法则(Gutenberg-Richter law),如果某个大型地震所释放出来的能量,是某个小型地震的两倍的话,则大型地震出现的频率将是小型地震出现的四分之ㄧ。

2.3 网站的连结人数

  中国工程院院士李幼平,在「无尺度现象引发的思考」文章中,提出有极少数的网站,其连结人数是普通网站连结人数的百倍、千倍甚至万倍,也就是包括各网站的连结人数也呈现幂次定律的现象。网络用户对网站的游览,可以说是独立、自由的,完全取决于网络用户本人的主观意愿。在做大量统计实验之前,科学家预测连接数K应当是服从波松分布或正态分布,即每个网站的被访问量差异不会太大,就像人类身高差异不会太大那样。然而实测结果推翻了这个预测(赖世刚、吕正中及王昱智,2015)。

2.4 城市人口

        Krugman(1996)通过研究美国城市的统计资料发现,在1890~1990年美国的一百三十个城市,通过将排序与规模皆取对数,其形成接近斜率为负1的线性关系,且该斜率值非常稳定。Krugman亦证实戚普夫法则的系数应为负1之假设,是正确的。更大范围更长时期的城市人口实证数据,其实证的年份,为1790~1990年共计二百年的时间,针对美国的各个城市排名与规模,亦呈现一稳定的线性关系。

  在1977年,在美国有数字的学者,则是针对美国最大的2400个城市人口规模进行实证,亦发现有幂次定律的现象,其中最大的城市-纽约,人口约有九百多万,辛辛那提等共四个城市,其人口则只有最大城市人口的一半,整个城市结构皆具有此一关系。人口规模的实证部份,即使以全球前1700大的城市,或是通过瑞士的1300个小区人口的规模,都同样呈现幂次定律的现象。

2.5 股价波动

  一九九八年波士顿大学的史坦利研究标准普尔五百指数在一九八四到一九九六之间每一分钟的时距内的涨跌幅度,发现涨跌幅度倍增时,发生此种幅度的涨跌的机率就变为十六分之一。从很小到很大的涨跌幅之间,这个比例一直维持大致不变,也就是符合幂次定律的形式。若某一事物符合幂次定律,则就该事物而言,发生极端事件的可能性不会很低。事实上用极端一词来指称它们,甚至是不恰当的。

  人为系统所创的股市运作机制,亦呈现幂次定律的现象,其形成之原因可能为,投资者因股价波动而使情绪遭受影响,也就是当股价处在涨势的时候,会使投资者的情绪,对未来之判断,转为更乐观,吸引更多的实质买盘进场,推动股价快速且大幅的上涨,同样的逻辑,亦可用来解释股市快速崩盘的情境。

  薛明生及赖世刚(2002)则在进行台湾本岛人口幂次定律实证时,整理了幂次定律的四大特性:一、层级性:区域内各城市间彼此有关系,会呈现线性关系;二、变化性:即人口流动所造成城市规模的变动;三、有常性:乃指城市规模之变化有其循序性脉络,及区域内各城市层级关系虽有小幅异动,但不易呈现巨幅变易;四、聚累性:系城市规模之发展随时间递延而逐渐累积或发散其人口变动。

  由Geoorge Zipf观察Brown语库,提出幂次定律以来,有许多的学者,在自然科学或社会科学的众多领域里,通过相关模型设计或是理论探讨,主要希望能够了解对象的规模与其出现的频率之间,有一固定的线性关系,其出现的背后之关键机制到底为何?但是至今其形成的背后机制仍莫衷一是,但是通过实证研究,则是发现幂次定律普遍存在于我们的日常生活中。

3  研究范畴

        本研究旨在探讨幂次定律在台北捷运系统的展现,以下兹针对本研究的范畴,包含研究对象、时间范畴及空间范畴,作一简单的介绍如下。

3.1 研究对象-幂次定律

  本研究旨在检证台北捷运系统车站进出人次规模与排名,是否符合幂次定律的法则,是故以幂次定律作为主要的研究对象,个体的非线性(方程式)互动关系所构成的复杂系统,可能在总体面呈现简单的形式规则(自我组织现象),幂次定律则为其中一种非常常见的现象,其主要的意义为事物的规模和其出现的频率呈现幂次方的反比关系。

  城市系统为一复杂的有机体,构成各个城市的子系统亦为一个复杂的有机体,因此交通领域的捷运系统,自然亦为一个复杂的有机系统,在各因子的互动作用下,将形成一个简单的秩序法则,本研究乃是通过幂次定律的法则,来检证台北捷运系统是否符合此一简单的秩序法则。

3.2 空间范畴-台北捷运系统

  有关本研究是针对幂次定律是否会在台北捷运系统展现出有规律的秩序,进行实证分析,有关实证的空间范畴,是以公元2002年(研究时间范畴为公元2002~2007年,详见后述),台北捷运系统所有营运的捷运车站所涵盖的范围,另外有关排名流动性分析的空间范畴,则是涵盖到公元2007年底的所有营运车站。

        对于实证的空间范畴计有下列车站,中山国中、南京东路、忠孝复兴、大安、科技大楼、六张犁、麟光、辛亥、万芳医院、万芳小区、木栅、动物园、淡水、红树林、竹围、关渡、忠义、复兴岗、北投、奇岩、唭哩岸、石牌、明德、芝山、士林、剑潭、圆山、民权西路、双连、中山、台北车站、台大医院、中正纪念堂、古亭、台电大楼、公馆、万隆、景美、大坪林、七张、新店市公所、新店、市政府、国父纪念馆、忠孝敦化、忠孝新生、善导寺、西门、龙山寺、江子翠、新埔、永春、后山埤、昆阳、顶溪、永安市场、景安、南势角、小南门及新北投站共六十座捷运车站。

        有关排名流动性分析的空间范畴,由于是涵盖到公元2007年底的所有营运车站,并且在排序变化图的部份,由于分析的内容划分依据是捷运的子路线,因此通过表1整理公元2007年台北捷运子路线的捷运车站及其数目,台北捷运子路线划分依据是参考台北市政府捷运工程局,其中有关小南门线的部份,由于仅有一座捷运车站,因此无排名流动之状况,另外土城线仅有公元2007年单一年度的统计资料,是故亦无排名流动之情形,因此排除此二条子路线。

表1  公元2007年台北捷运子路线的捷运车站及其数目


(数据源:台北市政府捷运工程局,本研究整理)

3.3 时间范畴-公元2002年~公元2007年

  台北捷运系统的通车是在公元1996年,中运量的捷运系统木栅线首先开通,地下化的高运量系统-淡水线亦在来年(公元1997年)部份路段通车,由台北捷运系统通车至今约有十余年,但是公元2001年9月份时,由于台湾本岛受到中度台风「纳莉」侵袭的影响,地下化的捷运系统因为淹水的缘故,导致部份路段停驶,同时连带影响其他车站,减少发车的数量和延长发车的间距,由于此一影响属于非全面性的,亦即有部分的车站仍维持减班营运,但亦有部分车站暂时停止营运,在同年(公元2001年)12月全线恢复正常营运,因此将使公元2001年度的统计资料受影响,所以本研究以公元2002年至公元20007年做为研究的时间范畴。

4  研究方法与内容

        为探讨台北捷运系统各车站之进出人次规模,是否符合幂次定律的法则,因此本研究首先将台北捷运系统各车站之进出人次加以排序,然后就进出之人次数目和排序之顺位,分别予以对数化(logarithm)处理,然后藉由回归分析,以得出「回归系数(slope)」及「调整的r-squared」。其中回归系数的大小,代表进出站人次差异状况,当回归系数的绝对值愈大时,代表进出站人次的差异状况愈小。调整的r-squared之大小,则直接代表该系统呈现出对对幂次定律的显著性,当调整的r-squared愈大时代表,呈现幂次定律的现象愈强。

  另外有关本研究的主要内容摘录为下列四大点:

4.1 理论基础与文献回顾

        城市为一复杂之系统,在复杂系统中各因子的交互作用,最后藉由自我组织展现一稳定的秩序,其中幂次定律此一简单的秩序即为其法则之ㄧ,因此幂次定律的形成之背后隐藏着自我组织,因此本研究针对幂次定律等相关文献进行回顾与评述,以建立实证分析的理论基础。

4.2 数据搜集与数据处理

        本研究拟以台北捷运系统,进行幂次定律的显著性之实证分析,是故将针对台北捷运系统各车站的进出人次数据加以搜集,其数据的取得来自台北市政府主计处,所发布的统计年报,有关捷运站进出人次的统计资料,针对所搜集到的捷运车站进出人次加以排序,同时将排序与进出人次数据取对数化处理,以利后续的实证分析。通过回归分析,以取得回归系数及调整的r-squared,以检证幂次定律对于台北捷运系统的显著性。

4.3 实证研究与结果分析

        将前述所搜集到的捷运车站进出口人次数据,通过计算机软件,进行回归分析,以取得回归方程式及调整的r-squared,回归方程式的斜率即为幂次值,调整的r-squared的高低,则是显示该系统是否显著的符合幂次定律。同时针对实证的结果,分析台北捷运系统呈现该现象的原因,进行简要的分析,以掌握幂次定律与台北捷运系统的关系。

4.4 排名流动性分析

        首先建立排名流动的基础数据,通过基础数据的研读与判别,针对研究时间范畴内的捷运车站进出人次规模排名流动状况,作一扼要之说明,同时辅以马可夫链的模式以及多元线性回归模式,来建立台北捷运系统车站进出人次规模之排名流动预测机率,并且说明台北捷运系统进出人次规模在符合幂次定律下,与排名流动之间的关系。

5  实证分析

5.1 资料整理

        有关幂次定律的分析,得以将所欲进行分析的系统,依规模之大小加以排序,然后进行分组,或是直接通过排序的方式,将规模与排序或排序的分组数据,同时皆取对数,即可发现明显的线性关系,但是碍于分组可能会使资料失真,于是本研究,有关幂次定律的衡量,选择以排序的方式,进行数据分析。

5.2 回归分析

        通过计算机软件将前述整理完成之数据,进行回归分析,以取得幂次值(斜率,slope),以及调整的r-squared,以进行后述的显著性检定。其中进行回归分析的方法,本研究采用的是取完对数后的排序和进出人次规模,加以进行简单的线性回归分析。研究时间范畴内(公元2002年至公元2007年),台北捷运系统各车站之进出人次规模与排序之回归方程式为y=20.49409-0.97665x,因此可知幂次值为-0.97665,幂次值的大小,显示的是系统内差异的大小,而且依据研究时间范畴内的台北捷运系统进出人次规模的幂次值,和世界等级大小法则所说的负一非常接近,至于截距20.49409于本分析中,并无具特别的分析意义。

5.3 显著性检定

  在本研究中,对于回归直线进显著性的检定,主要乃在检证该系统,其进出人次规模与排序之间的关系,有多少可被幂次定律所解释。依据前述直线回归的结果,其调整的r-squared为0.7619,可用来判断回归模式的解释能力,当调整的r-squared的数值愈高时,代表呈现幂次定律的显著性愈明显,亦即该系统内有较强的自我组织性质。

6  排名流动性分析

6.1 前五十大车站进出人次规模集中率分析

  车站进出人次规模集中率分析,首先将车站进出人次规模分为五大组别,分别为前十大、前二十大、前三十大、前四十大及前五十大,所谓排名前十大之车站,乃是代表在该年度内进出人次规模排名第一名至第十名的捷运车站,至于前二十大车站则是在该年度内进出人次规模排名第十一名至第二十名的车站,其余前三十大、前四十大及前五十大车站,皆按照此法则加以分类,每个组别的捷运车站同样为十座捷运车站。

表2  前五十大车站进出人次规模集中率

(数据源:台北市政府主计处;本研究整理)

  所谓车站进出人次规模集中率,意谓着该车站的进出人次规模占所有捷运车站进出人次规模的百分比,如前十大捷运车站进出人次规模集中率,代表第一名至第十名的捷运车站进出人次规模总数,占该年度整体捷运车站进出人次规模总数的百分比,藉由此一信息可以观察不同组别在不同年度的捷运车站进出人次规模占整体百分比的变化,其概念非常接近捷运车站进出人次规模的市占率。


图1  前五十大车站进出人次规模集中率比较图

        通过表2整理前五十大车站进出人次规模集中率,按照前述分类的五大组别,同时整理从公元2002年至公元2007年六个年度的数据,可以发现在这六个年度里头,前五十大车站的进出人次规模集中率高达百分之九十以上,囊括大多数的进出人次规模。

        为方便比较不同年度以及不同组别的车站进出人次规模集中率,因此通过将表2的数据转绘成图一前五十大车站进出人次规模集中率比较图,可以发现不同年度间同一组别的集中率大致相差不多,在研究的时间范畴内皆相当稳定,仅有公元2007年在前十大、前二十大及前三十大的集中率都略低于其他年度,但反之在该年度前四十大及前五十大的车站进出人次规模集中率也都稍微的略大于其他年度。

6.2 捷运车站进出人次规模排名流动状况

  为能有效了解在公元2002年至公元2007年的台北捷运车站进出人次规模之排名流动情形,兹以图2绘制研究范畴时间内捷运车站进出人次规模排名流动之状况。

  排名分组之部分,按照前述法则分组,如前四十大指进出人次规模排名在第三十一至第四十名的捷运车站,排名流动的状况概分为五大类,分别是「新进该组」,代表该捷运车站的排名,比起上一个年度的排名,其排名上升至更前顺位的组别,包含一次上升两个组别以上;「名次上升」,则是意谓该捷运车站进出人次规模排名仍跟上一年度的组别相同,但是在排名上仍有所上升,但不能上升至跨越其他组别。

 

图2  公元2002年至公元2007年捷运车站进出人次规模排名流动状况图

      「名次不变」,也就是该捷运车站进出人次规模排名跟上一个年度比较起来,名次并未上升或下降,同时排名分组上留在原来的组别;「名次下降」的情形,则是和名次上升相对,也就是仍在同一组别,但是排名和上一年度比较起来有所下降;「退出该组」则是和新进该组的概念是相对的,亦即进出人次规模排名和上一年度比较起来,有所下降之外,并且掉落至其他更后顺位的组别,包含一次掉落两个组别以上。

        图2 排名的流动情形,是由公元2003年开始分析的,公元2003年排名流动的划分依据,乃是依照公元2002年的资料为基础。通过排名流动状况图,可以发现在各年度里,皆以排名不变所占的百分比最重;其次则是留在同一组别,但排名发生上升或下降的情形次之;发生机率最低的则是跨组别的上升或下降是最少发生的,但是在公元2007年退出该组的产生机率有稍微显著的上升,因此对于台北捷运系统整体来说,进出人次规模排名可说具有稳定性。并且在五个数据年度中,可以发现以公元2005年,排名不变的捷运车站数是最高的。

6.3 排序变化图分析

        排序变化图是参考来自Michael Batty所著的rank clocks该篇文章;排序变化图可清楚用来呈现研究时间范畴内,各车站的历年度排名变化,排序变化图的中心,为最高阶的名次,愈往外围则是名次愈下降,因此在各年度愈往中心的地方,代表该车站的进出人次规模愈大,其进出人次规模的排名也愈在前位。通过排序变化图,即可观察到,当某个车站跨越临界门坎值之后, 排名随着年度的改变ㄧ路往中心前进的情形,反之亦可观察到,某个车站排名随着时间的改变,愈往外围移动,也就是排名愈来愈落后的现象,皆可通过排序变化图清楚观察到。

        图3为整体车站前二十大车站进出人次规模排序变化图,进出人次规模最大的台北站,在公元2002年至公元2007年这段期间,始终维持排名第一大的捷运车站进出人次规模,至于第二大的捷运车站-西门站,在公元2003年、公元2004年及公元2005年为第三名,其余时间皆为第二大的捷运车站,新埔站则是在第二名或第三名之间变化,但是到了公元2007年则滑落至第五名。

 

图3  整体车站前二十大车站公元2002年至公元2007年排序变化图

  另外观察排序变化图的结构,亦可了解在研究的时间范畴内,所有车站的排名变化情形,当其结构为一稳定的形态,并未产生有线条交叉之情形,如图4木栅线排序变化图即代表在研究的时间范畴内,整体车站的排名皆未有任何之变化,为一稳定的排名结构形态。也就是该路线上的十二座车站,在公元2002年至公元2007年间,皆未有排名上的任何变化,因此排名的线条未有任何的交叉。反之当排序变化图,其结构形态愈复杂,亦即线条交错是愈复杂的情况,即代表整体车站的排名结构相当不稳定,经常会产生排名流动之情形。

 

图4  木栅线公元2002年至公元2007年排序变化图

        藉由前述的排序变化图可以发现,对于台北捷运系统的各条子路线或是整体车站来说,有许多条路线在排名最前顺位或是最后顺位的车站,皆具有排名僵固的特性,亦即这些车站在研究的时间范畴内,于该条路线上排名皆未有任何之变化,因此通过表3整理各条路线上具有排名僵固的车站名次,可以发现在六条子路线和整体车站中,仅有中和线及板桥线在排名最后顺位的车站完全无排名僵固之现象,另外板桥线在排名最后顺位无排名僵固之现象,极有可能是受到公元2007年新增府中及板桥两座捷运车站所影响。另外在淡水线的部分,排名僵固的现象则是发生在倒数第三及第四顺位的车站,但是该路线上的倒数第一及第二顺位的车站,也仅在公元2006年时曾发生排名互换之现象。

表3  各条路线上排名在最前顺位及最后顺位具有排名僵固的车站名次


7  个体车站排名预测

        有关个体车站的排名预测,本研究采用两种模式,分别是马可夫链模式,通过分组排名为前十大至前五十大共五组,用来预测公元2007年的分组排名预测机率矩阵,以及通过多元回归模式预测各路线及整体车站的个体车站排名预测。

7.1 马可夫链模式预测排名分组

        首先将公元2002年与公元2003年车站排名变化,转化为表4进出人次排名之转移机率矩阵,以在公元2002年排名前10大的捷运车站这一组为例,到公元2003年时,排名前十大的捷运车站,一定会转移到前十大、前二十大、前三十大、前四十大或前五十大的组别中的其中一组(在不考虑排名掉出前五十大的状况),亦即表四进出人次排名之转移机率矩阵各列的机率值总合一定为一。并且可以发现以前十大及前二十大这两组,到了下一个年度,仍维持在原排名分组。

表4  公元2002年至公元2003年台北捷运车站进出人次排名之转移机率矩阵


        通过表4转移机率矩阵,本研究通过运算得出公元2007年,各组排名的预测机率,整理成表五,其中排名前十大或前二十大的捷运车站,仍留在同一组别的机率为100%;至于在公元2002年排名在前三十大的车站,进出人次规模要进步到前十大或前二十大的机率一样都为零,如果是仍留在前三十大的这一组别机率是最高的,有61.88%的机率,亦有29.54%的机率排名会转移到前四十大这一组别,最后仍有8.59%的机率会落到排名前五十大这一组别。

表5   公元2007年台北捷运车站进出人次排名之预测机率矩阵


  通过表6整理公元2002年与公元2007年台北捷运车站进出人次排名流动之机率矩阵,该表格的排名流动机率计算,是以公元2002年为统计基础,比较公元2007年与公元2002年排名流动情形,兹以公元2002年排名前十大为例,有高达九座的捷运车站在公元2002年排名前十大,至公元2007年仍排名在前十大,仅有民权西路站掉落至前二十大。再以公元2002年前五十大的捷运车站,至公元2007年时,仍然排名留在前五十大的捷运车站,有四成的车站属于此一情形,同时有一成的机率会前进至四十大的捷运车站,其余五成的捷运车站,则是排名掉落至前五十大以外的排名。交叉比对表五与表六,可以观察出预测与实际排名机率之差异,以前十大及前二十大皆有最高的机率仍为原排名分组,在以前三十大的维持原排名分组,预测机率为0.6188,实际机率为0.6都非常接近。

表6  公元2002年与公元2007年台北捷运车站进出人次排名流动之机率矩阵


7.2 多元回归模式预测个体车站排名

  本研究利用多元回归模型,对于整体车站,以及台北捷运系统的各条子路线,各路线上每座车站的排序加以预测,考虑研究的时间范畴为公元2002年至公元2007年,回归模型所采用的数据则是公元2002年至公元2006年的车站相关数据,共计五年的数据时间,最后并以回归模式预测公元2007年的排序状况,并且和实际的公元2007年之排序数据加以比较。受限于篇幅的限制,仅以调整的r-squared最高的新店线加以说明,其余五条子路线及整体车站的两种模式,其中模式B仅改变第一个自变量为车站可及性,其余变量及数据时间皆相同,所有的结果摘录于综合讨论之内容中。

  首先应变项Y为子路线的车站进出人次规模排序,并非直接由整体车站的排名撷取名次状况,而是考虑各条子路线的运量重新加以排序之结果。另外两个自变项,X1:各车站到其他车站之间的运输站距总合,单位为公尺,至于整体车站模式B车站可及性,其计算之方式为运输站距之总合的倒数ppm,X2:捷运车站周围二百公尺的人口总合数目,由于人口资料是以「里」的行政数据为基础,并以范围内的所有里皆含括在内,因此实际的人口总和数目会有高估之现象。

        在新店线的回归模型摘要整理成表7,该路线上计有十座车站,其中小碧潭站,在公元2005年才有整年的进出人次规模之数据,为了维持模型置入数据的时间同样为公元2002年至公元2006年,因此排除小碧潭站。通过线性回归所得出的模型为Y= -7.12324+0.0000191X1+0.00000169X2,其中r-squared为0.9930,至于调整的r-squared为0.9927,此两个数值皆非常的高(最高仅能是一),因此可以知道的是此回归模型用来解释新店线的排名预测具有非常高的解释能力。

表7  新店线回归模型摘要


(数据源:本研究整理)

  表8整理新店线回归模型之变异数分析,进行回归模型的显著性检定,以了解所选择的自变量是否可以有效解释应变量,新店线回归模式所计算出的F值为3317,其数值非常的高,至于显著值为2.57E-51,则是非常的低,完全与前述的R平方异常的高,是互相ㄧ致的,所以可以说回归模式中的斜率系数极端的不全为零,也就是站距总合和人口总合可高度的用来解释名次变化上的差异。

表8  新店线回归模型之变异数分析


  通过表9新店线回归模型之参数估计,对两个自变项进行t检定,以了解各个自变项回归系数是否为零。首先在各车站到其他车站之间的运输站距总合这个自变项,回归系数为0.0000191,也就是站距总合每增加十万公尺(ㄧ百公里),名次将会后退1.91名,其t统计值为78.7269,已达统计上的显著水平,也就是站距总合的回归系数不为零,也就是站距总的大小会对捷运的名次变化有所影响。另外在捷运车站方圆两百公尺内的人口总合这个自变项,回归系数为0.00000169,也就是人口总合每增加一百万人,名次将会退后1.69名,其t统计值为0.4534,尚未达统计上的显著水平,也就是人口总合的回归系数可能为零,亦即人口总合该项自变量无法有效解释捷运名次的变动。

表9  新店线回归模型之参数估计


  表10为公元2007年新店线通过线性回归模型与实际排名之差距比较表,首先ㄧ样将原始数据的各车站到其他车站之间的运输站距总合以及捷运车站周围的人口总合数目整理,同时列出排名预测数值,以及转换后的预测排名,并且和实际排名加以比较,以整理出排名的预估差距。可以发现在新店在线的预估差距,以万隆站所预估出的低估五名,为最大的误差,至于最小的误差则为古亭站,其预测排名和实际排名皆为第二名,预测和实际资料是一致的。另外预估差距的数值介在+3至-5之间,其中尚有景美、七张、新店市公所以及新店站这四站的预估和实际排名仅有一名的差距。另外在预估差距的总合部份,新店线的预估差距总合为零。

表10  公元2007年新店线回归模型预测排名与实际排名之差距比较


8  讨论

8.1 实证分析综合讨论

        对于幂次定律的显著性衡量来说,可以针对所有母体的资料进行简单回归分析,亦可通过删除排序较后面的数据点,来提升幂次定律对于整体数据的解释能力,因此实证分析之内容主要针对研究时间范畴内的六十座车站加以分析,后续的内容则删除排序较后面车站的某个百分比,重新进行简单的直线回归,各个回归方程式所得出的资料整理成表11。

        为便利于比较不同车站百分比下之调整的r-squared高低,因此将表11的部分数据转绘成图5,其中以前65%的车站百分比为最高,并且在所有研究的车站百分比中,以整体车站(100%)为最低,同时有一个极为有趣的现象,当车站的百分比由全部的100%逐步降至前65%的每隔五个百分比,其调整的r-squared都在逐步增加中,但是到了前65%的车站之后,又逐步下降,且同样是每隔五个百分比逐步下降。

表11  台北捷运系统不同车站百分比下的调整r-squared及幂次值和截距


(数据源:本研究整理)

 

图5  台北捷运系统不同车站百分比下之调整的r-squared比较图

 

图6  台北捷运系统不同车站百分比下之截距和幂次值比较图

  同样的将表11其中有关幂次值和截距的部分资料转绘成图6,首先观察幂次值的数据,可以发现幂次值随着车站百分比的下降,亦再逐步下降中,从一开始接近负一的数值,到前50%的车站时,幂次值则是接近负二,幂次值的绝对值愈大,代表系统内规模散布的情形愈均衡,因此随着删除较后部排名的数据,则系统内的规模散布愈均衡,则幂次值的绝对值自然也变大。

  在截距的部份,则是随着车站百分比的下降,截距则是递次增加,从整体车站的截距为20,每隔五个百分比递次增加,到前50%车站时其截距为38。倘若同时观察,随着不同车站百分比的变化下,其幂次值和截距之关系,可以发现随着放入数据的前多少个百分比车站的下降,其幂次值也会跟着下降,同时截距则是跟着增加,也就是说截距和幂次值在同一系统内会有反比的关系。

  对于同一系统内有关幂次定律的衡量可以发现,在同一系统内,随着放入模型的前百分之多少车站百分比的下降,由于系统内的规模散布较均衡,因此幂次值也会下降,同时由于线性回归的自变量和应变量的值都设固定的,因此随着幂次值的下降,自然必须提升回归方程式的截距,如此才能使自变量和应变量的数值维持固定,因此对于同一系统内的不同百分比之数据所计算的幂次值和截距存在一个抵换的关系。

8.2 多元回归模型综合讨论

        在台北捷运系统中,依据台北市政府捷运工程局对于路线的划分,公元2007年的营运车站中,共划分为八条营运路线,最大的营运路线为淡水站,计有二十二座的捷运车站,至于最小的营运路线为小南门线,用来连络捷运西门站及捷运中正纪念堂站,因此仅设有小南门一座营运车站,并且因为该路线仅有一座营运车站,无从按照捷运车站的进出人次规模加以排序,是故小南门线不在回归模型的分析范畴内。另外土城在线的四座车站,包括亚东医院、海山、土城、永宁之完整的年度营运数据,始于公元2007年,因此仅有单一年度的数据,亦无法进行回归分析。另外必须说明的是,包括板桥线的府中及板桥站,在公元2007年始有年度排名数据,以及新店在线的小碧潭站,则在公元2005年使有年度统计资料,皆不符合回归模型所设定的数据时间,因此特别排除此三座捷运车站,并通过表12比较台北捷运系统不同路线回归模型摘要与实际排名比较之结果。

  在回归模型与实际排名比较之结果,其中「最大低估」,代表的意义为回归模型所做出的预测排名结果,与实际排名结果相较之下,回归模型对于该捷运车站的实际排名有所低估的情形,在所有排名低估的数值当中绝对值最大的即为名次低估误差最大的数值,但是考虑各路线上营运车站之多寡,会影响名次估计误差的结果,于是利用最大低估的名次误差除以该路线的营运车站数目视为该回归模型之「最大低估」。

  至于「最大高估」数值的产生,概念是相同的,仅是取用的数值为回归模型与实际排名产生的高估情形中,亦是取决对值最大的数值,并且除以该路线的营运车站数目视为该回归模型之「最大高估」,以客观显示各路线在排除车站数目后之结果,该数值最小为零,代表无任何高估之名次,最大的数值并无任何之限制。在台北捷运系统各路线的回归模型中,以南港线的回归模型产生最大的「最大高估」,其数值为0.8182,至于在「最大低估」之部分,则以淡水线的数值为-0.9495,为各路线中表现最差的低估误差状况。

表12  台北捷运系统各路线之回归模型摘要与实际排名比较表


  在「预估差距绝对值和」该项,是回归模型所算出的预测排名与实际排名之预估差距,取完绝对值后数值加总,同时考虑各路线营运车站之数目不同,再除以各路线的营运车站数目,因此若预估差距绝对值和愈大,代表该回归模型对于实际排名产生较大的落差结果,亦即该回归模型相对其他模式有修正检讨之必要,或是寻求其他方法改善排名预估误差。相反的,若数值愈小,则该回归模型的解释能力愈强,如中和线和板桥线皆为零,代表回归模型的预测排名完全与实际排名吻合。

  在不同路线之调整的r-squared数值比较,可以发现以新店线和板桥线的调整的r-squared最高,亦即此两个回归方程式,对于该路线的名次变化解释能力较佳,较低调整的r-squared则为总路线的两种回归模式。

  另外通过观察可以发现其中板桥线的调整r-squared值很高,在最大高估、最大低估以及预估差距绝对值和三项表现亦是较佳的,彼此的结果相吻合。另外则是总路线的部份,调整r-squared值较低之外,另外最大高估及最大低估表现几乎也是最差的,特别是预估差距绝对值和为所有路线中最差的,其两者的结果亦是相符合的。

  然而在中和线的部份,其在所有的子路线中,其调整r-squared值仅略高于木栅线,然而其在最大高估、最大低估以及预估差距绝对值和表现是绝对完美的,数值皆为零,因此通过回归模型,对于车站的名次变化之部分,如果营运车站数目愈少,将能使名次预测结果愈精确,

        但是当营运路线上的车站数目较多时,如本研究中的总路线回归模型,各种数据皆显示其预测的能力较弱,可以通过增加自变量的方式,来改善名次的预测准确度,如设施可及性,调查捷运车站一定范围内的重要设施,且服务对象并非局限于当地居民的设施,由于该种设施所提供的服务对象较为广泛,因此对于居住较远的服务对象来说,必须使用交通工具才能前往,所以捷运的进出人次极易受此种设施之影响。另外车站周围经济活动的情形,也会影响车站的进出人次规模,比方说通过工商普查的数据,如果当地的经济规模愈大,则就业人口或是业务往来的人数都会增加,亦是影响捷运车站进出人次规模的重要自变量之ㄧ。

9  结论

9.1 台北捷运系统车站进出人次规模与排序呈现幂次定律的法则关系

  本研究通过台北市主计处所发布有关捷运车站的进出人次规模,通过累加公元2002年至公元2007年各车站的进出人次规模,同时将进出人次规模与排序皆取对数,辅以线性回归的方式,以检证台北捷运系统进出人次规模与排序是否符合幂次定律,其结果摘要成表13。

  台北捷运系统在公元2002年至公元2007年捷运车站的进出人次规模与排序,以整体车站来说,其幂次值非常接近世界等即大小法则所说的负一,至于调整的r-squared则以取前65%的捷运车站为分析资料为最高,其数值高达0.9643,亦非常接近完美的数字一。

表13  实证分析结果摘要表


9.2 通过马可夫链模式及多元线性回归模式分析排名流动基础数据

  为建构马可夫链模式,先行针对公元2002年至公元2007年排名流动数据加以分析,涵盖进出人次规模的成长率与集中率,其中在公元2002年至公元2006年前五十大车站集中率,皆维持在九成左右。并且通过排名分组为前十大、前二十大直至前五十大,辅以五种排名流动状况-新进该组、名次上升、名次不变、名次下降及退出该组,做为分析排名的预测机率矩阵,并摘要成表14。

表14  公元2007年台北捷运车站进出人次排名之预测机率矩阵


(数据源:本研究整理)

  在多元线性的回归模式中,利用各站的运输站距总合及捷运车站方圆两百公尺的人口总合,做为自变项,并以按路线各车站的进出人次规模排序作为应变项,对于台北捷运系统的六条子路线及整体车站进行回归分析,结果如表15。

表15  台北捷运系统各路线之回归模型摘要与实际排名比较表


(数据源:本研究整理)

9.3 符合幂次定律法则下的排名流动状况

  通过本实证研究可以发现,台北捷运系统车站进出人次规模与排序,在研究的时间范畴内,确实具有幂次定律的此一法则之关系,虽然进出人次规模和排序具有稳定的线性关系,但是藉由排名的流动分析,亦可以发现进出人次规模与排序中的个体车站排名仍然会持续的变动,但这些个体间的排名互动作用,完全不影响整体所形成的秩序,因此也就是说进出人次规模与排序确实具有幂次定律的法则,但个体车站之间的排名仍会流动且并不影响幂次定律法则的形成。

参考文献



This article is a working paper and has not been officially published.