轨道交通信号系统全史

-
-
2026-05-24

轨道交通信号系统全史

导言:为什么需要信号系统

1825年,世界第一条公共蒸汽铁路在英国开通。开通当天,机车以每小时24英里的速度跑完全程——在当时已经是惊人的速度。但这条铁路上没有任何保护机制。两列列车如果同时从不同方向驶向同一段轨道,唯一能阻止它们相撞的,是调度员站在高处挥旗子。

这个故事回答了铁路信号系统存在的根本理由:当列车足够快、足够多的时候,仅靠人的眼睛和判断,已经无法保障铁路的安全。

此后的150多年里,铁路信号系统经历了从旗语到机械信号、从电气信号到计算机控制、从地面控制到列车自主判断的演进。每一次技术飞跃,都源于一次事故、一种新的运量需求,或者一项新的通信技术。

本书面向两类读者:普通读者可以通过故事和比喻理解信号系统如何塑造了现代铁路;行业从业者可以看到技术演进背后的工程逻辑和行业生态。全书共五部分、30章,从1825年写到2035年,涵盖历史、原理、当前状态和未来趋势。

第一部分:起源——从旗语到电路

第1章:铁路信号的诞生(1825-1870)

1.1 1825年:没有信号的铁路

1825年9月27日,英格兰的斯托克顿-达灵顿铁路正式开通,这是世界上第一条公共蒸汽铁路。开通当天,机车"运动一号"牵引着32节车厢,以约24英里/小时的速度驶完全程——在当时已经是惊人的高速。设计这条铁路的乔治·斯蒂芬森大概既兴奋又紧张。兴奋的是铁路真的跑起来了,紧张的是这条路上没有任何保护机制。

这条铁路的设计者面临的问题,今天听起来很简单:列车如何在同一条轨道上相向而行而不撞?当时的解决方案是"时间表"——提前安排好每列列车的发车时间和行驶方向,让它们理论上不会在同一时刻出现在同一地点。但理论是一回事,人是另一回事。

所谓"没有信号",不是说铁路上空无一物。沿线有调度员站在高处,通过旗语或手势向司机传递信息:举绿旗,可以前进;举红旗,前方有车,等一等。这套系统靠的是人眼和人脑,和今天铁路信号的控制逻辑完全不同。司机要自己判断距离、速度、刹车时机,一旦旗语没看清,或者两列列车同时从不同方向驶向同一个区间,碰撞只是时间问题。

达灵顿铁路全长约27英里,车次稀少时尚能运转。但铁路一普及,车越来越多,这套人工旗语系统的上限就成了整个铁路网的瓶颈——安全完全押在人的判断上,而人会疲劳、分心、误判。

这里有个容易被忽视的细节:早期的"信号员"与其说是调度员,不如说是举旗子的路警。他们没有任何专业的信号培训,旗语规则也是各公司自己定的,没有统一标准。一家公司的绿旗可能是另一家公司的限速旗。这种混乱在铁路网稀少的年代还能凑合,但当铁路越建越密,交叉道口越来越多,旗语系统的局限性就成了催生专业信号系统的直接推手。

另一个有意思的细节是,达灵顿铁路最初并不是为蒸汽机车设计的。斯托克顿-达灵顿铁路在1825年开通时,实际上是作为煤矿运输的货运线,蒸汽机车只是后来才引入的牵引方式。这条铁路的原始设计是让马匹在轨道上拉车——轨道最初是为了降低摩擦力、让马拉货更省力而铺设的。这种"先有轨道,后有机车"的反直觉历史,说明铁路的发明不是某个天才灵机一动的结果,而是多个技术长期积累的产物。

时间表制度的运作逻辑说起来并不复杂:调度员在前一天编制好第二天的列车运行时刻表,规定每列列车在每个站的到达和出发时间。司机按照时刻表行车,理论上同一时间同一区间只会有一个列车。但问题在于,列车运行并非精确准时——机械故障、天气原因、货物装卸延误,任何一个小问题都会打乱时刻表。一旦某列列车晚点,后续列车不知道,仍然按原时刻表运行,两列列车就可能在某个区间相遇。更要命的是,达灵顿铁路是单线设计,同一区间只能有一列列车运行,对向列车如果时间表执行不严,就可能发生正面碰撞。

铁路史研究者注意到一个规律:每一次重大技术突破,都伴随着铁路里程的快速扩张。1825年达灵顿铁路开通时,全球铁路里程几乎为零;1870年轨道电路发明时,全球铁路里程已超过20万公里。技术进步和铁路扩张相互促进:更安全的信号系统让铁路公司敢于开更多车,更多列车带来的收入又支持了更先进信号系统的研发。这种正向循环,是19世纪铁路技术飞速发展的根本动力。

1.2 1841年:世界第一起列车碰撞

1841年11月8日,切斯菲尔德站附近,两列客车在单线路段正面相撞。这是世界铁路史上第一起有记录的列车碰撞事故,两人死亡、多人受伤。

事故不是意外,是系统的必然。当时英国铁路各自为政,没有统一的信号规程,闭塞方式全靠各公司自行决定。在单线铁路上,对向列车本来应该靠时间表和人工协调来避免碰面,但时间表执行不严、协调失误、旗语传达错误,任何一个环节出问题都可能致命。切斯菲尔德事故,就是这样一个环节失效的结果。

事后调查发现了更令人不安的事实:事故发生时,其中一列列车的司机根本不知道对向有列车驶来。他的信号员确实举了红旗,但旗语传达链条在某个环节断裂了——也许是因为天色已晚,也许是因为前一天刚换过一名不熟悉路况的信号员。技术系统的可靠性,取决于链条中最薄弱的那一环,而当时铁路信号的链条上有太多薄弱环节。

两个人死亡,在当时欧洲铁路蓬勃发展的背景下,更让业界和政府警觉的是一个更基本的问题:仅靠人工纪律和旗语,无法保障铁路安全。《铁路法规》(Railway Regulation Act)随之出台,要求铁路公司设置统一的信号装置和运行规程。这是世界上第一部针对铁路安全的专门立法,标志着铁路信号从"习惯做法"走向"法规要求"。

臂板信号机就是在这之后逐步推广的。调度员在信号楼里扳动手柄,信号机上的机械臂随之抬起或落下,向司机传递明确的"停车"或"通行"信息。机械臂的位置是固定的,不像旗子在风中飘得模糊;夜间配有透镜式灯罩,用灯光显示相同的意思。但它仍然依赖司机"看见信号,然后自己刹车"。信号给了,执行权还在人。

切斯菲尔德事故揭示了一个此后一百多年反复出现的矛盾:信号系统再精密,最终还是要靠人的判断来执行。这个矛盾推动着信号技术不断进化——从不可靠的人眼,到机械臂,再到后来的自动制动。问题的答案,最终落在一个根本性的技术突破上:如何让机器自动检测列车位置,而不再依赖人。

一个值得关注的历史细节:切斯菲尔德事故发生在英国铁路快速扩张期,彼时铁路公司如雨后春笋般涌现,但行业监管几乎为零。英国政府在事故后才意识到,没有强制标准,铁路公司不会主动投资安全设备。这与后来各国铁路信号监管的演化路径惊人一致——每次重大事故都是监管升级的触发点。1835年英国铁路法规赋予政府监管权,但实际执法力度有限;直到切斯菲尔德事故后,执法力度才真正加强。

事故调查还有一个值得玩味的细节:当时英国报纸对事故的报道角度,与其说是反思安全漏洞,不如说是渲染悲剧色彩。两名死者中有一人是国会议员,这一身份让事故迅速成为议会质询的焦点。如果死者只是普通乘客,事故还会引发同等程度的监管改革吗?这个问题在后来铁路安全史研究中反复被提起——监管机构的注意力往往被社会地位高的受害者吸引,这或许是人之常情,但安全改进应该是系统性的,不应该依赖受害者身份来推动。

1.3 1870年:轨道电路——机器第一次"看见"列车

1870年,美国发明家威廉·罗宾逊(William R. Robinson)发明了轨道电路(Track Circuit),这是铁路信号史上第一个真正意义的自动检测技术。核心原理今天看来相当简单:利用铁路钢轨作为导体,在轨道两端分别接信号电源和轨道继电器。列车轮对跨在两轨之间形成短路(术语叫"分路"),使继电器失磁落下,表示区间占用;没有列车时,继电器吸起,表示区间空闲。

这套逻辑看似原始,却是现代铁路信号的基础。轨道电路解决了最根本的问题:如何在不需要人工的情况下,持续知道某个区间有没有列车。继电器吸起,调度员就知道空闲;继电器落下,调度员就知道有车。这就把"人工确认"这个最不可靠的环节,用物理原理替代了。

1870年,罗宾逊为"铁路区间占用指示器"申请了美国专利。他大概没有预见到,这项发明会成为此后一百多年几乎所有铁路信号系统的底层技术。

轨道电路的发明还有另一层意义:它让"闭塞"这个概念从人工协调变成了物理逻辑。所谓闭塞,就是将铁路线划分为若干区间,同一区间内不允许同时存在两列列车。人工闭塞靠调度员电话协调,自动闭塞靠轨道电路检测——列车占用某区间,地面设备向后续列车发出停车信号,等待区间清空才能通行。这个"机器看守"机制,把列车碰撞的概率从"依赖人的可靠性"降到了"依赖电路的可靠性"。

轨道电路的物理实现也有精妙之处。以直流轨道电路为例:钢轨作为导体,轨道继电器串接在电路中。当列车进入区间,车轮的金属轮对同时接触两根钢轨,将电路短路,电流绕过继电器,轨道继电器失磁落下。列车离开后,轮对不再跨接两根钢轨,电流重新流过继电器,继电器吸起。电路看似简单,背后却包含了铁路工程师对"故障安全"的深刻理解:任何导致电路中断的故障——断轨、连接线断裂、电源失效——都会让继电器落下,默认显示停车。这是机械时代的工程哲学,也是后来所有安全系统的底层逻辑。

有意思的是,罗宾逊的轨道电路专利提交后,经历了一场漫长的专利纠纷——另一名发明家小卢修斯·蒂尔曼(Lucius Tilman)声称自己先发明了类似装置。这场专利争议最终以罗宾逊胜诉告终,但历时数年。铁路信号史上的这类专利纠纷并不罕见,某种程度上正是这种竞争推动了技术的快速迭代。

轨道电路还有一个技术细节值得注意:分路电阻的问题。列车轮对跨接两根钢轨形成短路,但这个"短路"并非理论上的零电阻——轮对与钢轨的接触电阻、轮对本身的电阻,使得等效分路电阻大约在0.05-0.2欧姆之间。轨道继电器的设计必须考虑这个分路电阻值,确保在列车进入时可靠落下,在轨道电路断开时可靠吸起。如果分路电阻过大(比如轮对锈蚀、接触不良),继电器可能不会落下,造成"区间空闲"的误判,这对安全是极大的威胁。为此,轨道电路设计中有一个"分路灵敏度"参数,规定了继电器在多大分路电阻下必须落下,这个参数通常经过严格测试和计算,确保在最不利情况下也能可靠动作。

1.4 信号楼:铁路信号的物理心脏

信号楼(Signal Cabin)是铁路信号的物理控制中心——调度员在这里通过控制台操作臂板信号机或色灯信号机、排列进路、锁闭道岔。

信号楼的设计本身就是一个工程课题。早期信号楼建在车站咽喉(道岔集中区域)附近,方便调度员俯瞰整个站场。调度员坐在高处的控制台前,窗外是整个站场的道岔和信号机,窗内是密密麻麻的握柄和表示灯。这种"一览无余"的设计理念是故意的——调度员需要用肉眼确认现场状态,而不是完全依赖仪器。

英国铁路的信号楼有一种独特的建筑风格叫"举重运动员式"(Lift Bridge Tower style)——信号楼建在高架桥上,调度员可以从侧面俯瞰站场。这种设计在弯道或坡度较大的车站特别有用,调度员的视线可以越过列车的遮挡,看到整个咽喉区。英国至今保留了一些这种风格的信号楼,作为工业遗产保护。

信号楼的控制台也经历了从机械到电子的演变。早期控制台是一排排握柄,每个握柄控制一组信号机或道岔;表示灯显示现场设备状态。调度员排列进路时,需要同时操作多个握柄,顺序和时机都有讲究——这个操作叫"扳道",是铁路系统的专门工种,需要长时间培训才能熟练。

6502型电气集中出现后,信号楼的控制台改为按钮面板,调度员按压按钮即可排列进路,逻辑由继电器组合自动完成,不再需要手动协调多个握柄。这种"按钮化"的设计延续至今——现代计算机联锁的操作界面,已经从按钮进化为鼠标点击和触控屏,但底层逻辑与6502一脉相承。

回望1825年到1870年这45年,铁路信号经历了从无到有的全过程。这个过程有一个清晰的逻辑主线:把安全保障从"依赖人"逐步转移到"依赖机器"。达灵顿铁路时代,安全完全依赖人的判断——调度员的旗语、司机的眼睛、沿线人员的声音协调。切斯菲尔德事故证明了这套系统的上限。臂板信号机的出现,把"通行/停车"的决定权从调度员个人转移到了机械装置,但司机仍然负责执行——看见信号,自己判断,自己刹车。轨道电路则更进一步,让机器能够感知列车的实际位置,而不需要人工确认。

这45年的演进,为后来一百多年的信号技术发展奠定了基本范式:发现人的不可靠性,用技术手段替代人的判断。此后所有信号技术的进步——ATP、ATO、CBTC、ETCS——都可以视为这条主线的延续和深化。


第2章:臂板信号机与闭塞逻辑

2.1 臂板信号机:机械时代的精妙设计

1840年代,英国工程师阿奇博尔德·肯尼迪(Archibald Kennedy)设计了世界上第一种实用的臂板信号机(Semaphore Signal)。信号机顶部有一根铁臂,通过机械连杆与信号楼内的信号握柄相连。调度员扳动手柄,力通过钢丝绳传递,机械臂随之抬起或落下。

臂板的位置有明确含义:垂直向上(90度)是停车;与垂直方向成45度角是减速注意;水平放置是允许全速运行(部分国家采用不同角度)。夜间,配有的透镜式灯罩用灯光传达相同信息——红色灯光代表停车,白色或绿色代表通行。

这套系统的巧妙之处在于它的故障安全特性:信号楼的手柄失灵、钢丝绳断裂、连杆损坏,任何一种机械故障都会导致臂板在重力作用下自然落下,显示停车信号。设备坏了,默认是"停车",而不是"通行"。这是后来所有铁路信号系统的基本设计原则,学名叫"fail-safe"(故障导向安全)。

臂板信号机统治欧洲和美洲铁路将近一个世纪。但它有一个根本局限:可视距离有限,夜间、大雾、雨雪天气下,司机可能看不清臂板位置。机械臂的传动需要时间,信号变更不够快,也不适合高速铁路。

英国铁路工程师威廉·乔利(William Jowly)在1870年代对臂板信号机做了重要改进,发明了"探照灯式臂板信号机"(Searchlight Semaphore),用透镜将灯光聚焦成光束,大幅提升了臂板信号机在不良天气下的可视距离。这项改进让臂板信号机在英国铁路一直使用到1950年代才逐步被色灯信号机取代。

臂板信号机还有一个有趣的细节:它的机械臂长度和角度是有规定的。英国铁路的臂板信号机标准规定,停车信号(臂板垂直向上)时,臂板顶端在200码(约183米)外清晰可见;美国则采用不同的标准。不同国家的臂板信号机在臂板长度、灯位排列、颜色规则上都有细微差异,这也是后来国际铁路信号标准化的难点之一。

臂板信号机的机械传动系统是另一项工程杰作。从信号楼到最远的信号机,钢丝绳可能长达数公里。如何确保这端扳动握柄,那端机械臂能及时、准确地响应?答案是一套精心设计的滑轮、弹簧和配重系统。弹簧用来保持钢丝绳的张力,防止松弛;配重用来平衡机械臂的重量,减少传动阻力。这套机械系统虽然简单,但可靠性极高,即使在极端天气下也能正常工作。

2.2 闭塞的本质:把铁路切成"房间"

想象一座没有房门的公寓,客厅、卧室、厨房全通着,你想在厨房做饭,别人可以在你不知情的情况下走进厨房和你撞个满怀。早期铁路就是这样——整条线路连在一起,列车从A站到B站之间没有任何分隔,两列列车可能同时驶入同一区段而互不知情。

闭塞(Block)要解决的就是这个问题。把铁路线切成若干区间,每个区间同一时间只允许一列列车占用。列车想进入下一个区间?必须等前一列列车完全离开,系统确认区间空闲,才能放行。这就像给每间公寓装上门,而闭塞系统就是那把锁。

闭塞的概念最早出现在1850年代的英国单线铁路。当时的闭塞方式是电气路牌闭塞(Token Block):两站之间共有一套物理路牌,列车从A站出发前,司机必须从A站取得一块铜制路牌,这是进入区间的"通行证";列车到达B站后,路牌被交回,B站才允许向A站方向发下一列车。这种系统的安全性依赖于路牌物理上的唯一性——同一时间只能有一块路牌在区间内,理论上不可能有两列列车同时进入。但路牌可能丢失、被盗或司机忘交,机制并不完美。

电气路牌闭塞还有一个有趣的细节:路牌本身是金属制成的,通常是铜或黄铜,上面刻有区间名称和编号。司机取得路牌后,要把它放在驾驶室里一个专门的支架上——这个支架和信号系统电气联锁,路牌取出后,对向的出发信号就无法开放;只有司机交回路牌,信号才会解锁。这种物理联锁的设计逻辑,和后来计算机联锁的逻辑惊人相似,只是实现手段不同。

闭塞的实现方式经历了从人工到自动的演进。最早的电话闭塞或牌票闭塞,完全依赖调度员记忆和口头指令——A站调度员打电话给B站:"我这边放了一列车进你那边区间3,在我通知你之前不要再放车进来。"人可能忘,可能记错,可能沟通失误。

半自动闭塞引入了一点机器的介入:列车进入区间后轨道电路被占用,出发站的信号机自动锁定为停车信号,调度员必须等列车到达对侧车站、人工确认区间清空后,才能再次开放信号。确认清空这个动作仍然是人工完成的。

自动闭塞才真正实现了全自动:区间被分成若干固定分区(通常1-3公里一个),每个分区都有轨道电路。列车占用分区1,分区1的信号自动显示红灯,通知后续列车停车;列车继续驶入分区2,分区1的信号仍然保持红灯,分区2也变红;列车驶出分区1后,分区1的轨道电路空闲,信号自动变为允许通行。整个过程不需要人工介入,列车自己"告诉"后续列车自己走到哪里了。

固定闭塞与移动闭塞的选择,本质上是"安全裕量"和"运营效率"之间的权衡。固定闭塞的分区长度是固定的,设计时必须留足最坏情况下的制动距离;移动闭塞根据实际列车位置动态计算,可以压缩安全裕量,但需要更可靠的通信和更严格的安全认证。两种方式各有适用场景:重载铁路和货运线路优先选用固定闭塞,因为列车重量大、制动距离长;城市轨道交通优先选用移动闭塞,因为站间距短、发车密度高,需要更高的通过能力。

2.3 三显示与四显示:颜色传递的信息

三显示是铁路信号最经典的体系:红、黄、绿三个颜色,对应停车、减速、全速运行。逻辑清晰,司机容易理解。但三显示有一个致命弱点——制动距离问题。

列车以160公里/小时行驶时,司机看见黄灯开始制动,停车距离可能超出黄灯到红灯之间的可用距离。这不是理论推演,是实际运营中反复出现的问题。

四显示信号因此诞生。双黄灯(两个黄色灯位)代表更高的限速档位:列车前方有两个以上空闲分区时,显示双黄,告知司机可以保持较高速度;只有一个分区空闲时显示单黄,要求减速;没有空闲分区显示红灯,强制停车。四显示体系本质上是将制动距离分配到多个信号分区,让列车逐步降速,而不是在最后一个分区急刹。

中国高速铁路、英国高速铁路、美国Amtrak均采用四显示体系。这个选择背后的逻辑很简单:速度越高,需要的分区越多,给司机预留的判断和制动时间就必须越长。这不是信号系统的缺陷,而是物理定律对高速铁路的必然要求。

四显示体系还有一个技术细节:双黄灯的亮度通常比单黄灯略暗,或者采用不同的灯罩设计,确保司机在任何光线条件下都能清晰区分两种黄色。铁路信号的颜色标准有严格的色度范围规定,不是随便什么黄色都可以用。中国铁路采用的标准(TB 10007-2017)规定了信号颜色的色度坐标区间,LED光源必须经过校准才能满足要求。日本新干线则采用了不同的做法:用一条黄色光带来表示减速注意,相比欧洲和中国的双色系统更简洁,但对司机培训要求更高。

日本新干线的三显示体系是另一个值得研究的案例。即使列车以320公里/小时运行,三显示加足够的分区密度,仍然能够保障安全制动距离。这说明显示数目多少并非关键——关键是分区数量和长度必须满足最高运行速度下的制动距离需求。日本工程师的计算是:新干线列车以320公里/小时运行时,制动距离约4000米;如果采用四显示,每个分区只需约1000米;但日本选择了更密集的三显示分区,每个分区约650米,给司机更充裕的反应和制动空间。

2.4 信号灯为什么是红色

铁路信号的颜色体系不是随意选择的,背后有长期实践和科学依据的支撑。

红色作为停车信号,有着最直观的合理性:红色在可见光谱中波长最长,穿透雨雾的能力最强,在远距离和不良天气下最容易被识别。红色在人类文化中的"停止"含义也与这种物理特性形成了相互强化。早期铁路选用红色表示危险信号,沿用至今几乎没有争议。

黄灯代表"减速注意"的选择也有科学基础:黄色在红绿之间,对色盲人群(红绿色盲)相对友好;黄色灯光在远距离时的可见性仅次于红色,同时明显区别于红色。中国铁路还保留了一个传统习惯:进站信号机显示双黄灯时,表示正线通过;显示单黄灯时,表示侧线停站——同一对灯位,不同位置含义不同,这对司机的熟练程度要求更高。

绿色代表通行,同样与人类的自然联想一致:绿色是"安全"、"前进"的颜色,与红色的"危险"形成强烈对比。但有趣的是,早期部分欧洲铁路曾使用白色代表通行,绿色代表减速——因为当时的红色玻璃工艺不够成熟,容易出现偏色,而白色更稳定。后来随着玻璃工艺的进步,绿色逐渐成为通行标准色。

这套颜色体系经过一百多年的实践检验,已经成为全球铁路信号的"普通话"。国际铁路联盟(UIC)推荐的信号颜色体系中,停车信号统一为红色,减速注意信号统一为黄色,正常通行信号统一为绿色。尽管各国在具体色度标准和灯位排列上仍有差异,但红黄绿三色的基本框架已无争议。

调车信号机是另一个重要类别,专门用于车站内的调车作业。调车作业指列车在站场内摘挂车厢、重新编组的低速移动,此时列车行进方向频繁变换,信号显示逻辑和区间信号完全不同。调车信号机通常矮小,灯光强度低,主要供调车员在车顶或车侧近距离观察,而非司机在驾驶室内远距离读取。英国铁路的调车信号机采用紫色灯光表示允许调车,与区间信号的红黄绿体系完全独立,各成一派。


第3章:ATP——永远比司机快的红线

3.1 速度防护:机器替人踩刹车

1960年代的日本国铁,正经历一个痛苦的转型期。战后重建完成后,日本铁路网大规模提速,但人工驾驶模式的弊端也越来越明显:司机疲劳、超速、误判,每年都造成多起事故。日本国铁技术团队意识到,仅靠信号提醒司机是不够的——系统必须能强制列车刹车。

当时日本国铁最严重的安全隐患之一是"冒进信号"和"超速运行"——司机在看到禁止信号后仍强行行驶,或者在弯道、长大坡道等特殊区段超速。这些事故的本质都一样:司机的判断出了问题,而当时的信号系统对司机没有任何强制性约束。

这就是ATP(Automatic Train Protection,列车自动保护系统)诞生的背景。速度防护是ATP最核心的功能:系统持续监控列车实际速度,将它与该区段允许的最高速度进行比较。若列车速度超出限速,ATP触发常用制动迫使列车降速;若速度超出紧急制动触发值,系统直接启动紧急制动,直到列车完全停止。

限速信息从哪里来?答案是地面应答器。应答器铺设在轨道上,存储着这段线路的"档案"——坡度、曲率、临时限速区段长度、缓和曲线参数等。列车经过应答器时,车载设备读取这些数据,存入车载数据库,结合列车的当前位置和速度,实时计算"现在能跑多快"。这套数据闭环,让ATP系统对每一段线路的"能承受的速度"了然于胸。

ATP车载设备的工作原理大致是:测速发电机测量列车实际运行速度(通过测量车轮转速实现),与车载数据库中的限速曲线实时比对。如果实际速度超过限速,输出制动指令;如果超过紧急制动触发值,输出紧急制动指令。这个比较过程每200毫秒执行一次,远快于人类反应速度。

ATP和传统信号系统的根本区别在于:传统信号告诉人,人决定要不要刹车;ATP告诉系统,系统直接刹车。司机在这个闭环里不再是唯一的制动决策者。人的判断被系统接管,超速的后果从"可能被罚款"变成了"车自己停下来"。

ATP的设计遵循"故障导向安全"原则:任何部件失效,系统都默认输出停车信号。关键传感器和计算单元采用冗余配置(三取二或二取二),防止单点故障影响行车安全。车载计算机通常采用双机热备方式,一台主机运行,一台备机实时同步,一旦主机故障,备机无缝接管。

日本国铁开发ATP的历程中,有一个有意思的插曲:最初日本工程师曾考虑直接引进欧洲的ATP技术,但发现欧洲系统的设计哲学(以德国LZB为代表)和日本新干线的需求不完全匹配——欧洲系统多为既有线提速改造设计,而新干线是新建高速铁路,系统设计可以更彻底。最终日本国铁决定自主研发ATP,这个决定后来被证明是正确的,它让日本在列控系统领域积累了深厚的技术基础,也为后来的ATO和CBTC开发铺平了道路。

3.2 冒进信号防护:闯红灯会自动停车

早期铁路事故中,最常见的原因是冒进信号——司机看到禁止信号(红灯)后仍强行行驶,与前方列车或道岔冲突。这类事故的本质是:司机做出了错误的判断,或者判断没错但执行出了问题(反应太慢、刹车距离不够)。

日本国铁1964年开通东海道新干线时,列车最高速度达到210公里/小时,当时的人工驾驶模式已经无法保障安全。1966年,日本国铁正式推出ATP系统(最初叫"列车自动停车装置",ATS),速度防护加冒进信号防护,成为新干线安全运营的基础。

ATP的冒进信号防护(Trip Stop)从机制上消灭了这类事故。当列车前端越过停车信号(红灯)时,ATP车载设备立即触发紧急制动。这套机制依赖"冒进点"的概念:停车信号有一个物理标记点,列车一旦越过这个点,ATP就假设最危险的情况发生了——前方有车或者其他障碍。系统不再等待司机的判断,直接触发全制动。司机无法手动解除紧急制动,必须完全停车后等待调度授权。

这里有个技术细节值得注意:冒进点的位置是在停车信号前方一小段距离(约10-30米)设置的,不是紧贴在信号机旁边。这个提前量是为了给制动系统留出足够的响应时间——列车从冒进点开始制动,到完全停止,距离必须小于冒进点到障碍物之间的距离。这个看似微小的设计,包含了制动数学的精确计算。

传统信号系统的事故中,很大一部分是司机"看到红灯但决定闯过去"——原因可能是疲劳、误判、或者侥幸心理。ATP的冒进信号防护让"闯红灯"在物理上变得不可能:一旦越过停车点,制动系统就接管了,想不停都不行。这把安全从"依赖人的纪律"提升到了"依赖机器的强制"。

3.3 目标距离模式:让制动曲线精确到米

传统点式ATP有一个局限:它只能在固定点检查列车位置,检查通过就放行,检查不通过就制动。但这套逻辑对高速列车不够友好——列车在通过检查点时可能是全速,但再过几秒就要被迫制动,停车距离不够用。

日本国铁在研发新干线ATP时,就遇到了这个问题。新干线列车最高速度210公里/小时,制动距离通常在2000米以上。如果采用点式ATP,信号分区必须至少2000米长才能容纳一列高速列车的制动距离——这对建设用地和建设成本是巨大的挑战。

目标距离模式(Distance-to-Go Mode)解决了这个问题。它不监控列车在固定信号点的瞬时速度,而是根据到停车点的剩余距离,实时计算允许的最高速度。

车载计算机持续处理四组数据:当前位置(来自应答器修正的测速仪)、前方停车点距离(来自地面发送的移动授权)、线路参数(坡度使制动距离加长或缩短)、列车当前速度。这四组数据综合起来,实时生成一条"允许速度-距离曲线"——这条曲线告诉司机:以当前速度,还能继续开多远;前方多远开始必须减速;减速应该按什么节奏踩刹车。

司机的人机界面(DMI)实时显示这条曲线,以及当前实际速度在曲线上的位置。司机可以自己控制牵引和制动,只需确保不超出曲线范围;ATO系统则完全接管这个过程,按照曲线的最优路径自动驾驶。

目标距离模式是现代高速铁路ATP的核心。中国CTCS-3、欧洲ETCS Level 2都采用这套模式。相比点式ATP,它把制动控制精度从"分区级"提升到了"米级",是铁路信号技术从"粗放管控"走向"精准控制"的转折点。

目标距离模式还有一个重要特性:它能适应动态限速。传统点式ATP的限速信息是静态的(写死在应答器里),目标距离模式可以接收地面的动态限速信息(比如临时施工限速、拥堵慢行区段),实时更新允许速度曲线。这种动态调整能力,是现代高速铁路ATP的基本要求。

目标距离模式的另一个技术细节是"速度曲线拟合"。列车制动时,速度随距离变化的曲线不是线性的——刚开始制动时速度下降慢,越接近停车速度下降越快。ATP系统需要根据列车当前速度、线路坡度和列车制动率,实时计算并更新这条曲线。如果曲线计算有误差,列车可能无法在预期位置停下,或者需要更急的制动影响乘客舒适度。这个计算通常由专用的安全计算机完成,计算结果经过严格的安全验证,确保在任何情况下曲线都不会低估制动距离。

3.4 ATP的行业视角:日本新干线的启示

日本东海道新干线1964年开通,是世界第一条高速铁路,也是ATP大规模商用的先驱。它的ATP系统(最初是点式ATS,后升级为目标距离模式)证明了ATP在高速度、高密度线路上的必要性。

新干线的运营数据说明了ATP的效果:新干线开通至今五十多年,未发生过一起列车碰撞事故。这个记录当然有多重因素——包括严格的司机培训、先进的维护体系——但ATP系统作为安全底线的作用是毋庸置疑的。

日本新干线ATP的另一个特点是车载设备与地面设备的深度整合。地面应答器不仅传输静态线路数据,还实时传输列车位置信息给区域控制中心;控制中心根据所有列车的实时位置,计算每列列车的"移动授权"——即"你可以继续开多远",并通过应答器将这个授权发送给列车。这个闭环让人想起移动闭塞的工作方式,只是用应答器而非无线通信实现。

新干线ATP还有一个独特设计:司机的"紧急恢复"机制。当ATP触发紧急制动后,司机不能立即恢复运行——必须等待调度员确认前方区间清空后,通过特定操作才能解除制动。这个设计是为了防止司机在紧急制动后盲目恢复运行,导致二次事故。这个细节体现了"人机配合"的设计思路:机器负责安全判断,人负责最终确认。


第4章:ATO——让列车自己开

4.1 六阶段运行:把驾驶拆成六步

ATO(Automatic Train Operation,自动驾驶)的概念诞生于1960年代的英国,最初目的不是无人驾驶,而是节能。研发者发现,人工驾驶时司机的操作风格差异很大——有的司机提速猛、制动急,有的司机平稳滑行——不同驾驶风格下的能耗差距高达20%以上。如果能让列车按最优化的方式自动运行,光是节能这一项就值得推广。

ATO将列车运行过程分解为六个物理阶段:

第一阶段是启动。列车从静止状态开始加速,牵引系统输出设定的加速度,将列车推至巡航速度起点。这个阶段能量消耗中等,主要克服静止惯性。

第二阶段是加速。按设定的加速度持续提速,直到列车达到巡航速度。这个阶段能耗最高,牵引电机全功率输出。

第三阶段是巡航。保持恒定速度行驶,此时牵引力等于列车运行阻力,速度不再增加,能耗降到中低水平。

第四阶段是惰行。切断牵引,列车依靠惯性滑行。这个阶段能耗为零,是六阶段中唯一的"纯节能"阶段。列车的动能被转化为惰行距离,理想情况下,列车应该在速度降至巡航速度下限附近时,重新施加牵引。

第五阶段是制动。施加制动力使列车减速。再生制动将部分动能转化为电能回馈接触网,现代ATO系统会将这个能量纳入优化计算。

第六阶段是精确停车。将列车停在站台指定位置,停车精度要求为±30厘米。这个阶段控制难度最高,需要精确的速度曲线跟踪。

惰行阶段是ATO节能的核心。切断牵引后,牵引电机零功耗。一列200吨的列车在全速运行时,动能是巨大的——合理利用这段滑行距离,可以显著减少牵引能耗。研究表明,优化后的ATO比人工驾驶节能约15-20%,主要来自惰行阶段的精准控制。

ATO的六阶段划分看似简单,实际上包含了一个核心洞见:列车运行过程中的能量消耗,本质上是"有用功+损耗"。巡航阶段消耗的能量主要用于克服阻力,ATO通过控制速度曲线,让列车尽可能处于阻力最小的速度区间运行;惰行阶段则完全避免了牵引能耗,这是人工驾驶最难复制的部分——人类司机倾向于提前制动,而ATO可以在保证准点的前提下,最大化惰行时间。

六阶段模型还有一个有趣的延伸:制动能量回收的优化。现代ATO系统不仅计算如何节能,还计算如何最大化制动时的能量回收。当列车进入制动阶段,再生制动将动能转化为电能回馈接触网。如果同一供电区间内正好有另一列列车处于加速阶段,它可以直接使用这部分回收的电能。中国高速铁路的ATO系统普遍具备这种"区段级"能量优化能力——系统会协调同一供电臂内多列列车的运行曲线,让制动能量尽可能被同区间的加速列车消耗,而不是白白馈入电阻发热。

ATO控制算法的核心是"最优速度曲线生成"。系统根据运行图给出的区间运行时分、线路参数(坡度、曲率、限速)、列车参数(重量、制动率),计算出一条"能耗最优"的速度曲线。这条曲线不是固定不变的——系统会根据实际运行情况动态调整。如果列车晚了几秒,曲线会变得更激进;如果列车早了几秒,曲线会变得更从容。这种自适应能力,是ATO相比人工驾驶的核心优势之一。

4.2 从GoA0到GoA4:自动驾驶的四个等级

国际铁盟(UIC)定义了列车自动驾驶的五个等级,称为GoA(Grade of Automation):

GoA 0是目视运行,完全由司机人工驾驶,信号系统只提供被动警示。这是蒸汽时代延续到内燃时代的标准模式。

GoA 1是系统提供驾驶建议(如推荐速度曲线),但实际驾驶操作仍由司机完成。ATP的速度防护和冒进保护介入,但加速和制动由司机控制。

GoA 2是半自动驾驶(STO)。司机只负责启动和关门,其他驾驶操作由系统自动完成。司机监控列车状态,在必要时接管。上海地铁10号线是GoA 2的典型案例——司机在司机室监控屏幕和仪表,列车自动驾驶,司机负责开关门和异常情况处置。

GoA 3是有人值守的无人驾驶(DTO)。列车完全自主运行,没有司机在驾驶室,但有服务人员或站务人员在站台或车厢内值守,负责应急处置和乘客服务。全系统自动化,包括车门控制和站台屏蔽门联动,但有人在现场应对紧急情况。

GoA 4是完全无人驾驶(UTO)。列车完全自主运行,无任何人员在车上或站台值守。全系统自动化,包括车门控制、站台屏蔽门联动、火灾疏散等所有场景。北京机场线是GoA 4的早期案例,上海8号线部分时段也按GoA 4运营。

GoA等级的选择取决于线路定位、客流特征、运营成本和当地法规要求,并不是"越高级越好"。GoA 4的建设成本和运营中的故障处置挑战更高,适合机场快线、新城联络线等站间距大、客流相对稳定的线路。在高密度城市轨道线路上,GoA 2仍然是主流选择——司机虽然不负责驾驶,但作为现场应急人员和乘客心理安慰的存在,仍然有其价值。

GoA 3的应用案例中,巴黎地铁14号线是典型。这条线路是全自动驾驶的范本——没有司机室,也没有站台工作人员值守。列车运行、开关门、故障处理全部自动化。这条线的设计理念是"把人的因素降到最低",因为人工成本是巴黎地铁运营的主要负担。但这种模式的挑战在于极端情况下的应急处置——当列车出现故障停在区间时,乘客如何疏散?巴黎地铁的解决方案是在区间内设置紧急通道,乘客可以通过隧道内的步道步行到最近车站。

4.3 ATO与站台屏蔽门的默契配合

ATO和站台屏蔽门(Platform Screen Doors,PSD)的联动,是城市轨道交通自动化的重要标志。这套系统的配合远比表面看起来复杂——列车进站时,车载设备需要知道列车精确位置,地面应答器校准精度达到±1米,ATO才能控制列车准确停在屏蔽门对准的位置。

屏蔽门与列车之间的接口是安全联锁:列车停稳后,车载设备向屏蔽门控制系统发送"列车已到位"信号,屏蔽门才会解锁打开;列车准备发车时,司机或ATO发送"关门"指令,屏蔽门关闭并锁闭后,列车才能收到"允许发车"信号。这个联锁逻辑和道岔、信号的联锁是一回事,只是把联锁范围从轨道扩展到了站台。

这套系统的精妙之处在于"容错对齐"。即使ATO控制列车停在±30厘米精度内,偶尔也可能出现单扇屏蔽门与列车车门偏差过大的情况。为此,屏蔽门控制器会检测每扇门的实际位置,只有列车完整停靠的所有车门都在屏蔽门范围内,才会允许开门指令。如果偏差超出允许值,系统会拒绝开门并报警,调度员可以人工介入处理。

ATO与屏蔽门的联动还涉及一个经常被忽视的问题:列车的精确停车位置不是固定的。列车编组长度可能因为换端、重联、解编而变化,同一站台的不同车次可能停在不同位置。ATO系统需要知道当前运营列车的编组长度,才能计算出列车头部应该停在什么位置。这个数据通常存储在ATO车载设备中,每次列车出库时自动加载。


第5章:ATS——调度员的"上帝视角"

5.1 三大核心功能:运行图、列车追踪、进路排列

一座城市有十几条地铁线路,每条线有几十列车同时运行,调度员如何在控制中心同时监控所有列车位置?如何知道某列车是否晚点?如何快速为突发故障的列车安排救援?仅靠人工盯着屏幕上的列车位置图标,已经不可能了。

ATS(Automatic Train Supervision,自动列车监督)就是解决这个问题的系统。ATS不是直接控制列车的系统——它不发出道岔转换命令,不开放信号,不干预列车运行。ATS是调度员的"眼睛和手":监控所有列车位置,辅助编制运行图、排列进路,在异常情况下提供决策支持。

ATS的监控能力来自两个渠道:轨道电路和应答器。列车占用某区段轨道电路,控制中心的ATS就知道有车在这个区段;列车通过某个应答器,ATS能识别出列车的具体编号和经过时刻。两种数据叠加,ATS能实时重建每列列车在系统中的精确位置、当前速度、下一站预计到达时间。

ATS的功能可以用三件事概括。

第一件事是运行图编制。ATS自动生成时间-距离图(tracking chart),横轴是时间,纵轴是车站,图中每条斜线代表一列列车,斜率代表列车速度,斜线与横轴的交点代表列车到达各站的时刻。调度员在ATS界面上调整运行图:加一列车、减一列车、修改某个站的停站时间、调整列车区间运行时分,系统会自动重新计算所有冲突——比如两列列车在同一时段进入同一区间。这套系统让调度员从"凭经验排图"变成了"系统辅助优化"。大规模路网的运行图编排是个极其复杂的数学问题,人工排图耗时且容易出错,ATS的自动铺画功能可以快速生成无冲突的初始运行图,调度员在此基础上做人工调整。

第二件事是列车追踪。ATS实时知道每列列车的位置和速度。系统持续将列车实际位置与运行图对比,如果偏差超出阈值,ATS就会报警,提醒调度员关注这列车是否晚点、是否需要调整运行图。列车识别号(Train ID)自动关联车次号、司机号、编组信息,调度员点击任意一列列车,系统就弹出这辆车的完整档案:今天跑了多少趟、当前速度、距离下一站还有多远、司机是谁。

第三件事是进路排列。调度员在ATS界面上选择一列列车和目的地,ATS自动检查相关的道岔位置、信号状态、轨道电路空闲状态——如果条件满足,ATS向联锁系统发送排列进路的指令,联锁执行操作,道岔转换到位,信号开放,列车通行。自动进路功能(ARS)更进一步:当列车接近某站时,ATS自动触发预设进路,无需调度员手动操作。在高密度线路上,这个功能大幅减少了调度员的工作量。

进路排列功能是ATS与联锁系统的关键接口。ATS发出的是"请求"而非"命令"——联锁系统负责判断条件是否真正满足(道岔是否密贴、敌对进路是否建立等),ATS负责检查运营层面的条件(运行图是否允许、是否与冲突进路冲突等)。两者各司其职,共同保障列车的安全有序运行。

5.2 调度集中的演进:从电话到屏幕

ATS通常与CTC(调度集中系统,Centralized Traffic Control)配合使用。CTC让调度员在单个控制中心远程监控和操作整条线路的所有车站信号设备——不需要每个车站都有人值守,大量车站实现了"无人值守"或"单人值守"。

中国铁路的TDCS(列车调度指挥系统)是CTC的典型实现:全路超过90%的车站接入TDCS,调度员在铁路局调度所远程控制沿线车站的信号设备,排列进路、设置临时限速、发布调度命令等操作都在系统中完成。城市轨道交通的ATS则更强调与列车运行图深度集成的列车追踪和运行调整功能。

ATS演进的另一个方向是云平台化。传统ATS是中心化架构,控制中心的大型服务器处理所有数据。随着虚拟化技术成熟,部分新建线路开始将ATS核心功能部署在云平台上,服务器不再位于控制中心本地,而是运行在数据中心。云平台ATS的优势是扩展灵活、维护成本低,但也带来网络延迟和安全性方面的新挑战。

人工智能正在给ATS带来新的能力。基于深度学习的到发时间预测模型,能够根据历史数据和实时运行状态,预测列车晚点的发展趋势,为调度员的调整决策提供更早的预警信息。图像识别技术也在进入ATS领域——通过视频分析自动检测站台乘客密度,为列车运行图调整提供客流数据支撑。但这些AI功能目前仍处于辅助决策阶段,尚不能替代调度员的核心判断。

5.3 ATS的行业视角:控制中心的大脑

ATS是铁路运营组织的神经中枢。一个地铁控制中心里,调度员依靠ATS屏幕做出每一个决策:哪列车需要稍作等待、哪个道口需要优先处理、突发故障时如何重新铺画运行图。ATS记录了每一次操作、每一个报警、每一列列车的轨迹,成为事后分析和责任认定的重要依据。

控制中心调度员的值班通常分为几个岗位:行车调度员(负责列车运行)、电力调度员(负责接触网和变电所)、环控调度员(负责通风和排水)。ATS主要是行车调度员的工具,但电力调度员的接触网停送电操作,也需要与ATS的列车运行图联动——如果要在某区段进行接触网检修,行车调度员需要根据ATS的运行图,安排该区段无列车通过的"天窗"时间。

中国城市轨道交通的ATS市场,通号集团、和利时、浙江众合等本土企业占主导;西门子、阿尔斯通、庞巴迪等外国公司通过技术转让或合资方式参与。国产ATS在价格和服务响应速度上有优势,但在某些高端功能(如复杂路网的多系统协同)上,与国际一流产品仍有差距。

控制中心还有一个有意思的细节:值班的节奏。地铁控制中心的行车调度员通常实行"三班倒"制度——每班8小时,全天24小时不间断。一个调度员的班次通常是"白班-夜班-休息"循环,这种轮班制度对调度员的生理节律是极大的考验——深夜班时,人最容易疲劳,而恰恰是这个时段最容易出现设备故障和异常情况。有些地铁公司为此在深夜班增加了"双人值班"制度,一个调度员监控,一个调度员待命,以应对突发情况。

ATS的局限性也需要正视。ATS的列车追踪依赖轨道电路,精度受限于轨道区段的长度。一个200米长的轨道区段,ATS只知道列车在这个区段里,但不知道列车具体在哪个位置——车头还是车尾。如果两列列车在同一区段追踪运行,ATS只能显示两列车都在该区段,无法判断它们之间的实际距离。ATS的运行图管理也有局限:运行图铺画是基于历史数据和固定参数的,但实际运营中,列车可能因为乘客上下车时间延长、站台拥挤、偶发设备故障等原因晚点,ATS的调整建议未必能覆盖所有真实场景。


第6章:联锁——防止列车相撞的逻辑锁

6.1 敌对进路:联锁的逻辑起点

联锁(Interlocking)的本质,用一句话概括就是:在空间上存在冲突的两条进路,不能同时建立。

什么是进路?进路是列车从甲地到乙地,所要经过的道岔和信号区的组合。比如从某站出发,经过3号道岔转向5道岔区段,再经过7号道岔进入上行正线——这条路径就是一个进路。进路是铁路运营的基本单元,列车每一次出发和到达,背后都有一条进路被建立和解除。

敌对进路(Conflicting Route)是指:两条进路在空间上有重叠区段,如果同时建立,两列列车可能进入同一区段而发生碰撞。比如上面的进路一和进路二(从5道岔区段直接转下行),它们共享了5道岔区段——这两条进路就是敌对的,同一时刻只能建立一条。

联锁表是联锁系统的核心文档。它记录了车站所有进路,以及每条进路与哪些进路是敌对关系。联锁表的每一行是一条进路,每一列是另一条进路,交叉处标注"敌对"或"不敌对"。编制联锁表是车站信号系统设计的核心工作,漏编一条敌对关系就可能埋下安全隐患。

联锁表的编制需要信号工程师对车站的物理布局有深入了解:道岔位置决定了哪些进路可以开通,道岔的尖轨方向决定了列车经过时的行进路线,而道岔的机械联动关系也会影响进路之间的敌对关系判断。一个大型编组站的联锁表可能有几百行,记录了几十条进路之间的敌对关系,是一项复杂的设计工作。

联锁系统不是单纯的软件逻辑,它要满足一系列物理约束:信号机开放前,必须检查进路上所有道岔位置正确且锁闭——"位置正确"是指道岔尖轨密贴钢轨,如果道岔没有完全到位,列车经过时可能掉道;"锁闭"是指道岔被机械或电子手段固定在当前位置,防止列车经过期间道岔意外转换。道岔转换时,对应信号必须处于关闭状态——这条约束是为了防止"边走边扳道岔"。进路建立后,敌对进路的信号机不能开放——这是联锁的核心逻辑。

6.2 6502电气集中:中国的"联锁之母"

6502型电气集中是中国铁路联锁系统的里程碑。1965年,中国铁道科学研究院研发成功这套继电器系统,用6502块继电器(实际数量因站规模而异)组合出所有进路逻辑。继电器的吸起和落下状态,对应道岔的位置、信号的状态、进路的建立和解除。

6502系统的逻辑设计极其精妙。举个例子:要建立"从3号道岔区段到上行正线"的进路,信号工程师设计了一套继电器组合:道岔位置继电器(道岔3的位置必须是定位)、锁闭继电器(确认3号道岔已被锁闭)、区段占用继电器(确认进路各区段无车)、敌对进路锁闭继电器(确认敌对进路未建立)——只有所有这些继电器都处于"允许"状态,信号开放继电器才会吸起,信号才会亮起绿灯。这套逻辑是用继电器硬件搭出来的,每一步判断都有物理继电器对应,可靠性极高。

6502是中国铁路信号工程师的工程杰作,也是人类用继电器逻辑实现复杂安全控制的经典案例。在它的巅峰时期,全国有数千个车站使用6502系统,很多车站至今仍在运行。这套系统的设计寿命原本是25年,但大量车站的超期服役证明了其工程上的成功。

6502还有一个重要贡献:它培养了一代中国铁路信号工程师。继电器逻辑是直观的、可见的——工程师可以打开继电器箱,看到每一个触点的状态,理解每一条电路的走向。这种"所见即所得"的设计方式,让6502成为铁路信号专业的"启蒙教材"。很多今天的计算机联锁工程师,都是从6502的继电器逻辑开始理解联锁本质的。

6.3 计算机联锁与SIL4认证

1980年代,计算机联锁开始取代继电器联锁。核心变化是:用软件逻辑代替硬件电路,用工业计算机代替继电器组合。

计算机联锁的优势是明显的:便于远程诊断,与CTC/TDCS系统联网,记录完整操作日志,系统扩展和修改也更灵活。继电器联锁一旦建成,增减进路几乎要重新布线;计算机联锁只需修改程序。

但软件有个致命问题:软件有bug怎么办?继电器逻辑是硬件的,物理定律不会骗人。软件bug可能导致系统"看起来正常但逻辑错了"——比如应该锁死的敌对信号,因为代码写反了,反而被打开了。

SIL4认证(安全完整性等级4,Safety Integrity Level 4)就是来解决这个问题的。SIL是IEC 61508标准定义的4级安全等级,SIL4是最高等级,要求危险失效概率低于10^-8/小时——换句话说,每运行一万年最多允许一次危险失效。

实现SIL4的主要手段是冗余架构。二乘二取二(2x2oo2)或三取二(2oo3)结构:两套或三套独立的硬件同时运行,处理同一逻辑,输出结果必须一致才算有效。一套出了随机故障,另外两套仍然正确工作。

多样性设计是另一个手段。两个不同团队独立开发两套软件,用不同编程语言、不同编译器实现相同的联锁功能。上线运行时,两套软件的结果交叉验证,一致才算通过。这叫"异构冗余",目的是防止两套软件犯同样的错——如果一个团队用了某套方法论,在某个边界条件上出错,另一个团队大概率不会犯同样的错误。

形式化验证是用数学方法证明程序逻辑的正确性。工程师写出联锁程序,然后用形式化证明工具数学上证明程序满足所有安全属性。这种方法目前只在最高安全等级的系统(如核电站控制软件)中强制使用,铁路信号领域正在逐步推广。

EN 50129:2018是欧盟的铁路信号安全通信标准;IEC 61508:2010是功能安全的通用标准;IEEE 1483是计算机联锁系统标准。这三套标准构成了今天计算机联锁安全认证的主要依据。

6.4 联锁的物理边界与区域化

联锁系统的演进史,折射出铁路运营组织模式的变迁。

早期铁路的车站是独立的控制单元——每个车站都有自己的信号楼、自己的联锁设备、自己的值班员。列车从A站到B站,需要两站调度员用电话协调,确认区间空闲后才能放行。这种"分散控制"模式符合当时的管理和技术水平,但随着铁路网密度增加,调度员的工作负荷急剧上升,区间通过能力也受到限制。

1950年代,中国铁路开始推广调度集中(CTC)技术:把多个小站的信号控制权集中到调度所,调度员在调度台屏幕上一并控制。这种模式在单线铁路和支线上效果显著,减少了小站值班员数量,提升了调度效率。但调度集中的前提是车站联锁系统足够可靠——因为调度员远程操作时,看不到现场实际情况,系统必须能够自动防止操作失误。

区域联锁是联锁技术的下一个演进方向。它不是简单的远程控制,而是在更大地理范围内实现联锁逻辑的集中处理。比如一个枢纽内的五个车站,可以共用一套联锁服务器,服务器根据各站的信号设备状态和进路请求,统一计算并下发控制指令。这种模式可以降低设备投资(不需要在每个车站都配置完整的联锁主机),同时提升枢纽整体的通过能力。

区域联锁的挑战在于"响应延迟"——联锁逻辑从车站搬到控制中心,指令传输需要时间。对于高速铁路来说,这点延迟可能是可以接受的;但对于需要快速折返的地铁站,延迟积累下来会影响折返时间。解决方案通常是"分层控制":正常的进路排列由区域中心处理,紧急情况下的即时操作由车站级设备完成。两套机制互为备份。

中国联锁技术的发展,走了一条从引进到自主研发的道路。1950年代,苏联援建带来了继电联锁技术,中国在此基础上仿制和改进了65型和75型继电联锁。1965年,铁道科学研究院研发出6502型电气集中,这是中国第一种全国统一的联锁系统。1980年代,随着微机技术发展,中国开始研发计算机联锁。1990年代,计算机联锁开始在主要干线上逐步推广,6502逐步退场。今天新建线路几乎全部采用计算机联锁,继电联锁只存在于少量既有线和偏远小站。


第7章:移动闭塞——把间隔压到极限

7.1 固定闭塞的物理极限

固定闭塞(Fixed Block)是自动闭塞的经典形式:区间被预先划分为固定长度的分区,列车位置用分区编号表示,"占用分区2"意味着"列车在分区2范围内某处"。

这套系统的优点是技术成熟、可靠性高,缺点是分区长度固定,无法根据列车实际位置做更精细的控制——后续列车只知道前方某个分区被占用,但不知道列车具体在分区的哪个位置,必须按分区最前端来计算制动距离。

举个具体例子:列车以80公里/小时运行时,制动距离大约需要600米。如果固定闭塞的分区长度是1000米,那么后续列车必须在距离前车至少一个分区的地方停车。对于地铁来说,这意味着列车间隔不能小于2-3分钟。

固定闭塞还有一个固有的"颗粒度"问题:一个200米长的分区,列车无论在这个分区的哪个位置(开头、中间、末尾),对后续列车来说都是"占用"。后续列车必须等到这个分区完全空闲才能进入,即使前车已经驶出了90%,只剩最后20米还在分区内。这10%的"空闲时间"被浪费了。

对于低速、低密度的铁路来说,这点浪费不算什么。但对于城市轨道交通的发车间隔已经压缩到2分钟以内,每一秒都是宝贵的。固定闭塞的设计哲学,在高密度场景下就成了瓶颈。

固定闭塞分区的设计需要综合考虑多个因素:最高运行速度决定了制动距离,制动距离决定了分区长度;分区越短,追踪间隔可以越密,但设备投资也越高。同时还要考虑道岔区段长度、轨道电路的极限长度、信号机的布置位置等。在既有线上改造固定闭塞,分区位置的选择往往是妥协的结果——有些分区可能偏长,有些可能偏短,这种"先天不足"只能在后续运营中通过其他手段弥补。

7.2 移动闭塞的核心思想:不要固定分段

移动闭塞(Moving Block)解决了这个问题。它不再用固定分区,而是用列车当前位置和实时制动距离动态计算"防护点"。

后续列车收到的信息是"前方列车的精确位置",以及"基于当前速度和线路条件,到达防护点需要的制动距离"。系统根据这个动态计算结果,实时更新允许后续列车的最高速度和防护点位置。

移动闭塞的逻辑听起来简单,工程实现却极其复杂。关键问题在于:后续列车如何知道前车的精确位置?固定闭塞用轨道电路就能检测,但移动闭塞需要的精度是米级,不是分区级。

答案是双向通信。列车通过应答器知道自己的精确位置(精度±1米),这个位置信息通过无线链路发送给地面控制中心。地面控制中心汇总线路上所有列车的精确位置,计算出每列列车的移动授权(Movement Authority)——即"你可以继续开多远",然后通过无线链路发送给列车。列车收到移动授权后,ATO/ATP系统根据这个授权计算允许速度曲线。

这套机制的核心是:防护点不是固定在某处,而是跟随前车位置移动的。前车移动,防护点跟着移动;后续列车的移动授权随之更新。这就是"移动闭塞"的含义——闭塞点不再固定,而是实时跟随列车位置移动。

7.3 追踪间隔的数学:267米安全距离

移动闭塞的追踪间隔,取决于一个关键公式:安全距离 = 列车制动距离 + 防护余量。

假设列车以80公里/小时运行,制动距离约600米,防护余量约50米,那么后续列车与前车的最小追踪距离大约是650米。如果列车长度是140米,那么两列列车车尾之间的最小间距就是510米。

但这个计算是简化的。实际系统中,还需要考虑:列车定位误差(约±5米)、车载设备反应时间内的行驶距离、地面控制中心计算延迟期间的列车行驶距离、通信延迟期间的列车行驶距离。把这些因素全部纳入,安全防护距离通常在200-300米之间。

这就是为什么移动闭塞能让追踪间隔压缩到90秒的原因。假设列车平均速度60公里/小时(即16.7米/秒),90秒内列车行驶约1500米。扣除两列列车本身的长度(约280米),留给列车之间安全距离的空间约500米——这正好在移动闭塞的能力范围内。

固定闭塞做不到这一点。假设固定闭塞分区长度为1000米,列车长度140米,制动距离600米,防护余量50米。后续列车必须停在距前车至少1000米的地方,实际安全距离(从前车尾部算起)只有260米左右(1000-140-600-50=210米)。这个距离对应的最小追踪间隔,在60公里/小时平均速度下约为2-3分钟。

从3分钟到90秒,移动闭塞把追踪间隔压缩了一半。这意味着同样的线路,运力提升了一倍。对于高峰期挤不上地铁的城市来说,这是刚需。

7.4 从3分钟到90秒的压缩逻辑

移动闭塞压缩追踪间隔的核心逻辑,是把"空间"上的固定分段,变成"时间"上的实时计算。

固定闭塞的思维是:我知道前车在某个固定分区,所以我要在分区边界停车。移动闭塞的思维是:我知道前车的精确位置,所以我要在距前车足够远的地方停车。前者是空间思维,后者是时间思维。

时间思维更高效,因为列车之间的距离可以根据实际情况动态调整。前车急刹,后车也跟着急刹,追踪距离自动缩短;前车匀速,后车可以保持较小间隔跟随。这个动态调整能力,是移动闭塞压缩间隔的关键。

但移动闭塞也有代价。它需要高可靠性的双向无线通信——列车要发送自己的位置,地面要发送移动授权,任何一方的通信中断都可能导致系统降级。它还需要高精度的列车定位——应答器校准的测速仪系统,定位精度必须达到±1米级别。它还需要强大的地面计算能力——控制中心要同时跟踪线路上所有列车,实时计算每个列车的移动授权。

这些技术要求,让移动闭塞最初只出现在成本不敏感的城市轨道交通中。干线铁路因为线路条件复杂(道岔、坡度、曲线多),移动闭塞的工程难度更高。但随着技术进步,ETCS Level 3和CTCS-4已经开始在干线铁路上试验移动闭塞。


第8章:CBTC——城市轨道交通的"神经网络"

8.1 CBTC四大特征

CBTC(Communication Based Train Control,基于通信的列车控制系统)是城市轨道交通信号系统的标准配置。它的四大特征在IEEE 1474中有明确定义:

第一是连续双向通信。传统铁路信号靠固定分区传递信息,CBTC的列车与地面控制中心之间有持续的数据交换。地面知道列车的精确位置和速度,列车知道自己的移动授权。这个通信不是一问一答式的,而是连续的——每秒数次,实时更新。

第二是移动闭塞。CBTC不依赖固定分区,而是基于列车精确位置动态计算防护点。这让列车追踪间隔可以从3分钟压缩到90秒甚至更短。

第三是精确定位。列车通过应答器(Balise)校准测速仪,实现±1米级别的定位精度。应答器铺设在轨道上,存储着精确的坐标信息。列车经过应答器时,修正测速仪累积的误差,把定位精度保持在亚米级。

第四是系统冗余。CBTC的关键设备——车载计算机、地面控制服务器、无线通信基站——都采用冗余配置。一套设备故障,另一套无缝接管,列车运营不受影响。

IEEE 1474对CBTC的定义还有一层重要意义:它为"CBTC"和"准CBTC"划清了界限。早年有些信号厂商将"带应答器的ATP系统"称为CBTC,IEEE 1474出台后,缺少连续双向通信或移动闭塞的系统不能再自称CBTC。这套标准实际上起到了"正本清源"的作用。

8.2 车地通信:LTE-M与无线双向

CBTC的车地通信,经历了从点式应答器到连续无线通信的演进。

早期CBTC系统依赖应答器传递信息:列车经过应答器时,读取线路数据,但两次应答器之间没有通信。这种系统叫"点式ATP",不是真正的CBTC。真正的CBTC需要连续通信——列车与地面控制中心之间持续交换数据,位置更新频率达到每秒数次。

连续通信的实现方式有两种:基于无线电台的WLAN技术(如阿尔斯通的Seltrac、西门子的Trainguard),或基于移动通信的LTE-M技术(如中国铁路的CTCS-3)。

LTE-M是城市轨道交通CBTC的主流选择。它工作在1.8GHz专用频段,带宽比传统WLAN更高,时延更低,能够支持更精细的列车控制需求。中国城市轨道交通的CBTC系统普遍采用LTE-M,包括北京、上海、广州等城市的多数新建线路。

LTE-M还有一个优势:可以复用运营商的基站基础设施。与其每条线路单独建网,不如多家地铁公司共享一个LTE-M核心网。这降低了建设成本,也方便统一管理。

无线通信的挑战是可靠性。无线频谱可能受到干扰,隧道内的多径效应会影响信号质量。为此,CBTC的无线系统通常采用冗余覆盖:每段轨道有多个无线接入点,列车同时与多个接入点通信,一旦某个接入点信号变弱,立即切换到另一个。这种"无缝切换"技术,和手机通信的原理相似,但CBTC对切换时延的要求更严格——切换期间不能丢失任何控制指令。

8.3 移动授权:地面告诉列车能开多远

移动授权(Movement Authority,MA)是CBTC的核心概念。它是地面控制中心发送给列车的指令,告诉列车"从当前位置起,你可以继续向前行驶的距离"。

移动授权包含几层信息:起始位置(列车当前位置)、终止位置(前方安全边界)、线路限速(这段区间的最高允许速度)、临时限速(施工或故障导致的临时降速)。列车收到移动授权后,车载ATP根据这些信息计算"允许速度-距离曲线"——这条曲线告诉列车:以当前速度,还能继续开多远,到什么位置必须开始减速。

移动授权的终止位置是如何确定的?地面控制中心根据前车的精确位置,计算出"防护点"——再往前就是危险区域。防护点的位置 = 前车位置 + 列车长度 + 安全余量。后续列车的移动授权终止位置,就设定在防护点之前一点点。

这个计算是动态的。前车移动,防护点跟着移动;后续列车的移动授权随之缩短或延长。CBTC的地面控制服务器每秒数次更新所有列车的移动授权,并通过无线链路发送给列车。这个闭环让人想起交通信号灯的"绿波带"——但CBTC的精度高得多,响应也快得多。

移动授权还有一个关键特性:它是"连续的"。传统固定闭塞的"通行许可"在列车通过信号机后结束,下次通行需要等下一架信号机开放。CBTC的移动授权是连续更新的——列车从一个区段驶入另一个区段,移动授权无缝衔接,不需要停顿等待。这是压缩追踪间隔的关键。

8.4 三层速度防护曲线

CBTC的ATP速度防护,依赖三条曲线的叠加:线路限速曲线、临时限速曲线、紧急制动曲线。

线路限速曲线来自应答器存储的线路数据。每个应答器存储着这段线路的"档案":坡度、曲率、道岔位置。根据这些数据,ATP计算出每个点的最高允许速度。曲线形状取决于线路条件——弯道处限速低,直道处限速高。

临时限速曲线叠加在线路限速曲线之上。如果某段线路正在进行施工,地面会发送临时限速信息,ATP把这个信息叠加到允许速度曲线上,取两者中较严格的值作为实际限速。

紧急制动曲线是最外层防护。它计算的是"如果现在触发紧急制动,列车能在哪里停下"。这条曲线始终比允许速度曲线更"保守"——如果列车速度超过允许速度,常用制动介入;如果超过紧急制动触发值,紧急制动直接停车。

司机的人机界面(DMI)实时显示这些曲线。横轴是距离,纵轴是速度。允许速度曲线是一条向下倾斜的线——距离前方停车点越近,允许速度越低。司机按照这条曲线驾驶,确保列车永远不会突破任何一层防护。

三层曲线的设计哲学体现了"纵深防御":即使一层防护失效(常用制动没触发),还有下一层(紧急制动)。即使紧急制动也失效,还有物理意义上的制动距离余量。这种"层层设防"的思路,是铁路信号安全设计的核心原则。

CBTC系统的优势,正是建立在这三层曲线的基础上。它让列车控制从"粗放"走向"精准",从"分区级"走向"米级"。同样的线路,CBTC可以让运力提升50%以上,运营间隔从3分钟压缩到90秒。这是城市轨道交通高密度运营的技术基础。

第二部分:城市轨道时代

第9章:FAO全自动驾驶——当列车学会自己跑

9.1 一个周二早高峰的异常平静

2021年12月28日早晨8点17分,深圳地铁20号线列车驶入机场北站。站台工作人员通过手持终端确认乘客上下车完毕,按下"关门确认"按钮——列车其实早已"感知"到门已关好,只是在等待这个确认信号。

没有司机站在司机室,只有车载电视播放着到站信息。乘客站在开放式车头位置,透过玻璃窗观看隧道向前飞驰的视角。这种体验在传统地铁里不可能出现——司机室的门永远关着,乘客只能想象隧道里的黑暗。

这一天,全球已有超过50个城市运营了无人驾驶地铁线路。中国在此之前始终是跟随者:香港机场线用阿尔斯通系统、北京机场线用西门子设备、上海10号线用阿尔斯通Optonix。深圳20号线不同:信号系统来自交控科技,列车来自中车株机,核心技术全国产化。

这条全长8.43公里、设8座车站的线路,是中国首条采用GoA3等级全自动驾驶的地铁线路。列车从唤醒、出库、行驶、进站、开关门、洗车、入库,全部流程无需人工干预。值守员的存在,不是为了驾驶,而是为了处理"万一"——设备故障、乘客紧急求助、站台异常。

全自动驾驶不是"去掉司机"那么简单。去掉司机后,列车要根据传感器数据自己判断站台门状态、道岔位置、线路限界。有异物入侵时,要自己决定减速或停车。故障不能依赖司机发现,要靠系统自动检测和恢复。列车不是真的"一个人",而是有一个"远程团队"在后台支撑。

9.2 GoA0到GoA4:自动驾驶的四个等级

国际电工委员会(IEC)在IEC 62267标准中,将城市轨道交通的列车运行自动化分为5个等级,术语叫GoA(Grade of Automation)。

GoA0是纯人工驾驶,司机全程操作,加速、巡航、制动、开关门全部手动。早期地铁都是这个级别,司机既是操作者又是监控者,列车的运行状态全凭肉眼观察和耳朵听。

GoA1是有人自动驾驶(ATO),司机还在但只负责监控。系统自动完成加减速和巡航,但司机需要时刻注意线路状态,发现异常立即介入。北京地铁1号线改造后达到这个级别。

GoA2是半自动驾驶,司机只负责开关门和紧急处置,日常运行完全自动化。中国目前主流CBTC线路大多是GoA2等级。司机更像"安全监督员"而非"操作者"。

GoA3是无人驾驶自动驾驶,系统完成所有运行操作,但在线路关键站点有值守人员,可远程或现场监控。深圳地铁20号线是GoA3代表,列车最高速度120km/h,唤醒、休眠、洗车、进出库全部自动,只在站台设值守员。

GoA4是完全无人驾驶,正线无司机,控制中心完成所有操作。上海10号线(2010年开通)和北京大兴机场线(2019年开通)都是GoA4。大兴机场线更有挑战性——最高速度160km/h(中国地铁最高等级),GoA4加高速,制动距离长,定位难度高。

FAO(Fully Automatic Operation,全自动运行)这个词通常指GoA3和GoA4,即系统承担全部或大部分运行功能。交控科技把自己的FAO产品叫iFAO,已经形成系列——从iCBTC到iFAO,目标是覆盖GoA2到GoA4全套方案。

这个分级背后有一个核心逻辑:把需要快速反应的操作交给机器,把需要判断力的决策逐步移交给系统,最终实现人只处理异常。全自动驾驶的目标不是让机器取代人,而是让机器做它擅长的事(精确控制、不知疲倦),让人做机器做不了的事(综合判断、异常处理)。

9.3 消失的司机室:GoA4的技术图景

上海地铁10号线,2010年世博会前开通,是中国首条实现GoA4全自动驾驶的线路。开通之初,乘客最惊讶的不是"没有司机",而是"司机室开放了"——列车头尾两端原本的司机室被打通,变成开放式观光区。

这套系统来自阿尔斯通Urbalis 400,信号系统集成了GoA4升级包。列车在正线运营时完全无人驾驶,最高运行时速80公里/小时,8辆编组A型车。系统设计理念是:任何正常运营场景下,列车都应该能自己搞定。发车、加速、巡航、减速、进站、停车、开关门、折返,全部由信号系统自动完成。

GoA4真正复杂的地方不在正线运营,而在边缘场景——设备故障怎么办,信号中断怎么办,列车停在区间怎么办。上海10号线的解决方案是控制中心集中监控加站台值守员协助加车辆段远程唤醒的组合模式。

GoA4的技术架构包含几个关键子系统:

列车自动监控系统(ATS)负责行车计划的执行和调整,监控列车位置和状态,排列进路;区域控制器(ZC)计算移动授权,动态确定列车安全间隔;车载控制器(VOBC)执行速度监控和自动驾驶,接收ATS的行车指令,控制列车牵引和制动;车门控制系统与信号系统联动,确保列车门与站台门同步开关。

这套系统的安全核心是故障导向安全(Fail-Safe)原则:任何通信中断、设备故障、系统异常,都导致列车自动停车,而不是继续运行。信号系统永远假设"最坏情况",提前预留制动距离。GoA4不是"让列车自己跑就行",而是"让列车在任何情况下都能安全停下来"。

9.4 160公里/小时的挑战:北京大兴机场线

如果说上海10号线的GoA4代表了城市核心区的全自动驾驶,那么北京大兴机场线则代表了另一个极端:高速加无人驾驶。

大兴机场线全长41.36公里,设3座车站(草桥、大兴新城、大兴机场),连接北京市区和新建的大兴国际机场。2019年9月25日随机场同步开通,采用交控科技自主研发的iFAO系统,最高运行时速160公里/小时——这是中国地铁的最高速度等级,也是目前全球最快的GoA4地铁线路之一。

160公里/小时带来的技术挑战是全面的。首先是制动距离大幅增加:列车以160公里/小时行驶时,紧急制动距离超过800米,是80公里/小时列车的4倍以上。这意味着移动授权的计算必须更精确,安全余量必须更大,通信延迟必须更小。

其次是定位难度提高。高速下列车通过应答器(Balise)的时间窗口更短——列车以160公里/小时通过一个应答器的时间约22毫秒,而80公里/小时下约45毫秒。应答器校正是列车定位的关键手段,时间窗口缩短意味着定位修正的机会减少,对惯性测量单元和测速编码器的精度要求更高。

大兴机场线的另一个特殊之处是全天候运营。机场线需要配合航班时刻,凌晨和深夜都可能发车。传统有人驾驶线路在这个时段需要安排司机值守,成本高且司机状态难以保障;GoA4下,列车可以按计划自动唤醒、出库、投入运营,不存在"疲劳驾驶"问题。

iFAO系统在控制策略上做了优化:加速时渐进加速,避免急促推背感;进站制动时,根据当前位置实时计算最佳制动曲线,既能精准停车又不会顿挫。乘坐体验的优化需要更精细的控制算法,这也是高速FAO的技术难点之一。

9.5 FAO的核心技术:让列车"眼观六路"

全自动驾驶不是单一技术,而是一整套系统的协同。系统要协调工作,需要解决三个核心问题:我从哪里来、要到哪里去、路上会遇到什么。

列车定位回答"我从哪里来"。列车要知道"自己在哪",才能决定"该往哪开"。车载定位的核心是测速编码器加应答器校正加惯性测量单元的三融合方案。测速编码器(里程计)连续测量列车行驶距离,精度约±2-5米每公里,但存在累积误差;应答器是固定在线路上的电磁装置,列车经过时接收数据并修正累积误差,定位精度可达±1米;惯性测量单元测量列车加速度和角速度,辅助应答器之间的短时定位。三者融合,实现全程高精度定位。

移动授权回答"要到哪里去"。这是CBTC的核心,也是FAO的基础。区域控制器(ZC)根据后续列车的当前位置、速度及制动性能,动态计算"移动授权"——告知列车可以安全前行的最大距离。计算公式基于安全追踪距离:

d_safe = d_response + d_brake + d_safety_margin + d_position_error

其中:d_response是响应距离,等于速度乘以响应时间;d_brake是紧急制动距离,等于速度平方除以两倍紧急制动减速度;d_safety_margin是固定安全余量,通常50-100米;d_position_error是位置误差,由定位系统精度决定。

以80公里/小时运行为例:制动距离约205米,响应距离约6.7米,加上安全余量和位置误差,总安全追踪距离约267米,对应最小追踪间隔约90秒。在移动闭塞下,这个距离是动态的——前车移动,授权终点随之移动,不像固定闭塞那样被锁死在分区边界。

三层速度防护曲线回答"路上会遇到什么"。车载ATP(列车自动保护)实时计算三层曲线:ICE(初始制动曲线)是基于列车当前位置和前车位置计算的安全速度上限;EBC(紧急制动曲线)是ICE的安全包络,考虑系统响应延迟和制动加速度不确定度;SBC(常用制动曲线)是低于EBC的预警曲线,触发常用制动而非紧急制动。列车速度超过ICE,立即触发紧急制动;超过SBC但低于ICE,触发常用制动或告警。

FAO系统的特殊之处在于,这三层曲线必须覆盖更多场景——列车休眠唤醒时的低速防护、出库入库时的道岔限速、进站停车的精确制动曲线。场景越多,曲线计算越复杂,对车载处理器的性能要求也越高。

9.6 中国FAO的发展路径与未来

2010年,上海10号线开通时,中国还没有自主的GoA4技术。交控科技彼时刚刚完成北京地铁亦庄线的自主CBTC商业订单,FAO还是"下一代技术"。

2025年,中国已有超过100条FAO线路在建或运营,主流等级从GoA2-GoA3逐步向GoA4迁移。交控科技、卡斯柯、众合科技等国内厂商均具备FAO系统集成能力,iFAO、Urbalis、UNIVOICE等自主系统已在全国多地落地。

这个转变的关键节点是2019年。这一年,交控科技的iFAO系统在北京大兴机场线(160km/h GoA4)和山西太原地铁2号线(GoA3)同时开通,标志着国产FAO系统从"实验室"走向"商业运营"。2021年深圳20号线GoA3开通,2022年青岛6号线GoA4开通,国产FAO系统的商业版图持续扩张。

从产业角度看,FAO对中国城市轨道交通的意义有三层:第一层是运力提升,全自动驾驶可以压缩追踪间隔、提高发车密度;第二层是成本优化,减少司机配置可以降低人工成本,同时提高运营一致性;第三层是产业升级,FAO是信号系统金字塔的顶端,掌握FAO意味着掌握整套CBTC技术的完整链条。

FAO也面临挑战。系统复杂度是首要问题——场景越多,系统逻辑越复杂,故障诊断和运维难度越高。安全认证是另一道坎,GoA4系统的SIL4认证需要完整的安全生命周期管理,EN 50126/50128/50129标准体系是国际通行的认证框架,国内厂商经历多年才建立完整能力。运维人才同样稀缺,FAO线路需要的是既能懂信号系统又能懂车辆系统的复合型人才,而高校培养的节奏远跟不上行业发展。

FAO不是终点。下一阶段的技术方向,是车车协同和虚拟连挂——列车之间直接通信,进一步压缩追踪间隔,理论值可以达到现在的五分之一甚至十分之一。


第10章:中国CBTC生态——从技术引进到自主创新

10.1 2008年:谈判桌上的失利

2008年,北京地铁机场线即将开通。信号系统订单已经给了国外厂商,谈判桌上是一家中国企业派出的团队——领头人是北京交通大学的几位教授,领队叫郜春海。

谈判的结果是:技术合作可以,核心技术不卖。西门子派出的技术代表态度明确:可以把CBTC系统的组装和调试工作交给中方,但核心的移动授权计算、速度监控逻辑、安全认证体系,不会转让。当时中方团队已经跟踪CBTC技术多年,但"知道原理"和"能做出产品"之间,隔着一整套工程化能力和安全认证体系。

这就是2008年中国CBTC产业的真实处境:市场很大,技术很弱,格局被国外巨头牢牢把持。

西门子、阿尔斯通、阿尔卡特是当时的三巨头。西门子的LZB 700M系统进入中国最早,在北京、上海有多个项目;阿尔斯通的Urbalis系统紧随其后,在广州、深圳拓展市场;阿尔卡特的Seltrac系统则在香港和部分内地城市有应用。几乎所有一二线城市的核心地铁线路,信号系统合同都被这三家拿走。

这个场景折射出整个中国轨道交通装备行业的共同困境:市场换技术换不来核心技术的尴尬。问题不在于外资"不肯卖",而在于CBTC的核心——移动授权计算算法、SIL4安全认证体系——根本不是设备,是知识,是经验,是 decades of engineering practice积累出来的能力。花多少钱也买不来,只能自己一点点啃。

10.2 交控科技:从实验室到科创板

交控科技是中国CBTC产业国产化的一面镜子。

公司前身是北京交通大学轨道信号控制研究所,创始人郜春海是北交大教授,长期跟踪国际CBTC技术发展。2009年,研究所脱钩改制,郜春海带领团队成立交控科技,教授加工程师的创业组合。

交控科技的自主化路径分四个阶段:

第一阶段(2000-2005)是技术跟踪。团队跟踪西门子、阿尔斯通、阿尔卡特的CBTC技术发展,参与北京地铁13号线(2002年,中国首条CBTC试验线)的技术论证。这个阶段的核心任务是"看懂"——CBTC系统是怎么构成的,各个子系统之间的关系是什么,安全认证的框架是什么。

第二阶段(2005-2010)是引进吸收。与西门子合作,引进LZB 700M技术平台,在国内组装和二次开发。2008年北京地铁机场线,交控科技首次作为信号系统集成商参与,虽然核心技术仍是西门子的,但工程实施和项目管理能力得到了锻炼。2010年北京地铁亦庄线,是交控科技第一个全国产化CBTC商业订单——移动授权计算、速度监控等核心功能由交控自主完成,但底层平台仍基于引进技术。

第三阶段(2010-2015)是自主突破。自主研发iCBTC系统,突破核心技术(移动授权计算、速度监控),2015年获得SIL4安全认证(通过德国TÜV莱茵认证)。这是关键一跃——安全认证体系(EN 50126/50128/50129)是CBTC国产化的最大门槛,安全认证通过意味着自主系统可以进入商业运营。

第四阶段(2015至今)是FAO领跑。开发FAO系统,2019年北京大兴机场线(160km/h iFAO)商业落地,2021年深圳20号线(GoA3)商业落地。交控科技从"有CBTC产品"进化到"有FAO产品",完成了产品线的完整布局。

2020年7月,交控科技在科创板上市,代码688015.SH,被称为"科创板CBTC第一股"。上市募资超10亿元,主要投向FAO系统研发、既有CBTC系统升级、营销服务网络建设。这家脱胎于大学实验室的企业,用15年时间走完了国外巨头三四十年的路。

10.3 卡斯柯:合资模式的优与劣

卡斯柯是中国CBTC市场的另一个重要角色,背景与交控科技完全不同。

卡斯柯成立于1986年,是中国铁路通信信号集团(中通号,持股36%)与阿尔斯通(持股64%)的合资企业。阿尔斯通是控股方,这意味着卡斯柯本质上是阿尔斯通技术在中国本地化生产的基地。

卡斯柯的核心产品是Urbalis系统的本地化生产——阿尔斯通将Urbalis CBTC技术授权给卡斯柯,后者在国内进行组装、调试、二次开发和项目执行。优势是技术起点高,有阿尔斯通的质量体系和安全认证支撑;劣势是核心技术始终在阿尔斯通手里,卡斯柯的自主研发空间受限。

卡斯柯的市场策略是"高端国际技术加本地化服务",主要服务一二线城市核心线路。上海地铁10号线(GoA4)、17号线、北京地铁2号线等标杆线路,都使用了卡斯柯的系统。上海是卡斯柯的大本营——上海地铁信号系统订单中,卡斯柯占据主导份额,这与阿尔斯通和上海申通的长期合作关系密不可分。

合资模式的局限性在FAO时代逐渐显现。GoA4的核心技术——全自动驾驶的场景管理、故障诊断、远程控制——需要深度定制,而技术授权模式决定了定制开发的权限受限。近年来,卡斯柯也在加大自主研发投入,推出本土化FAO产品,但与交控科技等纯内资企业的竞争态势值得关注。

合资模式的本质是"用市场换技术"的渠道,但技术换到了什么程度,取决于中方团队的消化吸收能力。卡斯柯的优势是项目执行和服务响应速度快,产品可靠性有阿尔斯通品牌背书;劣势是在核心算法和前沿技术上,始终受制于外方合作伙伴的技术更新节奏。

10.4 众合科技:区域深耕与产业链延伸

众合科技的路径与交控科技不同,更侧重区域深耕和产业链延伸。

众合科技前身为浙江浙大海纳(浙江大学校企),主营业务包括半导体材料和轨道交通信号系统。2021年完成重组后在深交所上市(000925.SZ)。在CBTC领域,众合科技的核心产品是UNIVOICE系统——具备完全自主知识产权的CBTC系统,定位精度、移动授权计算、安全认证体系均自主完成。

众合科技的差异化竞争策略体现在两个方向:

第一是区域市场聚焦。众合科技在浙江(杭州、宁波)、重庆市场有较强存在感,服务杭州地铁1号线、5号线,重庆轨道交通2号线(单轨)等线路。区域深耕的好处是客户关系稳定,服务响应快;劣势是全国性扩张面临卡斯柯、交控科技等全国性厂商的竞争。

第二是产业链纵向延伸。众合科技是国内少数同时具备CBTC信号系统和AFC(自动售检票系统)能力的厂商。信号系统负责"跑",AFC负责"票",两者结合可以实现"跑票一体化"的弱电集成总包能力。这种纵向整合在地铁新建线路的弱电系统招标中具有竞争优势——业主倾向于一家总包而不是多头对接。

众合科技的另一个技术特色是重庆单轨信号系统。跨座式单轨的信号方案与地铁有本质区别:道岔转换时间约12秒(长于地铁道岔),无法使用传统轨道电路,信号设备安装空间受限。众合科技为重庆单轨提供的方案是计轴器加移动闭塞的混合架构——用计轴器检测轨道占用,用应答器加测速编码器定位,用ZC计算移动授权。这套方案在重庆2号线、3号线上验证,成为众合科技的技术名片之一。

10.5 浙大方原:高校技术溢出

浙大方原(全称浙江大学电气工程学院列车智能控制团队成果转化企业)是CBTC行业的另一个高校派代表,路径与交控科技类似,但规模和影响力较小。

浙大方原的技术特点是分布式计算机联锁技术(DCI)——区别于传统集中式联锁,分布式联锁将联锁逻辑分散到多个节点,提高了系统的可靠性和可维护性。浙大方原还依托浙江大学在工业控制领域的国家重点实验室,在基于IEC 61375列车通信网络标准(TCN)的车地通信方面有技术积累。

浙大方原的市场定位是技术特色型差异化竞争,主要服务浙江省内城市轨道交通,在杭州地铁、宁波地铁有项目。规模较小,尚未形成全国性竞争能力,但其技术特色在业内有一定认可度。

高校技术溢出是中国CBTC产业的一个共同起点。北京交通大学、浙江大学、同济大学等高校在轨道交通信号控制领域有长期积累,这些积累最终通过两种方式转化为产业力量:一是教授创业成立公司(如交控科技、浙大方原),二是高校团队以技术合作方式支持企业(如早期交控科技与西门子的合作)。

10.6 市场格局:从外资绝对主导到国产占据主流

从2008年到2025年,中国CBTC市场的格局经历了显著变化。

2008年前是外资绝对主导。西门子、阿尔斯通、阿尔卡特三巨头占据90%以上市场份额,国内厂商几乎没有存在感。这个阶段的标志项目是北京地铁1号线改造(西门子LZB 700M)、上海1号线延伸(阿尔卡特Seltrac)、广州1号线改造(西门子)。

2008-2015年是国产化破冰。交控科技亦庄线订单(2010年)是国产CBTC商业化的起点。此后,卡斯柯(阿尔斯通技术本地化)、众合科技、浙大方原等国内厂商逐步获得订单,但外资仍占主导。据中国城市轨道交通协会统计,2015年国内厂商订单占比约30%,外资约70%。

2015-2020年是国产化加速。交控科技获得SIL4认证后,投标竞争力大幅提升;卡斯柯、众合科技的本地化率持续提高。这个阶段的标志性事件是国产CBTC系统在广州地铁、上海地铁获得商业订单,打破了外资在核心城市的垄断。据行业协会统计,2020年国内厂商订单占比超过50%,首次超过外资。

2020年至今是FAO主导。GoA3/GoA4成为新建线路主流配置,交控科技iFAO、卡斯柯FAO、众合科技FAO等国产系统全面商业化。这个阶段的核心竞争不再是"有没有CBTC",而是"谁的FAO更稳定、谁的FAO场景覆盖更全"。国产系统在新建线路的中标率已超过70%,外资仅在少数高端项目(如上海新建线路)保持竞争优势。

中国CBTC国产化的成功,不是单一因素的结果,而是市场、政策、技术三个维度共同作用的结果。中国城市轨道交通的规模是欧洲和北美的总和,海量的项目给国内厂商提供了"练兵场"。西门子在全球每年CBTC项目数量有限,但交控科技每年可以参与几十个项目——项目经验积累的速度差异,决定了技术成长的速度差异。


第11章:应答器与列车定位

11.1 卫星那么远,应答器这么近

北京地铁1号线的列车司机,最清楚"知道自己在哪里"这件事有多重要。

老1号线用的是轨道电路,列车经过哪个轨道区段,地面设备就知道"这里有车"。但这种定位方式只知道列车在哪大约100米的范围内,具体在哪一米?不知道。这种精度在低速、固定闭塞时代勉强够用,但到了移动闭塞时代就成了瓶颈——后续列车只能知道前车在哪个区段,不知道前车具体在哪,想压缩追踪间隔,无从下手。

这和卫星定位遇到的困境有点像。GPS定位精度是5到10米,在开阔地带开车够用,但进了隧道就傻眼——卫星信号穿不透混凝土。地铁隧道里也一样,卫星信号进不来,只能靠别的方法。

地面应答器(Balise)就是地铁的"本地卫星"。它工作在2.4米频段(或者说,它根本不用频段——列车经过时电磁感应供电),定位精度±1米以内,误差不累积,响应时间毫秒级。它不依赖卫星,不依赖通信网络,只要列车经过,就能给出精确位置。

城市轨道交通的定位需求比高铁更复杂。高铁线路长、站间距大,定位误差几米影响不大;地铁站间距只有1公里左右,列车进站时要精确对准站台门,定位误差必须控制在1米以内。应答器就是实现这种精度的关键设备。

11.2 应答器工作原理:电磁感应与数据交换

应答器的工作原理,说起来并不复杂。

应答器本体是一个无源装置,埋在两根钢轨之间(或者说安装在轨枕上),内部是一个扁平的金属线圈和一块存储芯片。列车经过时,车载天线的振荡信号在应答器线圈中感应出电流——这个电流足以激活存储芯片,芯片把预先写入的位置数据发送出去,车载天线接收并解码,整个过程不超过10毫秒。

这个过程有三个关键点:

第一,应答器是无源的,不需要电池,不需要外部供电。列车经过时,感应电流激活芯片,数据发送完毕,芯片进入休眠。这带来了一个重要好处:应答器埋在轨道上,日晒雨淋、温度变化、维修困难,但只要线圈不断、芯片不坏,就能一直工作。维护成本极低,这是应答器在铁路领域广泛使用的重要原因。

第二,数据传输是单向的——应答器把数据"告诉"列车,列车不能"问"应答器问题。每个应答器里写死的是固定数据:线路参数、应答器编号、距离下一应答器的距离等。列车收到这些数据后,结合自身的测速编码器数据,自行计算出当前位置。

第三,应答器分固定应答器(FB)和可变应答器(VB)两种。固定应答器存储的数据是固定的;可变应答器可以接收地面控制器的指令,根据列车运行方向、线路限速等因素,发送不同的数据。城市轨道交通中,可变应答器用于站台区域、临时限速区段等需要动态数据的场景。

应答器与列车的数据交换基于IEC 60795和IEEE 1474.2标准。这些标准规定了应答器的物理尺寸、传输协议、数据格式。全球主要CBTC厂商的应答器都遵循这些标准,这也是不同厂商设备可以互联互通的技术基础之一。

11.3 定位精度:±5米是怎么做到的

列车定位依赖三个手段的融合:测速编码器、应答器、惯性测量单元。

测速编码器装在列车轴端,每转一圈产生固定数量的脉冲(比如96个或128个),连续计数就能推算出行驶距离。以80公里/小时运行为例,列车每秒前进约22.2米,编码器每秒产生约600到1000个脉冲,测量分辨率约2到4厘米。看起来精度很高,但问题在于误差会累积——轮径磨耗、轮子打滑、轨道湿润,都会导致测量偏差。长距离运营后,累积误差可能达到几十米。

应答器的作用是"校准"测速编码器。线路上每500到1000米设置一个应答器,列车经过时读取应答器数据,获得精确的绝对位置,然后把这个位置和编码器推算的位置对比,得出编码器的偏差值并修正。通过这种方式,累积误差被控制在应答器间距的范围内——每500米最多偏差几米,取半就是±2.5米。再加上应答器自身的定位精度(±0.5米),综合定位精度约±1米。

但应答器校正是离散的——列车在两个应答器之间运行时,只能靠测速编码器推算。这段时间里,如果轮子打滑(空转),推算距离就会比实际距离大。解决办法是惯性测量单元(IMU)。IMU测量列车加速度和角速度,通过积分推算位移和姿态变化。即使轮子打滑,只要列车的惯性运动状态被IMU捕捉到,系统就能判断出推算数据异常并修正。

测速编码器加应答器加惯性测量单元的三融合方案,是目前城市轨道交通定位的标准配置。三个手段各有优劣:测速编码器连续、实时,但有累积误差;应答器精确、无累积,但离散分布;IMU连续、自主,但有漂移。融合的核心思想是让三种手段互相校验、互相补充,使列车在全程任意位置都能获得高精度定位。

具体融合算法各有不同,有的用卡尔曼滤波,有的用互补滤波,有的用多源信息融合。IEEE 1474.1标准只规定功能要求,不规定具体算法,各厂商的算法是竞争的核心之一。

11.4 应答器的工程挑战

应答器看起来简单——就是埋在轨枕间的一个小盒子,但工程实践中要解决的问题不少。

首先是安装精度。应答器必须精确位于轨道中心,偏差过大会影响列车读取效果。地铁施工时,应答器通常用专用支架固定在轨枕上,安装后需要用全站仪测量定位,确保误差在±5毫米以内。这比普通轨道设备的安装精度要求高出一个数量级。

其次是抗干扰。地铁隧道里有各种电气设备——牵引电机、制动电阻、辅助电源,这些设备产生的电磁干扰可能影响应答器信号的接收。应答器天线和列车天线之间的耦合效率,受环境影响较大,尤其是隧道壁的水渍、杂物都会造成信号衰减。设计时需要考虑在最不利条件下(如积水、结冰)仍能可靠通信。

第三是维护检测。应答器是无源的,没有自检功能,如何确认它工作正常?答案是列车经过时自动检测——车载系统记录每次经过应答器时的信号强度和数据接收情况,如果连续多次读取失败,系统报警提示工务人员现场检查。这种"被动检测"方式不需要人工巡检,但需要积累足够的数据才能判断故障。

最后一个挑战是配合轨道维护。地铁换轨、打磨、更换道岔等作业时,应答器需要临时拆装。如果应答器位置动了但没有重新校准,定位数据就会出错,严重时会导致列车产生"位置幻觉"——系统以为列车在某个位置,实际在另一个位置。这是非常危险的情况,应答器拆装必须有严格的作业流程和复核制度。

11.5 从"每500米一个"到更稀疏的布置

传统应答器布置间距是500到1000米,这个数字是怎么来的?

500米是综合考虑的结果。间距太大,两应答器之间的定位精度会下降——测速编码器累积误差太大,即使有IMU辅助也难以保证精度。间距太小,应答器数量增加,建设和维护成本上升,而且列车通过时数据交换过于频繁可能造成干扰。

但技术进步正在改变这个格局。

第一个变化是测速编码器精度的提升。新一代编码器采用多通道设计,能同时检测轮径变化、空转打滑,误差控制比老产品更好。

第二个变化是IMU性能的提升和成本下降。MEMS IMU(微机电系统惯性测量单元)精度越来越高,价格越来越低,10年前只能用在航空航天的高端IMU,现在几千块就能买到。IMU性能的提升,使得应答器间距可以拉大。

第三个变化是LTE-M和5G通信网络的普及。车地通信带宽增加后,地面控制器可以更频繁地向列车发送线路数据(如坡度、曲线等),车载系统结合这些数据和列车动力学模型,可以更精确地推算位置。这叫做"地图匹配"——不是靠应答器,而是靠线路数据库。

基于通信的定位增强(Communication-Based Position Enhancement)是一个技术方向。列车通过车地通信获取更多线路参数,结合自身的速度、加速度数据,可以在更长距离内保持高精度定位。目前试验线验证的结果是,在LTE-M覆盖良好的条件下,应答器间距可以拉大到2到3公里。

但完全取消应答器还不现实。应答器是列车定位的"锚点"——它是唯一不依赖任何外部设备的绝对定位手段。通信可能中断,IMU可能漂移,只有应答器能在任何情况下给出精确的绝对位置。除非出现另一种不依赖外部基础设施的定位技术,否则应答器仍是地铁定位系统的基石。

应答器技术的未来演进方向,是从"被动读取"走向"主动查询"。目前的应答器只能单向下发数据,未来的可变应答器(VB)可以接收车载系统的查询请求,根据请求内容返回不同数据。这将增强定位系统的灵活性,但也带来了新的安全挑战——双向数据交换需要额外的安全机制来防止数据篡改和欺骗攻击。

地面应答器与车载天线之间的耦合方式也值得关注。列车经过应答器时,车载天线在应答器正上方读取效果最好;但高速下列车通过应答器的时间窗口很短,天线需要具备快速捕获和解析能力。目前的车载应答器天线已经实现了数字化,信号处理算法可以补偿部分耦合效率损失,但物理层面的限制仍然存在。未来随着AI技术在信号处理中的应用,应答器数据的提取和校验能力有望进一步提升。


第12章:互联互通的难题

12.1 为什么不同厂商的设备不能直接对话

2015年,深圳地铁一条线路改造时遇到了棘手问题。

这条线路原本用的是西门子的CBTC系统,改造时业主想引入交控科技的设备以降低成本。但两家设备对接时出了状况——报文格式不兼容,交互逻辑有差异,联锁接口对不上。一番调试后勉强能用,但系统的稳定性和安全认证的有效性都打了折扣。

这背后的问题是:CBTC系统不是一种标准产品,而是各厂商用自己的架构、语言、协议搭建的独立系统。就像不同手机品牌的数据线——虽然都叫"充电线",但接口形状、充电协议各不相同,原装线才能发挥最佳性能。

CBTC系统的差异体现在三个层面:

第一是硬件架构。西门子用专有控制器,阿尔斯通用工业PC加专有接口,卡斯柯用基于X86的通用计算平台。硬件不同,替换时就涉及复杂的兼容性测试。

第二是软件协议。移动授权的报文格式、速度监控的数据结构、列车识别的编码方式,每个厂商都有自己的定义。IEEE 1474只规定了功能要求和性能指标,没有规定具体的数据格式和交互协议。就像"打电话"的规定——可以规定接通时间不超过多少秒,但不能规定用什么语言说话。

第三是安全认证。CBTC是SIL4安全系统,任何改动都需要重新认证。如果把西门子系统的一个模块换成交控科技的模块,整套系统的安全认证就失效了——因为认证是基于特定硬件软件配置的,改变任何部分都意味着需要重新认证。

这就是CBTC行业的"锁定效应"——业主选择了一家厂商,就几乎只能在这家厂商的生态里继续下去。升级、扩容、运维,都依赖原厂商。这对业主是不利的,对行业发展也是不利的。

12.2 RSSP-I:环形网络的安全通信

互联互通的第一步,是解决安全通信的问题。

RSSP-I(Railway Signal Safety Protocol-I,铁道信号安全协议第一版)是中国自主制定的安全通信协议。它的核心设计思路是:在不兼容的各厂商系统之间,建立一层统一的"翻译层",让不同厂商的设备可以交换关键安全信息。

RSSP-I的物理层是环形网络。多个车站的联锁设备通过环形网络连接,每个节点既接收上一节点的数据,也向下一节点转发数据。数据沿环单向流动,每个节点都能收到环上所有其他节点的数据。这种拓扑结构的优势是:即使环上某处断裂,数据仍能沿另一个方向到达所有节点,可靠性高。

RSSP-I定义了三种报文:正常周期报文、缩短周期报文和帧校验报文。正常周期报文每250毫秒发送一次,包含列车位置、速度、移动授权请求等信息;缩短周期报文在紧急情况下(如前车急刹)发送,周期缩短到25毫秒以内;帧校验报文用于检测通信链路是否正常。

RSSP-I的安全机制包括双重验证和失效检测。发送方在报文中加入原始数据和校验码,接收方收到后先用校验码验证数据完整性,再解析数据内容。如果校验失败或通信中断,系统判定为"失效",导向安全侧——列车停车。

RSSP-I主要用在城际铁路和干线铁路的列控系统,以及地铁的联锁站间通信。它的局限性是:环形网络拓扑对光纤铺设要求高,不适合地铁站间距小、设备密集的环境;在高铁的GSM-R无线环境下,RSSP-I的性能也不如专用的无线通信协议。

12.3 RSSP-II:双套冗余的以太网方案

RSSP-II(Railway Signal Safety Protocol-II,铁道信号安全协议第二版)是RSSP-I的升级版本,主要改进是:把环形网络的物理层换成了以太网,并引入了双套冗余机制。

以太网是目前最普及的局域网技术,成本低、设备多、维护方便。但普通以太网不保证实时性——数据可能因为交换机排队而产生不确定延迟,这对安全苛求系统是不可接受的。RSSP-II的解决方案是:专用频段加优先队列加实时协议(TRE)的组合。专用频段保证带宽,优先队列保证关键报文的优先传输,实时协议保证数据在确定时间内到达。

双套冗余是RSSP-II的核心设计。每个安全通信节点都有两套独立的通信处理单元(主套和备套),同时运行相同的数据处理。主套故障时,备套无缝接管;备套故障时,主套继续运行同时报警。两套设备之间持续互相监控,任何异常都能在毫秒级内检测并切换。

RSSP-II的报文周期比RSSP-I更短——紧急报文周期可以缩短到5毫秒以内,这对高速运行的高铁列控尤为重要。城市轨道交通的CBTC系统也越来越多采用RSSP-II作为车地安全通信的协议层,尤其是在LTE-M网络环境下。

但RSSP-II也有局限性。双套冗余意味着设备成本翻倍,系统复杂度也翻倍;以太网交换机的配置需要专业团队;不同厂商的RSSP-II实现仍有细微差异,互联互通测试仍是必要的。

12.4 ETCS:欧洲的"普通话"

欧洲解决这个问题的方式,是制定统一的列车控制系统标准:ETCS(European Train Control System,欧洲列车控制系统)。

ETCS的设计理念是"分层解耦":把铁路基础设施(信号、轨道电路、应答器)和车载设备(列车控制器、制动接口)分开,中间通过标准化接口连接。只要车载设备符合ETCS标准,就可以运行在任何符合ETCS标准的线路上——就像手机只要支持某种制式,就可以接入任何运营商的网络。

ETCS分为多个等级(Level),从Level 0到Level 3,适用场景不同:

Level 0是车载设备独立工作,只显示线路最大速度,不依赖地面信息——适用于还没有ETCS基础设施的老线路。

Level 1是在传统信号系统基础上叠加ETCS,列车通过时接收应答器发送的移动授权信息,司机仍看地面信号,ETCS起监督作用。

Level 2取消了地面信号,列车完全依赖无线通信(GSM-R)获取移动授权和线路信息,仍保留应答器用于定位。

Level 3是真正的移动闭塞系统,列车定位和移动授权全部通过无线通信实现,不再依赖轨道占用检测——这意味着可以取消轨道电路,或者用虚拟闭塞代替。

ETCS的核心是EURORADIO协议——一种安全通信协议,类似于RSSP-II但针对铁路特点优化。EURORADIO基于双向认证和数据加密,保证车地通信的安全性;采用面向连接的可靠传输,保证报文不丢失、不重复。

ETCS在在欧洲高铁网络中得到广泛采用。德国高铁ICE、法国TGV、意大利Frecciarossa,只要运行在ETCS覆盖的线路上,都使用同一套车载设备和通信协议。这带来的好处是:列车跨国运营成为可能,铁路运营商可以灵活调配车辆,乘客可以坐一趟车直达多个国家。

但ETCS的推广也面临挑战。欧洲各国铁路基础设施差异大,更新改造需要巨额投资;各厂商的ETCS实现仍有差异,完全互联互通需要大量测试;ETCS的技术复杂度和认证成本都很高,小型铁路运营商难以承担。

12.5 中国CTCS:兼容与独立

中国铁路有自己的列车控制系统标准:CTCS(Chinese Train Control System,中国列车运行控制系统)。

CTCS的设计思路与ETCS类似,也是分层解耦、标准化接口。CTCS同样分为多个级别,从CTCS-0到CTCS-4,对应不同的应用场景:

CTCS-0是既有信号系统的升级版,保留地面信号,车载设备提供超速防护——相当于ETCS Level 0/1的国内版本。

CTCS-1基于轨道电路和应答器,定位精度比CTCS-0高,适用于普通铁路和部分高速铁路。

CTCS-2基于应答器定位加无线通信(GSM-R),移动授权通过无线发送,最高运行速度250公里/小时——相当于ETCS Level 2。

CTCS-3基于更高速率的无线通信(LTE-R或5G),最高运行速度350公里/小时以上,用于高铁主线路。

CTCS-4是正在发展中的真正移动闭塞系统,取消轨道电路,完全依赖无线通信和列车自主定位——对应ETCS Level 3。

CTCS与ETCS的关系,既是竞争又是兼容。中国高铁在走出去时(如雅万高铁、中老铁路),会面临ETCS和CTCS的选择——如果目标国已经采用ETCS标准,中国列车需要加装ETCS车载设备;如果采用CTCS标准,则可以直接出口。但CTCS和ETCS的底层协议不同,EURORADIO和RSSP-II不能直接互通,需要转换网关。

中国城市轨道交通的CBTC系统与CTCS的关系相对独立。地铁CBTC主要采用WLAN/LTE-M无线通信,与高铁的GSM-R/LTE-R不同;地铁CBTC的定位依赖应答器加测速编码器,与高铁的应答器加ATP双定位也不同。但两者在安全协议(RSSP-I/II)、功能架构(移动授权、三层速度防护)上有共通之处。

CTCS的发展方向是"走出去"——随着中国高铁出口的推进,CTCS作为中国标准需要与ETCS在国际市场上竞争。兼容ETCS是中国CTCS设备的一个选项,部分国内厂商已经开发了同时支持CTCS和ETCS的双模车载设备。这个方向的发展,取决于中国高铁海外项目的推进速度和目标市场的选择。

12.6 互联互通的测试与认证

互联互通的真正难题,不在于协议设计,而在于测试和认证。

两个厂商的设备要互联互通,必须经过严格的互联互通测试(Interoperability Testing)。测试内容包括:报文格式是否正确解析、移动授权是否能正确交换、列车识别是否成功、故障时是否能正确导向安全。测试过程需要双方工程师共同参与,在真实或仿真环境下逐一验证每个交互场景。

但测试只是第一步。测试通过后,整套系统需要重新进行安全认证。因为即使两套设备各自通过了SIL4认证,组合后的系统是否能保持SIL4安全等级,仍然需要评估。这正是CBTC行业"锁定效应"难以打破的根本原因——换一家厂商的设备,不仅仅是接口对接的问题,而是整套系统需要重新认证,成本极高。

中国城市轨道交通行业正在推动建立统一的CBTC互联互通标准。中国城市轨道交通协会发布了《城市轨道交通CBTC互联互通接口规范》,定义了车地通信、区域控制器联锁、设备维护等关键接口的数据格式。这套规范参考了IEEE 1474和IEC 61375等国际标准,结合中国城市轨道交通的实际情况进行了本地化。规范发布后,新建线路可以按照统一接口设计,为未来跨厂商设备混用提供了技术基础。

但标准的落地需要时间。已经建成的线路不可能推倒重来,新标准的适用范围主要是新建线路。而且标准的执行力度、如何处理执行中的偏差、偏差如何认证,都是需要解决的工程问题。互联互通的梦想与现实之间,还有很长的路要走。


第二部分完稿字数:第9章约3500字,第10章约3200字,第11章约3000字,第12章约3300字,总计约13000字

参考文献:IEC 62267:2009;IEEE 1474.1-2004;EN 50126/50128/50129;交控科技招股说明书(2020);深圳地铁20号线开通公告(2021);北京大兴机场线技术通报(2019);中国城市轨道交通协会年度统计报告(2020-2024);IEC 60795;IEC 61375

第三部分:神经末梢与互联

铁路信号系统的魅力,往往不在那些宏大的架构叙事里,而在每一根钢轨、每一组道岔、每一个光点的细节深处。当一列高铁以350公里的时速穿越夜空,轨道电路在沉默中感知列车的存在,应答器在列车底部闪过时校准着位置误差,道岔在毫秒之间完成一次艰难的转身——这些"神经末梢"级别的细节,构成了整张信号网络最坚实的安全基底。本部分将深入这些关键设备的工作原理与技术演进,并最终将视野拓展到列控系统的互联互通标准——从欧洲的ETCS到中国的CTCS,从传统以太网到时间敏感网络,信号系统的"血管"正在经历一场静默的革命。


第13章:轨道电路——沉默的守护者

13.1 故事切入:深夜里的"幽灵列车"

2019年3月的一个冬夜,京沪高铁某区间列控中心突然弹出一条报警:区间轨道电路显示"红光带"——意味着该区段被列车占用。调度员正准备组织后续列车减速停车,紧接着的反馈却让他后背发凉:同一时刻,车载设备显示该区间空闲,地面与车上的两套独立安全检测系统在同一时刻得出了完全相反的结论。

按照"故障导向安全"的原则,信号系统必须按最危险的假设来处理。但两套独立系统同时"说谎"的可能性几乎为零。排查进行了72小时,工程师们最后发现的原因令人不寒而栗:轨道电路的钢轨绝缘接头处,因长年微渗水形成了等效电阻通路。当一列货运列车以60公里时速通过时,车轴重量在钢轨接缝处产生的微小形变,恰好让漏电电流通路"时断时续",在某些车速下呈现出"占用"的假象。这不是设备故障,而是物理世界的一种"巧合"——一种在设计阶段从未被充分验证过的边界条件。

这个故事揭开了本章的主题:铁路信号系统中最基础却最关键的轨道空闲检测技术。轨道电路、应答器、计轴器,这三种技术构成了铁路区间占用检查的"三剑客"。它们各自独立、互为冗余,守护着每一寸线路的安全。它们做的事情看似再简单不过——判断一段轨道有没有车——但恰恰是这种简单,承载了整个信号系统最根本的信任。

13.2 轨道电路的本质:一根铁轨如何"看见"列车

轨道电路是铁路信号系统中最经典、最广泛使用的轨道占用检测装置。说来有趣,它的原理和手电筒断路报警器异曲同工——通道被遮断,光就灭了;列车开进来,电路就变了。工程师们在每段轨道的两端设置电气绝缘(绝缘节),然后在这段被隔离的轨道上施加一个特定的信号电压。列车一旦驶入,车轮跨接在两根钢轨之间,将电路短路,接收端的电流特性随之改变——检测器感知到这种变化,立刻知道:轨道被占用了。

这个设计的精妙之处在于"冗余思维":列车本身成为了检测回路的一部分。没有列车,就没有回路的显著变化,检测器始终处于安静的守望状态。列车驶入时,车轮跨接在两根钢轨之间,相当于在电路中并联了一个低电阻支路,接收端电流骤然增大,轨道继电器落下,区段显示"占用"。列车驶出后,电路恢复原状,轨道继电器吸起,区段显示"空闲"。

最早的轨道电路是交流计数式,源于20世纪初的美国。原理很直白:在轨道一端发送一个特定频率的交流信号,另一端接收。当列车车轮跨在钢轨上时,信号的幅度、相位或计数规律会发生变化,接收端据此判断是否有车。20世纪80年代,中国铁路从法国引进了UM71轨道电路——一种无绝缘节的音频轨道电路。发送端发送移频键控(FSK)信号,频率在1685Hz到2600Hz之间,通过检测载频和低频信息来判断轨道状态。UM71有一个根本性缺陷:需要长长的电缆回路来补偿轨道线路的衰减,每个区段都需要独立的发送和接收设备,电缆的电阻、电容、电感都会影响信号质量,延长到十几公里后,信号衰减就成了严峻挑战。

13.3 音频轨道电路:频率分区的智慧

2000年代,中国铁路科研人员在UM71的基础上开发出ZPW-2000系列轨道电路,这是真正意义上的技术跨越。

ZPW-2000A的核心创新是"邻线干扰防护"和"一体化轨道电路"设计。科研人员用计算机仿真技术优化了轨道电路的匹配电阻,使信号能在钢轨上传输更远的距离。在理想条件下,一个ZPW-2000A轨道区段可以覆盖1.4公里——比UM71的800米提升近一倍。更重要的是,ZPW-2000A引入了"闭环检查"的概念:发送端和接收端共享同一个CPU模块,任何一方的故障都会立即被发现。这是从"被动检测故障"到"主动监控自身"的安全理念转变,在铁路信号领域具有划时代意义。

此后,科研人员又开发了ZPW-2000R、ZPW-2000K等系列,分别用于重载铁路和高速铁路等不同场景。ZPW-2000R针对25吨轴重重载条件做了适应性设计;ZPW-2000K则优化了高速运行时轮轨接触噪声的抑制算法。

音频轨道电路的频率分区设计,本身就蕴含着通信工程的古老智慧。为了防止相邻区段信号互相干扰,不同区段使用不同的载频频率——以ZPW-2000系列为例,相邻区段载频通常相差170Hz(如1700Hz与2000Hz),确保接收端能准确识别本区段的信号。这种"频率隔离"的思路,与通信系统中的频分复用技术如出一辙。

然而,轨道电路始终面临一个无法回避的物理悖论:钢轨既是信号通道,又是列车行驶的轨道。列车高速通过时,轮轨之间的接触电阻并非恒定——钢轨表面有薄层水膜、油污或铁锈时,接触电阻会急剧下降,接收端电压异常升高,系统可能误判为"轨道空闲",这就是"飞车"现象的根由。2011年甬温线"7·23"事故的技术调查分析中,雷电干扰导致轨道电路短暂"失明"是重要的关注点——雷击产生的浪涌电流在数百毫秒内干扰接收端信号判断,而列车在此时恰好高速驶入,轨道电路可能来不及做出反应。这也是现代高速铁路必须同时配备轨道电路和应答器/计轴等冗余检测手段的根本原因。

13.4 计轴器:数车轮的替代方案

与轨道电路的"电气特性检测"不同,计轴器(Axle Counter)的原理更加直观:直接统计通过某一点的列车轴数。

计轴器通常安装在轨道侧面或道心,采用两组红外光电传感器或电磁传感器。列车车轮经过时,传感器检测到车轮金属辐板产生的信号脉冲。通过分析脉冲的时序和宽度,计轴控制单元判断这是列车的哪个轴,并进行累加计数。列车完全通过一个计轴区段时,控制单元比较进入和离开的轴数:两者相等,说明列车已完整通过,该区段空闲;不相等,说明有列车仍占用,或者计轴设备本身出现了故障。

计轴器的核心优势在于"端到端验证":它不依赖钢轨的电气特性,不受道床漏泄电流、钢轨绝缘老化等因素影响。这使得它在长大隧道、桥梁、电气化区段等轨道电路容易受干扰的环境中,成为不可替代的备选方案。

在中国铁路系统中,计轴器主要应用于自动闭塞区间的离去区段检测,以及大型编组站的区段占用检查。计轴器的轴数统计需要严格的同步机制——多个计轴点之间的通信延迟必须控制在毫秒级,否则可能出现"跳轴"现象,导致区段状态判断错误。

计轴器最大的安全隐患是"错计"和"漏计"。"错计"通常发生在列车以非正常姿态通过时——列车在道岔处蛇形运动,或出现"空转",导致同一轴被多次计数。控制单元通常设置一个时间窗口过滤重复信号,但车速过低或轨道几何参数异常时,过滤算法可能失效。"漏计"更危险:列车车轮金属质量分布不均,或车轮磨损导致轮缘变薄时,传感器可能无法有效检测到车轮通过。这种情况在大轴重货运列车上尤为突出。现代计轴器采用"多传感器冗余"设计,同一计轴点安装两个独立传感器模块,只有两者计数结果一致时才认为是有效计数,将系统的误报率降低了数个数量级。

13.5 行业视角:三种技术的共生态

轨道电路、应答器、计轴器并不是相互替代的关系,在不同场景下各有优势。从可靠性看,轨道电路技术最成熟,全球应用案例最丰富,但受电气化干扰影响大;计轴器在隧道、桥梁等特殊区段可靠性更高,但维护成本也更高;应答器本身不提供占用检测,需要与其他技术配合使用才能形成完整方案。

从经济性看,轨道电路铺设成本最低,每公里约15至20万元;应答器每组约5至8万元,但需要配套的地面电子单元和车载设备;计轴器每套约20至30万元,主要贵在控制单元和通信设备。

一个值得深思的问题是:为什么需要三种独立的技术来检测同一件事——"这段轨道有没有车"?答案藏在铁路信号系统的底层逻辑里:安全不是选择最优方案,而是消除单点故障。任何一种检测技术都有其物理极限和工程边界。轨道电路会在雷击时失准,应答器会在无线干扰时丢包,计轴器会在车轮异常时错计。但当三种技术同时使用时,它们的故障相互独立,同时失效的概率趋近于零。

这也解释了为什么,即便在CTCS-3已成为高铁主流的今天,轨道电路依然没有被废除。它静静地躺在钢轨之间,用最原始却最可靠的方式,守护着每一个区间。这种"冗余设计"哲学贯穿了整个铁路信号系统的发展史——从最初的机械联锁到后来的计算机联锁,从固定闭塞到移动闭塞,每一步进化都不是简单的"新的取代旧的",而是"新的与旧的共存、互为备份"。


第14章:信号机的黄昏

14.1 从地面信号机到司机室显示

2022年6月的一个清晨,北京东郊某高铁综合实验段上进行了一场特殊的"告别演出":最后一架蒸汽时代的臂板信号机被缓缓拆除,取而代之的是完全基于电子显示的车载信号。这架信号机建于1980年代,经历过无数次电气化改造、外壳更换、内部设备升级,却始终保持着最初的设计形态——木质横臂、红色主体、三盏信号灯。它的"退休"没有鲜花,没有仪式,只有一辆工程车和几个穿着工装的信号工。

但对于在场的几位老信号工来说,这一天意味着一个时代的终结。他们的父辈曾在蒸汽机车的轰鸣声中,靠着这些信号机的灯光指引列车穿过黑夜。今天,他们亲眼见证了这些"沉默的灯塔"的最后一程。这个故事引出了本章的主题:铁路信号机——这个伴随铁路发展将近两个世纪的视觉信号装置——如何在技术进步和运营需求的双重推动下,逐渐从"前台"走向"后台",从"主动引导"变为"备份显示"。

铁路信号机的历史可以追溯到1830年代的英国。蒸汽机车刚刚投入商业运营,列车的制动距离远超视觉可见范围,碰撞事故频发。为了解决这个问题,铁路公司雇佣专门的"信号员",他们站在线路旁的土堆上,手持红色旗帜,看到对面有列车时便挥动旗帜警告。这种人肉信号显然无法满足大规模铁路运营的需求。1840年代,机械臂板式信号机问世,通过钢丝和配重机构将一块涂有红色或白色的木制臂板立起或降下。臂板45度角表示"减速",水平表示"停车"。1860年代,臂板信号机开始配备夜间照明设备——最初是煤油灯,后来改为电灯,铁路信号从此进入"昼夜同貌"的时代,夜间和白天的信号显示有了统一含义。

1900年代,随着电气技术的成熟,能够自动改变显示状态的色灯信号机开始普及。这种信号机内部装有三个不同颜色的灯泡(红、黄、绿),通过电磁继电器控制哪个灯泡点亮。列车接近时,轨道电路自动触发继电器,信号机根据轨道占用情况自动转换显示。色灯信号机的出现标志着铁路信号从"人工控制"向"自动控制"的历史性跨越——它不仅减轻了人工负担,更重要的是消除了人为失误的可能性。

14.2 为什么地铁车站看不到信号机

理解信号机"末路"的关键,是理解一个趋势:信号功能正在从"地面展示"向"车载显示"转移。

在传统的CTCS-2级列控系统中,信号机仍然扮演着重要角色。司机需要通过瞭望地面信号机的显示来判断列车的运行许可:信号机的绿灯意味着"全速运行",黄灯意味着"减速",红灯意味着"停车"。但在CTCS-3级列控系统中,情况发生了根本性变化:列车的运行许可不再由地面信号机决定,而是由车载设备根据与地面控制中心的无线通信实时计算。车载显示屏上直接显示"目标距离"和"目标速度",司机不再需要解读地面信号的灯光含义。

在地铁系统中,这个问题更为彻底。城市轨道交通(尤其是新建线路)几乎完全取消了地面信号机。列车运行完全依赖车载信号,司机不需要也不被允许以地面信号作为行车凭证。地铁的行车凭证是车载DMI(司机显示单元)上的推荐速度,列车自动运行系统(ATO)根据这个速度自动控制列车加减速。这是一种"车本位的信号制式"——信号显示随列车移动,而不是固定在地面某个位置。

在CTCS-3线路的核心区段,地面信号机实际上已经"空心化"——它的显示状态与列车的实际运行控制完全脱钩。保留它,纯粹是为了满足某些特殊情况下的目视瞭望需求,以及作为系统降级时的备份。当CTCS-3的无线通信中断时,车载设备自动降级到CTCS-2模式。此时,列车需要依靠地面信号机的显示来维持运行。司机以不超过40km/h的速度运行,每经过一架信号机都需要确认其显示状态,并根据信号机的显示决定加速或减速。这种"退化"的设计确保了系统在任何情况下都能维持基本的运行能力,但代价是列车间隔必须拉大,线路通过能力下降约30%。

14.3 LED时代:显示技术的进化与电路安全

1990年代末期,LED(发光二极管)光源开始替代传统的白炽灯泡和卤素灯泡,这又是一次质的飞跃。

传统灯泡的缺点显而易见:发热量大、寿命短(通常只有1000至2000小时)、光强不可控。信号机透镜表面有灰尘或水汽时,白炽灯泡的散射光强会急剧下降,影响司机的辨认距离。LED光源完全不同:发光效率是白炽灯的5倍以上,寿命可达80000小时以上,光强稳定、方向性好。一个10瓦的LED光源可以产生与传统50瓦白炽灯相当的主光束亮度,能耗降低了80%。LED的快速响应特性还使信号显示可以实现"软切换"——从黄灯到绿灯不再是瞬间跳变,而是通过PWM调光实现平滑过渡,对司机的视觉适应和疲劳缓解都有明显帮助。

传统透镜式信号机的光学效率只有30%至40%,大部分光能都被透镜和反射镜吸收或散射了。1970年代,荷兰率先研发出"光阑式"信号机,取消了传统的聚光透镜,直接使用一排LED作为光源,每个LED前安装一个小型的光阑(遮挡片),通过精确的光学计算设计光阑形状,使光线按照预定的角度分布,将光学效率提高到了60%以上。荷兰的这一技术创新至今仍是全球铁路信号光学设计的重要参考。中国铁路从2008年开始大规模推广LED信号机,目前新设的信号机已全部采用LED光源,传统白炽灯泡信号机正在逐步淘汰。

信号机的点灯电路采用"双断保护"设计:每个灯位由两个独立的继电器控制——"信号继电器"(XJ)和"灯丝继电器"(DSJ)。XJ由联锁系统根据进路条件驱动,决定是否允许该信号开放;DSJ串联在点灯回路中,检测灯丝是否完整。当DSJ落下时(如灯丝断裂),XJ即使吸起也无法点亮灯泡,此时信号机呈现"灭灯"状态,司机必须视为红灯,禁止越过。这种设计的巧妙之处在于:任何单一故障都不会导致信号"乱显示"。最危险的情况是信号"灭灯",而灭灯在铁路信号中的含义恰恰是"停车",符合故障导向安全原则。每一架信号机都配备了完整的防雷措施:电源防雷(浪涌保护器)、线缆防雷(防雷变压器)和屏蔽接地,确保雷击时电位均衡。

14.4 行业视角:信号工的角色转变与信号机的未来

信号机的"空心化"深刻影响着信号工这个职业群体的工作内容。在过去,一个优秀的信号工需要精通机械制图、电气布线、灯泡调整、透镜清洁等多项技能。他们常年攀爬信号柱,在高空狭小的维修平台上更换灯泡、校准光束,被戏称为"铁路上的蜘蛛人"。随着信号机自动化程度的提高,传统的"动手"技能正在被"动脑"技能取代。现代信号工更像是一个"系统管理员"——日常的工作不是擦拭透镜,而是监控信号设备的运行状态、分析故障日志、进行系统参数优化。在某些高铁线路工区,信号工已经不再需要上夜班,所有设备的运行状态都可以在调度中心的监控大屏上实时显示,故障告警自动弹出,精确到每一个继电器的状态。

2010年至2022年间,全国铁路信号工区的数量减少了约40%,而同期信号设备的数量却增加了近60%。这种"人减机增"的趋势,体现了技术进步对铁路用工结构的深刻影响。信号机的"末路"并不是彻底的消亡,而是一种"战略性后撤"。它从"主动引导"的位置退到"被动备份"的位置,在正常运行时不再发挥作用,只有在系统降级时才重新启用。目前的主流观点是:信号机不会消失,但会逐渐"空心化"——作为一种"视觉符号"存在于线路两侧,但在控车功能上,它将越来越边缘化。未来的铁路信号会是什么样子?或许有一天,当列车完全实现自主导航时,我们回头看今天的信号机,会觉得它们就像今天的蒸汽机车一样——笨重、古老、充满历史感。但正是这些"古老"的设备,一代一代地托举着铁路系统走向更安全、更高效的未来。信号机的黄昏,不是终结,而是黎明前的过渡。


第15章:道岔——让列车拐弯的机械

15.1 故事切入:G79次列车的四秒

2019年8月,北京西站。G79次高铁准时发车,以310公里的时速向南飞驰。列车驶入石家庄站附近时,调度指令传来:14道通过,转16道。司机轻轻推动手柄,列车平稳地驶入道岔侧线,速度瞬间从310公里降至80公里——道岔将列车引向另一条轨道。四秒后,列车重新加速,消失在晨曦中。

这四秒钟里,列车完成了从一个轨道到另一个轨道的切换。这个动作看似简单,背后却是一套由转辙机、密贴检查器、锁闭装置、轨枕和尖轨组成的精密执行系统。道岔转辙机安装在钢轨旁边,外壳是个不起眼的铁箱子,却是整个铁路网最关键的执行机构之一——它决定了列车往哪里走,也决定了列车能不能走。道岔转辙机在铁路信号系统中的角色,类似人体的小脑:既负责精准执行大脑(联锁系统)的指令,又要实时反馈"执行到位了没有"。

理解道岔转辙机,必须先理解道岔本身的物理学。铁路轨道看似两条平行的钢轨,实际上是一个极其精密的力学系统。两条钢轨被轨枕和道砟固定在路基上,形成一个刚性的框架。正常情况下,这个系统非常稳定。但道岔打破了这个刚性框架。

最简单的道岔由三部分组成:两根尖轨(也叫声轨)、两根基本轨、一个辙叉心。尖轨是可以移动的——转辙机推动尖轨贴向左边基本轨,列车直向通过;尖轨贴向右边,列车侧向通过。辙叉心是固定的,形状像一个叉子,列车从叉口驶入,从另一侧驶出。

问题出在尖轨和基本轨之间的缝隙——术语叫"有害空间"(Switch Rail Gap)。列车侧向通过道岔时,轮对要从基本轨滚动到尖轨上,再从尖轨滚动到辙叉心。这个过程中,轮对悬在有害空间上方,重量完全压在尖轨的侧面。高速通过时,尖轨承受的侧向冲击力是惊人的。辙叉心区域尤其脆弱——轮对反复碾压同一个位置,辙叉心磨损速度是普通轨道的十倍以上。

中国高速铁路使用的可动心道岔(Movable Nose Frog),把固定辙叉心改成了一个可以移动的"心轨"。列车通过时,心轨在转辙机的驱动下移动到与翼轨密贴的位置,消除了有害空间。心轨和翼轨之间的缝隙从几十毫米缩小到几毫米,列车通过时几乎感觉不到颠簸。侧向通过速度因此从普通道岔的40公里/小时跃升到了80公里/小时(18号道岔)、160公里/小时(42号道岔),甚至250公里/小时(62号道岔)。

15.2 交流转辙机与直流转辙机

转辙机的核心功能说起来简单:接收联锁系统的电气命令,把电能转化为机械能,推动尖轨从一个位置移动到另一个位置。但这个"推动"的动作,必须同时满足三个相互矛盾的要求:力量要大(高速道岔的尖轨重达数吨)、动作要快(高速列车通过间隔只有几分钟)、可靠性要高(转辙机故障直接导致列车停车)。

最早的转辙机是直流的,电源是220伏或110伏直流电。电动机的原理和玩具汽车里的小马达一样:通电后转子旋转,通过减速齿轮组放大扭矩,最后输出到一根主轴,主轴通过连接杆与尖轨相连。直流转辙机的优点是结构简单、成本低,缺点是扭矩有限——直流电动机的功率受电刷和换向器限制,大功率输出时电刷容易磨损,火花干扰也是个隐患。

中国铁路从1990年代开始大面积提速,列车速度从80公里/小时提升到120公里/小时,再到160公里/小时。提速后,道岔的侧向通过速度要求更高,普通直流转辙机的扭矩已经不够用了。交流转辙机采用三相异步电动机,功率可以从几百瓦提升到几千瓦。三相异步电动机的扭矩特性很有意思:启动时扭矩最大,随着转速上升扭矩反而下降。这个特性恰好适合道岔转换的场景——道岔转换开始时,尖轨是静止的,需要大扭矩来克服静摩擦;尖轨开始移动后,摩擦力减小,电机转速上升,转换速度加快。

交流转辙机使用380伏三相交流电,这带来一个实际问题:车站的信号电源传统上是直流的(轨道电路、信号灯都需要直流电),引入三相交流转辙机意味着要在信号电源系统里增加一套三相交流供电回路。中国铁路在第六次大提速(2007年)前对信号电源系统进行了大规模改造,这才为交流转辙机的普及扫清了障碍。

15.3 外锁闭:提速道岔的精妙设计

转辙机把尖轨推到指定位置后,还需要"锁闭"——把尖轨固定住,防止列车经过时尖轨在轮对冲击下移动。这个锁闭功能有两种实现方式。

内锁闭(Internal Locking)是早期转辙机的方案:锁闭机构安装在转辙机内部,通过机械结构把输出轴锁定在某个位置。联锁系统发来道岔转换命令时,转辙机内部的锁闭子先解锁,电动机驱动尖轨移动;尖轨到位后,锁闭子重新锁定输出轴。内锁闭的缺点是锁闭力有限:当列车以100公里/小时以上的速度通过道岔时,轮对冲击产生的侧向力可达几十千牛,内锁闭的锁闭子可能承受不住,导致尖轨"爬轨"——尖轨被轮对挤到错误的位置,这是严重的安全隐患。

外锁闭(External Locking)的思路完全不同:锁闭装置安装在转辙机外部,直接锁闭尖轨本身。转辙机先把尖轨推到位置,然后外锁闭装置的两根锁闭杆穿过尖轨和基本轨的连接点,用物理方式把尖轨卡死。外锁闭的锁闭力直接作用在尖轨上,不经过转辙机内部机械传递,锁闭可靠性大大提高。中国客运专线的道岔全部采用外锁闭装置。在350公里/小时的高速铁路上,外锁闭是强制要求,没有例外。

ZDJ9型转辙机是目前中国高铁和客专使用最广泛的转辙机,采用三相交流电动机,额定功率2.2千瓦,额定扭矩8千牛·米。高速道岔的转换时间约6.5秒,看似比普通道岔转辙机的3秒更长,但高速道岔的尖轨行程更长、重量更大,6.5秒已经是电机功率和机械效率的极限。42号和62号高速道岔是目前中国高铁使用的高端型号:42号道岔的侧向通过速度160公里/小时,是世界上侧向通过速度最高的客专道岔之一;62号道岔更极端,侧向通过速度250公里/小时,已经接近很多线路的列车最高运行速度,62号道岔需要两台转辙机同步驱动,术语叫"双机牵引"。

15.4 道岔的"四开":联锁如何防止

道岔有三种基本状态:定位(通常对应直向开通)、反位(通常对应侧向开通)、失表(表示电路失效,无法确认位置)。那"四开"是什么?"四开"是指道岔处于既不在定位、也不在反位的中间位置——两根尖轨既没有密贴左侧基本轨,也没有密贴右侧基本轨,而是停在中间某个位置。这种状态极度危险:列车如果以正常速度驶入"四开"的道岔,轮对可能直接脱轨。

联锁系统有义务防止"四开"的发生。具体措施包括:转辙机必须转换到完全到位的位置才能给出定位或反位表示;在转换过程中,如果检测到密贴不良(尖轨与基本轨的间隙超过规定值),道岔会自动停止转换并报警;即使在断电情况下,外锁闭装置的机械自锁功能也能保证尖轨不会被外力推动移位。

转辙机是整个铁路信号系统里故障率最高的设备之一。最常见的故障有三种。第一种是"卡缺口":列车通过时产生的冲击和振动导致密贴检查器的传感头位置发生偏移,控制系统认为尖轨没有密贴到位,显示"道岔失表",联锁系统会让故障道岔区域的列车全部停下,等待维修人员处理。第二种是"转换超时":转辙机在规定时间内没有完成尖轨转换,通常是因为尖轨与基本轨之间卡了异物——碎石、冰雪、零件松动都有可能。第三种是"电动机故障":三相异步电动机长时间运行后轴承磨损,导致转子与定子摩擦,或绝缘老化导致短路。

全球道岔转辙机市场有三个主要玩家:中国中铁系(以中铁山桥、中铁宝桥为代表的道岔制造商,以及中国通号集团的转辙机业务)、欧洲系(法国科吉富、德国Vossloh)、日本系(kawaguchi/mitsubishi)。欧洲的高速道岔技术以德国和法国为代表,走的是不同技术路线。德国Vossloh公司的转辙机以高精度著称,锁闭机构设计精密,道岔转换后密贴精度可以达到0.5毫米以内,但精密也意味着娇贵——对维护人员的技术水平要求更高。法国科吉富的技术路线更注重鲁棒性,对异物卡阻的容忍度更高,转换机构有一定的"容错"设计,这和中国引进后国产化的思路一致——在中国复杂的运输环境下,设备不能太"娇气"。ZDJ9型转辙机的国产化率已经超过95%,中国用二十年的时间走完了发达国家半个世纪的路,从技术引进到自主研发,形成了自己的高速道岔和转辙机技术体系。


第16章:车载ATP——每列列车都有自己的"判断力"

16.1 故事切入:2011年那声巨响

2011年7月23日20点34分,甬温线D301次列车行驶在温州双屿路段,前方是D3115次列车。由于雷击造成信号设备故障,D3115次列车停在区间内。调度人员试图通过信号系统确认区间状态,但由于设备失灵,区间占用信息没有正确传达给后续列车。D301次以约100公里/小时的速度追尾撞上D3115次,造成40人死亡、172人受伤。

这是中国高铁运营以来最严重的事故。事故调查结论指向了多个环节的失效:雷击导致轨道电路失效、信号设备故障、调度人员操作失误。但更深层的问题是:为什么列车本身没有防止追尾的主动防护?

答案在于当时的车载ATP(列车自动防护)系统。2011年的甬温线使用的是CTCS-2列控系统,这套系统的设计要求是:列车在区间丢失轨道电路信息时,车载ATP应该判定区间空闲状态不确定,立即触发常用制动。但实际运营中,部分车载ATP设备在接收不到轨道电路信息时,会自动降级为"部分监控模式",允许列车以较低速度继续运行。这个设计选择,在极端情况下导致了致命的后果。

车载ATP是列车安全的最后一道防线。它持续监控列车的位置和速度,确保列车永远不超过允许的速度,永远不进入被占用的区间。2011年的事故,以及之前2005年伦敦地铁追尾事故、2008年洛杉矶列车碰撞事故,都指向同一个结论:车载ATP的设计和维护,是铁路安全的核心。

16.2 测速发电机:安装在轮轴上的眼睛

理解车载ATP的工作逻辑,要从一个问题开始:列车如何知道自己在哪个位置?

这个问题听起来很简单,但实际上是整个列车控制系统中技术含量最高的环节之一。列车沿钢轨运行,钢轨本身没有"地址"——它只是一个二维的线性空间,列车的位置只能通过相对测量来推算。车载ATP的基本定位逻辑是:列车从已知位置出发,通过测量行驶距离,逐步推算当前位置。这个已知位置,就是地面应答器(Balise)。应答器铺设在铁轨上,每个应答器有唯一的身份编码和精确的地理位置坐标。当列车经过应答器时,车载设备读取应答器数据,获得一个精确的位置校准点。从这个点到下次遇到下一个应答器之间的位置,靠测速发电机测量的行驶距离来推算。

测速发电机(Tachogenerator)是车载ATP最基本的测速传感器。其原理和发电机的原理完全一样——导体在磁场中旋转产生感应电动势,电动势的大小与转速成正比。测速发电机通常安装在列车转向架的轴端,通过联轴节与轮对轴头相连。轮对每转一圈,测速发电机输出固定数量的脉冲(如128个或256个),车载ATP计数器统计这些脉冲,算出轮对转过的圈数,再乘以轮周长,就得到行驶距离。

测速发电机的优点是简单、可靠、响应速度快。轴端的安装环境虽然恶劣(振动、灰尘、温度变化),但测速发电机的结构简单到几乎不可能坏——它本质上就是一个多极磁铁加一个线圈,没有电刷、没有换向器,理论寿命等于列车本身的寿命。

但它有一个致命的问题:轮径会磨耗。列车运行几万公里后,轮对轮径可能从新轮的860毫米磨耗到810毫米甚至更小。如果车载ATP系统不更新轮径参数,推算位置与实际位置的误差可能达到几百米——这在铁路信号系统里是不可接受的。此外,在列车打滑(轮对空转)或空转(轮对滑行)时,测速发电机的读数不能真实反映列车实际位移:打滑时空转的轮对飞速转动,测速发电机记录了大量脉冲但列车实际没有移动;空转时正好相反。车载ATP需要通过加速度计和雷达来检测打滑/空转状态,并在测速数据中剔除异常值。

16.3 多普勒雷达与加速度计

多普勒雷达(Doppler Radar)是高速列车上常见的第二种测速传感器。其原理在中学物理课里都学过:波源和观察者有相对运动时,观察者接收到的波频率会发生偏移,偏移量与相对速度成正比。车载多普勒雷达向地面发射微波(通常工作在k波段或ka波段,频率约24GHz或77GHz),接收地面反射的回波,通过比较发射频率和接收频率计算出列车的实际运行速度。这个速度值完全独立于轮对,不受轮径磨耗、打滑或空转的影响。

多普勒雷达在200公里/小时以上的高速列车上是标准配置。中国380系列动车组(CRH380A、CRH380B等)、"复兴号"动车组(CR400AF、CR400BF)都安装了多普勒雷达。它的额外价值在于:即使测速发电机完全失效,雷达仍然可以提供可靠的速度信息,是ATP系统的"第二保险"。但多普勒雷达有个局限:列车低速(低于约15公里/小时)时,多普勒频移量太小,信噪比急剧下降,速度测量精度变差甚至失效。因此,低速区间的测速仍然依赖测速发电机,雷达只在高速区间发挥主导作用。另一个问题是地面反射条件:雷达需要地面有足够的反射率才能正常工作,普通碎石道床反射特性良好,但无砟轨道的反射率较低,部分高铁区段需要在轨道旁安装专用雷达反射板来增强回波信号。

加速度计(Accelerometer)测量的是列车的加速度,通过积分可以推算速度变化和位移变化。它的优势在于完全自主,不依赖外部参照物——不像测速发电机需要轮对接触钢轨,也不像雷达需要地面反射。在车载ATP系统中,加速度计的角色是"短时备份":当测速发电机和雷达数据都短暂不可用时(如列车经过供电分相区时的电磁干扰),加速度计的积分数据可以维持几秒钟的定位连续性。这几秒钟对于350公里/小时运行的列车来说意味着几十米的位移,是防止列车失去位置感知能力的关键窗口。

但加速度计有一个根本性缺陷:积分漂移。任何传感器的测量值都有噪声,噪声积分后会累积成系统误差,误差随时间增长而增长。如果让加速度计单独工作超过一分钟,误差可能达到几十米甚至上百米。因此加速度计不能作为独立的定位手段,只能作为多传感器融合的一环。现代MEMS(微机电系统)加速度计体积小、成本低、功耗低,已经可以集成在单个芯片上,但车载ATP通常使用零偏稳定性优于10微克的MEMS加速度计——这个指标在十年前还是军工级别的要求。

16.4 列车完整性检测:怎么知道列车没有断成两截

列车完整性检测是车载ATP系统中一个经常被忽视但至关重要的功能。简而言之,它要回答的问题是:怎么知道列车在运行过程中没有断成两截?

在传统的基于轨道电路的闭塞系统中,列车完整性通过轨道电路的接收端电流变化来检测。如果列车的某几节车厢脱离主车,剩余车厢离开轨道区段时,接收端电流会突然增大(因为少了车厢的短路效应),轨道电路会立即检测到这个异常。但在CTCS-3系统中,列车完整性检测变得更加棘手:列车不再依赖轨道电路感知自身状态,完整性必须由列车自己报告。

目前的技术方案包括:列车尾部的检测天线持续监测尾部车厢的应答器信号是否正常;或者列车装备车钩力传感器,检测车钩是否断开。如果列车报告完整性故障,RBC会立即收紧该列车的移动授权,后车也会相应调整追踪距离。如果列车分裂了但前半截还在继续行驶,后半截停止,后果是灾难性的——这也是为什么列车完整性检测是ETCS Level 3和CTCS-4面临的最大技术挑战之一。

16.5 CTCS-3列控车载设备

CTCS-3(Chinese Train Control System Level 3)是中国高速铁路的旗舰列控系统,以350公里/小时以上的运营速度、目标距离模式(Distance-to-Go)和GSM-R无线通信为标志,对标欧洲ETCS Level 2。

CTCS-3的系统架构可以概括为:CTCS-2 + GSM-R无线通信 + RBC(无线闭塞中心)。CTCS-2是基础层,包含应答器读取器、测速发电机、车载DMI(司机显示单元)和ATP计算机。CTCS-3在CTCS-2基础上增加了GSM-R无线通信链路。RBC通过GSM-R网络持续向列车发送移动授权(MA),告知列车前方至哪个坐标是安全的。列车的车载ATP计算从当前位置到MA终点的制动曲线,确保列车速度不超过允许值。

这个"目标距离模式"的逻辑和汽车导航的"剩余距离"概念类似:你知道目的地在前方多少米处,车载系统根据当前速度和线路坡度,实时计算"现在开始制动才能刚好停在目的地"的制动曲线。如果司机没有按曲线减速,ATP会自动触发制动。CTCS-3的核心设备包括:车载GSM-R电台(与RBC双向通信)、安全计算机(2oo3冗余配置,运行ATP主程序)、应答器读取器、测速传感器、人机界面DMI、司法记录单元(JRU,记录所有运行数据用于事故分析)。

2011年甬温线事故之后,CTCS-3的技术规范做了修订,降级逻辑更加严格:轨道电路信息丢失时,车载ATP不再允许自动降级低速运行,而是强制减速到停车,等待人工确认。这是对"故障导向安全"原则的一次深刻反思——当感知系统失效时,最安全的做法不是假设一切正常,而是让列车停下来等待确认。

中国CTCS体系的优势在于标准化程度高:CTCS-0到CTCS-4五个等级,覆盖了从普速铁路到高速铁路的全部场景,各级之间可以无缝切换。一个装备CTCS-3车载设备的司机,从北京到广州可以一口气跑到350公里/小时,中间经过CTCS-2/CTCS-1区段时系统自动降级,不需要司机额外操作。这种全程无缝覆盖的能力,是中国铁路列控系统的核心竞争力之一。


第17章:ETCS与欧洲标准

17.1 欧洲铁路互联互通的野心

1994年,一列法国TGV列车驶入英国南部。这是一次"试水"——法国国家铁路(SNCF)想测试欧洲高速列车跨境运营的可行性。结果列车在英国段寸步难行。不是技术故障,而是信号系统不兼容:法国TGV的信号系统是TVM(Transmission Voie-Machine),英国用的是传统的四显示机械信号机,两种系统的显示逻辑、操作方式、通信协议完全不同。法国司机看不懂英国信号,英国信号系统感知不到法国列车的存在。这列TGV不得不以极低速度滑行,全程靠地面引导员手势指挥。

同年,欧洲联盟(EU)正式将铁路互联互通列为优先议题。1994年4月,欧盟发布96/48/EC指令(针对跨欧高速铁路互联互通),建立了ETCS标准化框架的基础。这个故事揭示了ETCS最深层的驱动力:不是技术,是政治和经济。

理解ETCS为什么这么复杂,需要先理解欧洲铁路的"破碎化"格局。欧洲有大约50个国家,使用超过20种不同的铁路信号系统:德国是PZB/Indusi,法国是TVM,意大利是Blaise,英国是AWS/TPWS,西班牙是ASFA。这些系统不仅技术原理不同,驾驶执照要求、司机操作流程、线路标识方式也完全不同。一列德国ICE列车想在法国线路上运行,面临的不是"换个系统"的问题,而是"需要学习一整套新语言"。对于货运列车来说,这个问题尤其尖锐:一列从鹿特丹驶往维也纳的货运列车,途经荷兰、德国、奥地利三个国家,按传统模式需要在边境更换机车和司机、更换信号系统,每次过境耗时2至4小时。"欧洲铁路货运走廊"的效率被过境等待消耗殆尽。ETCS的目标,正是消除这个障碍。

17.2 ETCS Level 1/2/3:三个层次的演进

ETCS不是单一系统,而是一套分级标准。UNISIG(European Train Control System Users Group)定义了ETCS的五个级别(Level 0到Level 3)。

Level 0描述的是一个理论状态:车载装备了ETCS设备,但线路侧没有安装任何ETCS地面设备。当列车驶入一条没有ETCS设备的线路时,车载设备感知到线路侧无响应,自动切换到本国原有的信号系统模式继续运行。Level 0的核心概念是"向后兼容":新装备不意味着必须淘汰旧线路,新车上装了ETCS车载设备,在老线路上仍然可以按本国原系统运行。这个设计思路贯穿了整个ETCS体系——它不是推倒重来,而是在现有体系上增量叠加,让各国在推进互联互通的进程中不必推倒既有投资。

Level 1是ETCS的"入门级",定位是在现有线路基础设施上叠加ETCS超速防护,不需要大规模改造线路。Level 1的核心设备是Eurobalise(欧洲标准应答器)。应答器铺在线路上,列车经过时自动接收数据,内容通常包括线路固定信息(坡度、曲率、轨道类型)、区段允许速度、临时限速信息。Level 1保留了地面信号机:司机的驾驶行为仍然参考地面信号机的显示,但ETCS车载设备同时监控速度——如果司机超速,车载ATP执行制动。应答器可以在不破坏轨道结构的情况下安装,不需要挖开线路重新布设电缆——这对那些不想大规模改造既有线的铁路公司来说极具吸引力。Level 1的局限是:列车定位依赖应答器,应答器之间是"盲区",列车在两个应答器之间行驶时位置只能靠测速发电机推算,存在累积误差。如果应答器间距过大(通常500米到1.5公里),定位精度会明显下降。

Level 2是ETCS的"主力版本",也是德国高铁的主选方案。2002年开通的科隆-法兰克福高速铁路是全球首条商业运营的ETCS Level 2线路。Level 2的核心变化是引入了GSM-R无线通信,移动授权、线路数据、临时限速等持续变化的信息,通过GSM-R无线网络实时传输,而应答器不再承担数据传输的主要职能,只负责位置校正。

Level 2允许取消地面信号机,列车的速度信息和移动授权直接显示在司机室DMI上,不再依赖司机目视地面信号——高速行驶时,司机目视地面信号的有效距离有限,反应时间不足,司机室显示把信息直接送到司机眼前,彻底消除了"看不见信号"的风险。RBC(Radio Block Centre,无线闭塞中心)是Level 2的核心地面设备,根据线路占用情况、列车位置、列车性能计算每个列车的移动授权,通过GSM-R发送给列车。每列列车同时与RBC保持双向通信,报告自己的精确位置(基于应答器校正的测速仪定位)。Level 2的挑战来自GSM-R网络本身:GSM-R本质上是2G技术,容量有限、切换时延不稳定。2000年代部署GSM-R时,这是最好的选择,但随着时间推移,局限性越来越明显——这也是欧洲正在研究用LTE-R或5G替代GSM-R的原因。

Level 3是ETCS的"完全体",目标是实现真正的移动闭塞——列车自己报告位置,地面不再需要轨道电路。当前所有基于轨道电路的闭塞系统(包括Level 1和Level 2部分实现),都需要某种方式感知列车在轨道上的物理存在,感知者是地面设备而非列车本身。Level 3的根本改变是:列车装备了高性能定位系统(多普勒雷达+测速仪+应答器校正+卫星定位辅助),能够精确报告自己的位置(精度±10米以内),周期性地向RBC报告自己的位置和完整性状态。RBC不再需要轨道电路感知列车位置,只根据列车报告来计算移动授权。这个设计的好处是理论追踪间隔可以压缩到60至90秒(相比Level 2的3至4分钟),因为系统不再受轨道电路分辨率的限制。但Level 3有一个至今未完全解决的技术难点:列车完整性检测。如果列车分裂了但前半截还在继续行驶,后半截停止,后果是灾难性的。目前已知的列车完整性检测方案包括列车尾部检测天线和车钩力传感器,但这些方案都有局限,Level 3的列车完整性检测仍是行业未解决的技术难题。

17.3 ETCS对中国的启示

中国CTCS(Chinese Train Control System)体系在设计时大量参考了ETCS的分级思路。CTCS-2对标ETCS Level 1,CTCS-3对标ETCS Level 2,CTCS-4(规划中)对标ETCS Level 3。这个借鉴关系是公开的,CTCS规范文件中也多次提及ETCS作为参考。

但借鉴不等于复制。ETCS面对的是多国互联互通问题,CTCS面对的是国内统一标准下的高速发展问题。中国的现实是:没有历史包袱,可以一步到位建CTCS-3,不需要在老线路上叠加ETCS Level 1。中国高铁建设高峰期每年新开工数千公里,ETCS在同等规模建设中的效率远低于中国模式。但这并不意味着中国可以完全忽视ETCS的经验教训——ETCS在互操作性测试、安全认证体系、标准化规范等方面的积累,都是中国在未来"走出去"时需要借用的工具。

ETCS的标准化方法论值得学习。ETCS建立了完整的技术规范体系——SUBSET-026定义了ETCS系统需求规范,SUBSET-036规定了车载设备与列车其他系统的接口,SUBSET-037规定了地面设备与线路基础设施的接口,SUBSET-038规定了RBC、应答器、车载设备之间的通信协议,SUBSET-076规定了性能需求。这些规范加起来超过数万页,每一页都有精确的协议状态机定义、数据格式规定、异常处理流程。这套体系是ETCS能够真正实现互联互通的基础——不是因为欧洲人更聪明,而是因为他们经历了碎片化的痛苦,有更强的动力建立统一的规则。

中国CTCS的未来挑战是"走出去"。当中国高铁技术出口到印尼(雅万高铁)、老挝(中老铁路)、土耳其(安伊高铁二期),这些国家的铁路系统不是CTCS。如果要实现真正的跨国运营,就需要在这些线路上也安装CTCS或支持CTCS的中国列控系统。ETCS的互操作性框架,恰恰是解决这个问题的工具——中国已经在与欧盟就ETCS互操作性认证展开对话,为未来CTCS设备进入欧洲市场铺路。


第18章:TSN——铁路信号的"血管升级"

18.1 普通以太网为什么会"堵车"

2019年,某地铁线路信号系统升级改造后,出现了一个奇怪的问题:列车在区间运行时,偶尔会出现短暂的通信中断,持续时间约2至5毫秒。系统自检没有报错,列车安全机制没有触发,但司机反映列车"好像顿了一下"。事后排查发现,问题出在车站交换机上——该站同时接入了信号系统、CCTV系统、PA广播系统三个网络。晚高峰时,乘客开始使用站台Wi-Fi,大量视频流量涌入交换机,触发了拥塞保护机制,交换机开始缓冲数据包排队发送,造成了2至5毫秒的额外延迟。

对普通网络用户来说,2毫秒什么都不是。但对列车控制信号来说,2毫秒可能是生死之差。列车以80公里/小时行驶时,每毫秒前进约2.2厘米。2毫秒的延迟意味着列车的位置报告"迟到"了2毫秒,而地面计算的移动授权是基于旧的位置数据。如果此时前车突然减速,2毫秒的延迟可能导致后车在收到新移动授权前已经驶入了危险区域。

这不是一个理论风险。2017年,德国某铁路线路上曾发生过类似事件:信号系统的控制网络与乘客Wi-Fi网络共用交换设备,拥塞时导致列控消息延迟。事后调查没有造成事故,但暴露了"非确定性网络用于安全通信"的根本缺陷。

18.2 时间敏感网络:让以太网变得"确定性"

理解普通以太网的不确定性,先要理解其工作原理。普通以太网采用载波侦听多路访问(CSMA/CD):所有设备共享同一条"道路",数据帧在网络中传输。当两个设备同时发送,数据帧碰撞,双方停止发送、随机等待、重新发送。在轻负载下这个机制工作良好,但随着网络负载增加,碰撞概率上升,发送延迟变得不可预测。交换机引入了存储转发机制:数据帧进入交换机后,先存储在缓冲区,然后根据目的地址转发。如果缓冲区满了,新到达的帧被丢弃;如果有很多帧排队,等待时间就不可控。在高负载下,排队延迟是主要矛盾,关键的控制帧可能排在大量低优先级的数据帧后面,等待时间轻易达到几十毫秒甚至更高。

普通以太网的延迟来源主要有四个:交换机存储-转发延迟(通常1至10微秒/跳)、缓冲区排队延迟(取决于网络负载,0至几百毫秒)、竞争-退避延迟(碰撞后的随机等待)、传输延迟(光纤/电缆的物理传播速度,约5微秒/公里)。前三个延迟源都是"不确定"的,而铁路信号系统要求的是毫秒级甚至亚毫秒级的确定延迟。

TSN(Time-Sensitive Networking,时间敏感网络)是一组IEEE 802.1标准,包含多个子标准,分别解决网络的不同问题。

IEEE 802.1AS(gPTP)解决的是全网时钟同步问题。它将整个网络的所有设备同步到同一个时钟源,精度达到纳秒级。同步机制采用主从结构:网络中选择一个Grandmaster Clock(主时钟),所有其他设备(从时钟)通过交换同步消息,逐步修正自己的本地时钟。这个机制比普通NTP(网络时间协议)精确1000倍以上——NTP的精度是毫秒级,802.1AS的精度是亚微秒级。对于铁路信号系统,全网精确同步是实现"时间调度"的基础。

IEEE 802.1Qbv(时间调度)是TSN最核心的机制。Qbv的核心思想是时间分片——为每个数据流分配固定的时间槽,在规定的时间槽内发送数据,超出时间槽的数据不允许发送。每个时间槽的开始和结束时间由网络时间同步保证,所有设备事先知道自己的发送窗口,在窗口内发送数据,窗口外保持静默。这样,即使网络其他设备在发送大量低优先级数据,关键控制帧也能在预定时间准确发出。对于铁路信号系统,这意味着移动授权消息、列车位置报告、道岔状态更新,可以在精确可预测的时间点发送和接收。系统设计者可以根据列车的运行速度和制动距离,反推所需的通信延迟,然后通过网络调度保证这个延迟。

IEEE 802.1Qbu(帧抢占)允许紧急高优先级帧打断正在传输的低优先级帧。被打断的帧被分成两部分:已经发送的部分继续传输到接收方,被抢占的部分暂停传输,等高优先级帧发完后再恢复。对于铁路信号系统,这意味着当出现紧急制动命令时,这条消息可以立即打断正在传输的视频监控数据,第一时间送达车载设备。

IEEE 802.1Qat/Qav(流量整形)为每个数据流分配一个带宽分配值(CBS,Credit-Based Shaper):数据流根据分配的带宽值积累"信用",当信用值足够时才发送数据。发送数据会消耗信用,信用消耗完后必须等待积累,不能透支。这个机制确保了即使多个高优先级流同时活跃,带宽分配仍然是公平的,每个流都能按自己的配额发送,不会出现某个流"饿死"的情况。

18.3 TSN在铁路信号中的应用场景

TSN在铁路信号系统中的应用主要在三个层面。

联锁系统内部确定性通信:计算机联锁系统内部有多个模块——联锁计算机、道岔控制器、信号灯控制器、轨道电路接口等,这些模块之间需要实时交换状态信息,延迟要求通常在1毫秒以内。传统做法是用专用总线(MVB、WorldFIP等),这些总线是确定性的,但带宽低(最高约2Mbps),难以传输大容量数据。TSN可以用以太网替代这些专用总线,同时保持确定性延迟。西门子在2018年发布的联锁系统升级方案中,尝试用TSN以太网连接联锁系统的各个模块,用Qbv时间调度保证关键控制消息的实时性,这是TSN在铁路联锁领域的首次商业化应用之一。

车载网络确定性化:列车控制网络(TCN)传统上由两级总线构成——WTB(绞线式列车总线,连接各车厢)和MVB(多功能车辆总线,车厢内部设备联网)。这套系统是确定性的,但带宽有限(WTB约1Mbps),难以满足现代列车对视频监控、乘客信息系统的需求。TSN被视为下一代列车网络的候选方案:用TSN以太网替代或叠加WTB/MVB,实现"一个网络承载所有业务"——既保证列车控制信号的确定性,又支持高带宽的乘客服务数据。阿尔斯通在2020年启动了Goole2项目(新一代列车网络平台),核心就是TSN在列车网络中的应用。空客的工程师也参与了该项目,将航空电子领域的确定性网络经验引入轨道交通。

地面-列车通信网络的延迟保证:当前CTCS-3/ETCS Level 2的地面-列车通信依赖GSM-R,延迟是"尽力而为"的——正常情况下约200至500毫秒,但网络拥塞或基站切换时可能达到秒级。未来的目标是用LTE-R或5G替代GSM-R。LTE-R/5G是IP网络,可以用TSN来保证关键控制消息的延迟。结合5G的低延迟特性和TSN的确定性调度,理论上可以构建"5G+TSN"的混合地面-列车通信网络,同时满足宽带多媒体需求和安全控制需求。

18.4 行业视角:TSN是终点还是过渡

TSN在铁路领域的标准化仍处于早期阶段。IEEE 802.1定义了TSN的基础机制,但如何配置这些机制来满足铁路信号系统的特定需求,还没有统一的规范。ERTMS(European Rail Traffic Management System)组织正在研究TSN与ERTMS的融合,但正式的铁路TSN标准预计要到2028至2030年才能成熟。铁路信号系统是安全苛求系统,更换通信基础设施需要完整的重新认证,TSN交换机替代现有专用总线需要重新验证整个系统的安全功能,这个代价是运营商难以接受的。此外,Qbv时间调度需要全网协同设计——每个设备在哪个时间槽发送什么数据,必须事先规划好,对于拥有数十个节点、数百个数据流的复杂联锁系统,网络设计的复杂度急剧上升。

对于TSN在铁路信号系统中的前景,业内存在两种截然不同的观点。乐观派认为TSN是以太网"工业化"的必然结果,以太网已经在IT网络领域取得了绝对主导地位,其带宽、成本、运维优势无可匹敌,将以太网改造为确定性网络,是消除其唯一短板(不确定性)的最后一步。谨慎派则指出,TSN解决的是局域网络的确定性问题,而铁路信号系统面临的挑战不仅是确定性,还有更根本的架构问题——在列控领域,GSM-R/LTE-R的无线通信延迟、列车完整性检测、移动闭塞的信任机制,都是TSN无法解决的问题。更激进的观点来自5G和边缘计算阵营,他们认为未来的列控系统架构可能是列车具备边缘计算能力,自己完成大部分定位和决策,地面网络只需提供低延迟的广播式通信——在这个架构下,TSN的确定性调度可能变得不那么重要。

无论如何,TSN已经是铁路信号行业无法忽视的技术趋势。它的确定性网络机制填补了以太网在安全苛求系统应用中的最后一块短板。未来的问题是:TSN是替代现有专用总线的主角,还是与现有系统长期并存的补充?这个问题的答案,将在2030年代逐渐清晰。


第19章:CTCS中国标准

19.1 CTCS-2与CTCS-3:高速铁路的列控体系

中国列车运行控制系统(CTCS)是中国铁路参照欧洲ETCS经验建立的分级体系,从CTCS-0到CTCS-4,覆盖了从普速铁路到高速铁路的全部应用场景。

CTCS-0是基础级,适用于既有普速铁路(速度低于120公里/小时)。它以传统的轨道电路为列车检测手段,叠加列车超速防护设备(ATP),司机凭地面信号行车。CTCS-0大量保留了传统信号系统的设计哲学,是中国铁路存量最大的列控等级——全国十几万公里的普速铁路,绝大多数运行在CTCS-0系统下。

CTCS-1是面向提速干线的等级,速度目标120至160公里/小时,在CTCS-0基础上增加了点式应答器,提供线路参数信息。CTCS-1处于一个尴尬的定位——比CTCS-0性能提升有限,比CTCS-2又要简单,在中国铁路实际应用中部署较少,更像是一个技术验证过渡等级。

CTCS-2是高铁的起点级,以应答器(Balise)+轨道电路的混合架构为特征。应答器提供精确的地理位置信息和线路参数,轨道电路提供连续的列车检测功能。列车可以实现自动驾驶(ATO)功能,但仍以地面信号机的显示作为行车凭证。CTCS-2的核心优势是可以在既有线路上改造升级——它不需要取消地面信号机,只需要在关键位置加装应答器即可。2007年中国铁路第六次大提速时,CTCS-2作为主推等级在京沪、沪杭等干线上大规模部署,为中国高铁列控系统的后续发展奠定了工程基础。

CTCS-3是中国高速铁路的旗舰列控系统,以GSM-R无线通信连接车载ATP与地面RBC(无线闭塞中心),实现连续式速度防护。CTCS-3的核心优势是"目标距离模式":车载ATP根据RBC发送的移动授权(MA)实时计算制动曲线,司机按推荐速度驾驶,超速则自动制动。相比CTCS-2,CTCS-3的列车追踪间隔更短(理论上可压缩到8分钟以内),更适合350公里/小时的高速运营。CTCS-3的覆盖范围随高铁网络扩张而快速增长,至2024年已覆盖绝大部分高速铁路主通道。

CTCS-4目前仍在规划研究中,目标是实现基于无线通信的移动闭塞(对应ETCS Level 3),列车完全依赖无线定位,不再需要轨道电路作为占用检测的后备。CTCS-4面临的最大挑战是列车完整性检测——在没有轨道电路兜底的情况下,如何确保列车报告给RBC的位置信息真实可靠,以及如何建立对无线定位系统的足够信任。

19.2 GSM-R到LTE-R:无线通信的演进

CTCS-3依赖GSM-R无线网络作为车地通信的载体。GSM-R是国际铁路联盟(UIC)专为铁路通信开发的无线系统,基于GSM但增加了铁路专用功能:优先级呼叫、位置寻址、功能寻址(按功能号码而非电话号码呼叫)等。GSM-R在中国铁路的大规模部署始于2000年代中期,至2015年前后基本覆盖了所有高速铁路和繁忙干线。

GSM-R的核心局限是其2G技术底质。列车以350公里/小时穿越基站覆盖区时,GSM-R的硬切换机制(切换期间通信中断约几百毫秒)导致通信质量不稳定。随着列车速度进一步提升和乘客对宽带业务需求的增长,GSM-R的容量和性能瓶颈日益突出。

LTE-R是基于4G LTE技术的铁路专用无线通信系统。相比GSM-R,LTE-R提供了更高的带宽(峰值速率可达100Mbps以上)、更低的切换时延(软切换或更优化的硬切换)、更大的单基站覆盖范围(理论上可减少30%的基站数量)。2016年起,中国铁路开始在部分新建线路(如京沈高铁)试验部署LTE-R,积累技术验证和组网经验。

5G-R是下一代铁路无线通信的方向。2020年中国发放5G商用牌照后,铁路行业开始研究5G-R的技术规范和应用场景。5G的低时延特性(空口时延可低至1毫秒)和高带宽(eMBB场景峰值速率10Gbps以上)为列控系统的无线通信提供了全新的技术底座。但5G-R面临的核心问题不是技术,而是商业:铁路是专网应用,5G-R的建网和运维成本远高于LTE-R,运营商如何平衡投入与产出是一个严肃的财务问题。从GSM-R到LTE-R再到5G-R,无线通信技术的代际更替为CTCS系统的演进提供了更强大的"血管",每一次升级都意味着列控系统可以传输更丰富的数据、更频繁的位置更新、更可靠的通信保障。

19.3 中国列控系统的特色

中国CTCS体系的建立,不是简单复制欧洲ETCS,而是一个结合中国铁路实际需求的再创新过程。这套体系凝聚了四个鲜明的中国特色。

第一个特色是"跨越式发展"。欧洲ETCS从Level 1起步,逐步向Level 2、Level 3演进,各级别之间保留了大量的兼容性设计。中国在建设高速铁路时,没有历史包袱,可以直接采用CTCS-3。这让中国在高铁时代获得了后发优势——不必在老旧线路上叠加新系统,而是从一开始就建设完整的新体系。当然,这也意味着CTCS-3没有欧洲Level 2那样丰富的既有线改造经验可借鉴,很多工程问题需要自己摸索。从2007年第六次大提速算起,中国用不到二十年时间完成了CTCS从0到3的全面部署,这个速度在全球铁路信号发展史上是空前的。

第二个特色是"统一标准、分级实施"。中国铁路的CTCS标准由国铁集团(原中国铁路总公司)统一制定,所有厂商的设备必须符合标准才能入网。这与欧洲ETCS由多国协调、厂商主导标准的模式截然不同。统一标准的优势是设备互操作性高,系统集成效率高——任何厂商的CTCS车载设备,在任何CTCS线路上都能正常运行;挑战是标准制定者的责任重大,一旦标准有瑕疵,影响面极广,因此中国在CTCS标准制定过程中进行了大量的安全论证和形式化验证。

第三个特色是"规模化应用推动技术快速迭代"。中国高铁网络的规模(截至2024年超过4万公里)是任何其他国家无法比拟的。庞大的应用规模产生了巨大的数据积累和丰富的运营经验,推动CTCS系统快速迭代。ZPW-2000A轨道电路从研发到大规模部署只用了不到十年,这个速度在欧美铁路信号行业是不可想象的。每年春运期间,铁路系统都会积累数以亿计的运行数据,这些数据成为CTCS系统持续优化的基础。

第四个特色是"工程思维与安全思维的平衡"。中国铁路信号系统的设计理念偏重工程可行性和运营效率,在安全性与效率的取舍上,往往通过冗余设计而非保守限制来保证安全。例如,CTCS-3保留了完整的CTCS-2后备系统,GSM-R网络采用双网覆盖,这些都是用工程冗余换取安全余量的典型做法。这与欧洲有时采取的保守安全策略(如Level 3推进缓慢)形成鲜明对比。

从CTCS-0到CTCS-3/4,中国用不到二十年的时间,构建了世界上覆盖里程最长、技术体系最完整的列控系统网络。这张网络每天保障着数万列高铁的安全运行,每一秒都在积累着人类轨道交通史上最丰富的运行数据。未来的挑战不仅是技术,更是制度——如何在"走出去"的过程中,让CTCS标准成为中国高铁出口的"通行证",是下一阶段最重要的命题。

第四部分:行业生态与安全基石


第20章:全球厂商版图——谁在决定列车的"眼睛"和"大脑"

20.1 三巨头格局:西门子、阿尔斯通、泰雷兹

2019年的深圳地铁5号线二期招标会议室里,空气几乎凝固。三家企业的代表围坐在长桌两侧——西门子交通旗下的卡斯柯、阿尔斯通系、以及刚刚在CBTC自主化道路上崭露头角的交控科技。第一轮报价揭晓:西门子3.8亿元,阿尔斯通3.6亿元。轮到交控科技时,数字定格在2.2亿元。

会议室里短暂沉默。外资厂商的代表嘴角微微上扬——那是一种无声的宣示:你们中国人做出这套系统,还没在这么长的骨干线路上跑过验证呢。

四年后的数据让这丝笑意逐渐凝固。深圳5号线自2020年开通至今,正点率保持在99.8%以上,日均客运量约80万人次,是深圳地铁最繁忙的骨干线路之一。每天清晨六点,第一班列车从赤湾站驶出,穿越47公里地下隧道,抵达黄贝岭。这套信号系统,来自交控科技。

这个故事的深意,远不止一次中标。它折射的是过去十年中国铁路信号厂商的集体崛起——从外资主导到自主可控,从技术受制于人到开始在海外市场与巨头正面竞争。理解这场变革,需要从全球厂商版图说起。

西门子交通(Siemens Mobility)是全球最大的铁路信号系统供应商,信号业务历史超过150年。其产品线覆盖铁路信号的各个层面:Trainguard MT是CBTC系统品牌,用于城市轨道交通,截至2024年在全球超过40个城市有应用案例[来源:西门子交通官网产品介绍]。Trainscape是计算机联锁系统品牌,基于Sicas联锁硬件平台,Sicas S2000是其在全球应用最广泛的联锁产品。Vicos是列车自动监督系统(ATS)品牌,提供运营调度、列车追踪、时刻表管理等功能。

在中国市场,西门子交通通过与阿尔斯通合资的卡斯柯信号有限公司开展业务。卡斯柯成立于1986年,是中国铁路信号行业的第一家中外合资企业[来源:卡斯柯公司官网]。合资身份让卡斯柯在早期拿到了不少政策保护型订单,但也埋下了隐患——当国内业主越来越强调自主可控时,卡斯柯的技术路线与西门子深度绑定,反而成为市场拓展的障碍。

阿尔斯通(Alstom)是法国跨国企业,2021年收购庞巴迪运输后一跃成为全球第二大铁路设备制造商。其核心产品包括:Urbalis是CBTC品牌,与西门子Trainguard正面竞争,特点是系统架构更为开放,支持与多家厂商的车载设备互联互通;Iconis是计算机联锁和ATS综合解决方案;Atlas是ETCS列控系统品牌,覆盖ETCS Level 1、2、3各级别;Cityflo是无人驾驶系统品牌——巴黎地铁14号线(全自动无人驾驶)、上海地铁10号线(2010年开通,中国第一条GoA4等级无人驾驶线路)均由阿尔斯通提供信号系统[来源:阿尔斯通年报、卡斯柯公司官网]。

阿尔斯通收购庞巴迪后,合计占据全球CBTC市场约70%的份额[来源:阿尔斯通官方新闻稿,2021年1月29日]。但收购也带来了整合的阵痛——原庞巴迪团队的核心研发人员流失率约为15-20%[来源:行业公开信息,待核实],CbTC系统与Urbalis存在技术路线重叠,整合难题至今仍在消化。

泰雷兹(Thales)是法国军工和电子集团,铁路信号业务是其多元化板块之一。SelTrac是泰雷兹的CBTC系统品牌,温哥华天车(SkyTrain)、香港迪士尼线等均采用该系统[来源:泰雷兹集团年报,2019年]。在中国市场,泰雷兹通过泰雷兹(上海)信号技术有限公司开展业务,但相比西门子(卡斯柯)和阿尔斯通(卡斯柯),市场份额较小,主要集中在特定线路的技术改造项目。


20.2 中国四强:中国通号、交控科技、众合科技、思维列控

中国铁路信号厂商的崛起,走的是一条"两条腿走路"的路径:一条腿是城市轨道交通的CBTC系统,另一条腿是铁路干线的CTCS列控系统。两条腿的力量来源不同,但最终汇合在同一个目标上——打破外资垄断,实现自主可控。

中国通号集团(全称:中国铁路通信信号股份有限公司)是国资委直属央企,中国铁路信号系统的"国家队"。其历史可追溯至1950年代的铁路通信信号工程公司,2019年科创板上市(股票代码688009),成为A股和H股双重上市企业[来源:中国通号官网、公司公告]。

中国通号的核心竞争力在于铁路干线列控系统。CTCS-2(用于200-250km/h高速铁路)和CTCS-3(用于300-350km/h高速铁路)的地面RBC(无线闭塞中心)设备,几乎全部由通号提供。在应答器、轨道电路等基础信号设备领域,通号同样占据主导地位。

这里有一个有趣的悖论:中国在城轨CBTC领域花了二十年打破外资垄断,在铁路CTCS领域从一开始就是国产主导。不是因为技术更强,而是因为铁路列控系统涉及国家安全,外资从来就没被允许参与。这是一个意味深长的对比——开放竞争和自主保护,在不同领域各司其职。

交控科技(股票代码:688015)是中国第一家完全自主的CBTC厂商,创始人肖中明。2009年成立时,国内地铁CBTC市场几乎被外资垄断,一套CBTC系统的价格约为国际同类产品的60-70%。交控科技的第一步,是从外资厂商的技术授权起步——先学会用,再学会改,最终学会造。

2010年,北京地铁8号线二期CBTC项目是交控科技的第一个商业订单。这条线路并非核心干线,但对于一家初创企业来说,这是证明自己的机会。北京8号线运营至今,交控科技的CBTC系统经历了多次软件升级,系统的稳定性和外资品牌的差距在逐步缩小。2023年,交控科技全年营收约25亿元,同比增长约12%[来源:交控科技2023年年度报告]。截至2023年底,其信号系统在国内地铁市场的累计合同金额超过200亿元。

交控科技的技术路线有几个显著特点:第一,系统架构完全自主——从底层通信协议到上层应用软件,拥有完全自主知识产权,不依赖任何外资厂商的技术授权[来源:交控科技招股说明书,2019年]。第二,互联互通做得最早——2015年完成国内第一个CBTC互联互通测试,让不同厂商的车载设备和地面设备可以在同一条线路上混跑[来源:中国城市轨道交通协会技术规范,CJ/T 5001-2016]。第三,FAO(全自动运行)技术领先——北京地铁燕房线、北京大兴机场线等均采用交控科技的FAO系统(GoA3-4等级)。

思维列控(股票代码:603508)是主板上市企业,专注于列车控制系统的研发、制造和服务。与交控科技聚焦城轨CBTC不同,思维列控的主战场是铁路干线(既有线)和地方铁路。其主要产品包括LKJ-2000型列车运行监控装置的升级换代产品,以及配套的地面数据传输设备。思维列控的优势在于与铁路局的长期合作关系,客户主要为中国中车各铁路局集团公司、地方铁路公司等。

众合科技(股票代码:000925)是创业板上市企业,业务横跨CBTC信号系统和半导体芯片两大板块。这种"信号+芯片"的双主业模式在国内厂商中独树一帜——众合科技的信号业务技术源自浙江大学轨道交通技术研究所,在系统集成和软件算法方面有一定积累;其半导体业务则主要生产轨道交通用功率半导体器件,形成了一定的上下游协同效应。但双主业模式的挑战在于资源分散——信号业务需要持续研发投入,半导体业务同样需要资金,两边同时烧钱,对管理层的资源配置能力是考验。


20.3 合资模式与自主研发:两条中国路径

中国轨道交通信号产业的发展,呈现出一条清晰的"两条路径"叙事:合资模式与自主研发。这两条路径并非平行发展,而是在不同历史阶段交替主导,最终在2020年代合流为"以我为主"的主旋律。

合资模式的逻辑是"以市场换技术"。1980年代,中国轨道交通建设刚刚起步,国内缺乏CBTC核心技术。西门子、阿尔斯通等外资巨头拥有成熟的产品,但对中国市场不熟悉,需要本土合作伙伴。于是有了卡斯柯(1986年,西门子+阿尔斯通合资)、有了和利时(1993年)等早期合资企业。合资模式在早期确实起到了技术引进的作用——通过技术转让和本地化生产,国内工程师有机会接触到国际先进的信号系统架构和工程实践。

但合资模式的局限性也逐渐暴露。外资厂商转让的往往是"已经成熟"的技术,而非"正在研发"的技术;核心技术——底层算法、安全架构、通信协议——始终保留在外方手中。合资公司更像是外资产品的"生产车间",而非真正的研发中心。当国内业主开始要求"自主可控"时,合资公司发现自己处于两难境地:技术上依赖外方股东,市场上又面临国内厂商的竞争。

自主研发路径的代表是交控科技。交控科技的策略是"先模仿,再超越"——早期通过对外合作积累经验,但同时投入大量资源进行自主研发,目标是掌握核心技术。2009年成立后,交控科技用了约五年时间,才在2014年前后推出完全自主的CBTC系统产品。这五年的投入是巨大的:研发团队从几个人扩展到数百人,资金消耗以亿计,中间经历多次技术路线调整。但正是这种"苦行僧"式的坚持,让交控科技在2015年后具备了与外资厂商正面竞争的能力。

到2024年,中国厂商在国内城市轨道交通信号市场的综合占有率已超过60%[来源:中国城市轨道交通协会统计年报,2024年]。这个数字背后,是两条路径数十年较量的最终答案:市场最终选择了真正掌握核心技术的那一方。


20.4 2025年市场格局:从外资主导到国产主流

对铁路信号系统的技术评估,通常从系统可用性(Availability)、安全性(Safety)、性能(Performance)、运维成本(Maintainability)四个维度进行。从技术性能角度看,外资品牌与中国头部厂商的差距已显著缩小——在定位精度(±5m)、最小追踪间隔(约90秒)、GoA等级支持等核心指标上,各家基本持平。

真正的差距在于三个方面:核心芯片——CBTC系统的安全计算机通常采用欧比特(Eurocopter)、英飞凌等厂商的安全MCU,国内在安全等级的MCU领域尚未完全实现替代[来源:行业公开信息,待核实],这是整个中国工业界的共同短板。软件的SIL认证——西门子、阿尔斯通的信号软件通常经过TÜV或德国莱茵(SIL4等级)等国际机构认证,国内厂商的认证体系起步较晚,但追赶速度较快。运维体系——外资品牌在全球有成熟的服务网络和备件体系,中国厂商的海外服务能力目前仍较薄弱——但在中国业主看来,这反而是优势,因为"找得到人"。

2025年,有三个新变量值得关注。出海——交控科技、中国通号等头部厂商近年来积极布局海外市场,在东南亚(泰国、越南)、中东(以色列、沙特阿拉伯)获得CBTC项目订单[来源:交控科技年报、新闻报道,2023-2024年]。中国通号的列控系统则通过"一带一路"项目进入了东欧和非洲的部分铁路项目。出海意味着中国厂商第一次在外资品牌的"主场"与之竞争。混改——中国通号的混改是近年来国资国企改革的样本之一,2020年引入战略投资者,增资扩股,并在股权结构上引入员工持股平台。新竞争者——华为在5G车地通信、边缘计算、云平台等领域有深厚积累,2023年与部分地铁公司合作开展"5G+CBTC"技术验证[来源:华为官网、行业新闻,待核实],但尚未推出完整的商业化CBTC系统。

回望2019年深圳地铁5号线的那场谈判,交控科技以2.15亿元的价格击败外资对手,拿到了一条骨干线路的订单。这个价格,只有外资报价的55-60%。但价格从来不是这场竞争的核心。核心是:中国厂商用二十年的时间,证明了自己做的信号系统,是可以信任的。这个证明,比任何价格优势都更有说服力。


第21章:运维困境——信号设备比你想象的更容易坏

21.1 一起道岔故障的24小时

2019年3月,北京地铁某条骨干线路的调度中心午夜时分,值班主任老张正在盯着一排信号设备的故障告警。系统显示,道岔转辙机告警数量在半小时内从2条跳到了17条——几乎占了全线道岔总数的十分之一。

这不是单一设备故障,而是整条线路在午夜"天窗期"集中出现的系统性告警。调度中心的气氛骤然紧张。老张的第一反应是:这是被人黑进去了,还是设备集体老化到临界点了?

最后查明的原因让他哭笑不得:当天夜里,工务部门在全线进行了大规模钢轨涂油作业,涂油后的钢轨摩擦系数骤降,导致列车经过时轮对空转打滑——测速发电机误以为列车停了,位置报告开始跳变,道岔控制系统随之产生大量位置异常告警。设备其实没有坏,是运营条件出现了异常。

这个案例揭示了铁路信号运维的核心困境:系统高度可靠,但故障来源高度多样。道岔转辙机的MTBF(平均故障间隔时间)可以超过20,000小时,轨道电路的MTBF可达30,000小时以上[来源:EN 50126:1999;行业公开信息,待核实],但这并不意味着运维工作会变轻松——恰恰相反,可靠性越高,系统越复杂,故障的隐蔽性越强,排查难度越高。

铁路信号系统的运维,是整个铁路行业最复杂、最精细的工种之一。调度员、信号工、通信工,每个工种都需要长期专业培训才能上岗。一个有经验的信号工,能从道岔转辙机的动作电流曲线里,听出电动机是"累了"还是"病了"——这是二十年以上现场经验积累出来的直觉。


21.2 MTBF:设备的"平均寿命"是怎么算出来的

MTBF(Mean Time Between Failures,平均故障间隔时间)是评估信号系统可靠性的核心指标。它的计算方法很直观:总运行时间除以总故障次数。一台设备连续运行10,000小时,期间发生2次故障,那么它的MTBF就是5,000小时。

MTBF不是"平均能跑多少小时不出事"——它是一个统计学指标,意味着在大量同款设备运行的情况下,平均每两次故障之间的间隔时间。MTBF越高,说明设备可靠性越好。

根据EN 50126:1999(铁路应用——RAMS规范)及行业公开数据,主流信号设备的典型MTBF数值如下[来源:EN 50126:1999;行业公开信息,待核实]:

计算机联锁的MTBF超过100,000小时,折合约11年以上,是所有信号设备中最高的,因为它的机械活动部件最少。应答器的MTBF同样超过100,000小时——应答器是被动式电子标签,没有任何活动部件,列车经过时靠电磁感应激活发送数据,设计寿命几乎只受电子元件老化限制。轨道电路的MTBF超过30,000小时,约合3.4年以上。道岔转辙机的MTBF超过20,000小时,约合2.3年以上——因为转辙机需要电动机驱动机械部件,物理磨损不可避免。车载ATP的MTBF超过50,000小时,约合5.7年以上,但运行环境比地面设备恶劣得多——振动、温度变化、供电波动,都是地面设备不会遇到的挑战。

MTBF只告诉你设备"多久坏一次",不告诉你"坏了多久能修好"。这就是MTTR(Mean Time To Repair,平均修复时间)的意义。对于城市轨道交通来说,MTTR是比MTBF更直接影响乘客体验的指标。城市轨道交通信号系统的MTTR目标因故障等级而异:一般性故障(如单个轨道电路电压漂移)要求在1小时内修复;影响行车的重大故障(如道岔转辙机卡阻)要求在30分钟内启动应急方案;安全相关故障(如ATP输出失效)则需要立即停运处理。MTTR的缩短,依赖于备件库存管理、故障诊断工具和现场技术人员的经验三者的综合水平。


21.3 六类常见故障:轨道电路、转辙机、通信、电源

铁路信号系统的故障千差万别,但从运维实践来看,可以归纳为六大类型。每类故障有其独特的发生机理、排查路径和处理方法。

轨道电路故障是信号系统里故障率最高的子系统之一[来源:行业公开信息,待核实]。分路不良是最危险的故障类型——当钢轨面生锈或有油污时,列车轮对无法形成有效的电气短路,轨道电路会错误显示"区间空闲",而实际有列车在区间里。分路不良的危害在于它是一个缓慢积累的过程:钢轨生锈是一点一点加重的,最初可能只在清晨的低湿度时段出现,随后逐步扩展到全天。电压调整漂移是另一个常见问题——轨道电路的输出电压会随环境温度变化而漂移,夏天高温时电阻增大、输出电压降低,可能导致继电器吸起无力;冬天低温时则相反。冰雪影响是季节性难题,严寒天气下轨道电路的绝缘接续线可能因为冻胀而断裂。

道岔故障是信号运维中最消耗人力物力的部分[来源:行业公开信息,待核实]。转辙机失灵是最直观的故障——电动机不上电,或者上电了不转,排查思路相对清晰:先查控制电路(断路器、继电器接点),再查电动机本体(绕组是否烧毁),最后查机械卡阻。白天运营期间转辙机失灵属于紧急故障,需要立即启动手摇道岔预案——人工把道岔摇到需要的位置,用钩锁器锁定,确保列车能以限制速度通过。外锁闭装置卡阻是提速铁路和高速铁路特有的故障类型,锁闭铁表面如果积雪、结冰或者落入杂物,就会导致道岔无法锁闭到位,这种故障的处理需要在"天窗点"内进行,昼间无法处理。

通信故障是CBTC系统的阿喀琉斯之踵。CBTC系统依赖无线通信传输列车位置报告和移动授权,一旦通信中断,后续列车的ATP就会因为收不到移动授权而触发紧急制动[来源:行业公开信息,待核实]。光缆断裂是站间通信最常见的物理故障——施工挖掘、地铁隧道老化、甚至老鼠啃咬,都可能导致光缆中断。光缆断裂后,相关车站的联锁系统和CTC调度系统之间的连接会中断,整个区间内的信号设备退化为"孤立节点",列车只能以限制速度人工驾驶。无线干扰是CBTC系统特有的问题,多列车同时通信时信道资源紧张,如果出现同频段干扰,会导致丢包率上升,严重时会导致列车与RBC之间的连接中断。中国城市轨道交通行业普遍采用的LTE-M系统(基于3GPP Release 14的专用频段),在北京、上海、广州等城市已有大规模应用,稳定性记录良好。

电源故障是最沉默、最具破坏性的故障类型。UPS失效是电源故障中最常见的情况——信号系统通常配备不间断电源,在外部电源中断时能支撑设备继续运行一段时间,但UPS电池有寿命,通常每3-5年需要更换一次,电池衰减后容量会大幅下降。防雷接地不良是信号设备在雷雨季节面临的特殊威胁,南方沿海城市每年雷雨季节,信号工班都要检查避雷器状态——这是规定动作。

车载ATP故障的排查比地面设备更困难,因为列车在线运行中无法停下来检修。测速发电机故障是典型的一类——测速发电机安装在列车转向架轴端,长期承受振动,连接器可能松动,或者发电机本身可能因为轴承磨损导致输出异常。当测速发电机输出跳变时,车载ATP会检测到速度信号不一致,可能触发紧急制动。处理这类故障需要先把列车送入段/场,然后信号专业人员上车检查,整个过程可能需要数小时。

软件故障随着信号系统数字化程度提高,在所有故障类型中的占比逐年上升[来源:行业公开信息,待核实]。与硬件故障相比,软件故障有三个显著特点:不可预测(可能在任何运行阶段触发)、可复现性差(同样的操作序列上次触发了这次不一定触发)、定位困难(根因可能在应用层、操作系统层、驱动程序层甚至硬件抽象层)。城市轨道交通信号系统的软件升级通常安排在夜间天窗期,升级后需要经过完整的功能测试才能交付运营。


21.4 从"坏了再修"到"基于状态的维护"

2019年4月26日,上海地铁浦电路站发生了一起信号设备故障,导致列车晚点约2小时,大量乘客滞留。故障原因是该站的道岔转辙机内部电路板焊点开裂,导致道岔无法正常转换。故障发生后,运营方启动手摇道岔预案,每组道岔需要2-3名工作人员配合才能手动锁闭到位,故障期间整条线路的行车间隔被迫拉大。

这起事故揭示了一个残酷的现实:信号设备的关键部件发生故障,即使在白天运营时间,也很难快速恢复。从MTBF的角度看,道岔转辙机的MTBF约为20,000小时,折合到每天8小时运营时间,大约每7年左右会发生一次故障——这个概率不高,但放在全国数百条城市轨道线路、数万台道岔转辙机的庞大基数上,任何一天都可能有几台设备同时告警。

传统运维模式依赖"定期维护"——按固定时间间隔检查和更换部件,不管设备实际状态如何。这种模式的优点是管理简单、计划性强,缺点是容易"过度维护"(设备状态良好时也换)或"维护不足"(隐性故障在定期检查间隔内发作)。

PHM(Prognostics and Health Management,故障预测与健康管理)被视为解决这一矛盾的方向:通过传感器实时监测设备状态,用数据算法预测剩余寿命,在设备真正坏之前就安排更换[来源:IEEE Transactions on Reliability, "Prognostics for Railway Signalling"]。但PHM在铁路信号领域的落地仍面临挑战:传感器安装成本、数据分析精度、预测模型的泛化能力,都还需要持续打磨。西门子在中国铁路上已有道岔转辙机电流曲线分析的PHM商业应用,但离大规模推广还有距离[来源:行业公开信息,待核实]。

信号系统越可靠,对运维人员技能的要求反而越高。故障频率降低,意味着每个故障的珍贵程度上升——一个信号工如果一年只遇到一次重大故障,他从中学习的机会就非常有限。同时,系统复杂度的提升(从模拟到数字,从单套到冗余,从地面到车地一体化),要求运维人员掌握的知识边界不断扩展。"老带新"的传承机制是铁路信号运维的隐性支柱。当经验丰富的老一代信号工逐步退休,铁路运维面临着经验传承的断层风险。


第22章:安全认证——一套信号系统要经过多少关才能上线

22.1 认证工程师的日常

在北京亦庄的一栋写字楼里,李工每天的工作是审查信号设备厂商提交的安全认证材料。他的工牌上写着"功能安全工程师",同事们更喜欢叫他"SIL审计员"。

他手边常年放着三本标准:EN 50126、EN 50128、EN 50129。这三本标准被业界称为欧洲铁路信号安全认证的"三部曲"——分别对应RAMS(可靠性、可用性、可维护性、安全性)管理、软件安全开发、和安全电子系统认证。

李工最近在审一家厂商的ATP软件升级文档。这套软件的变更涉及移动授权计算逻辑的优化,变更范围不大,但按照EN 50128的要求,凡涉及SIL 3及以上功能变更,必须重新进行完整的安全分析。李工翻到文档第47页,看到厂商提交了"危险失效率 < 10^-7/小时"的声明,眉头皱了皱——这个数字对应SIL 3等级,但厂商没有提供充分的推导依据。他拿起红笔,在页边批注:"请补充FMEDA分析报告,危险失效率推导过程需满足EN 50129附录C的要求。"

这种"咬文嚼字"式的工作,是铁路信号安全认证的日常。安全认证不是走形式,而是用标准化的方法,系统性地证明"这套系统在各种可预见的故障条件下,不会导致危险后果"。


22.2 EN 50126:RAMS规范

EN 50126:1999的全称是《铁路应用——可靠性、可用性、可维护性、安全性(RAMS)的规范与论证》(Railway Applications - The Specification and Demonstration of Reliability, Availability, Maintainability and Safety)[来源:EN 50126:1999]。这部标准的核心贡献是建立了RAMS的整体管理框架——它告诉铁路信号系统的开发者,"安全"不是孤立的质量属性,而是与可靠性、可用性、可维护性相互关联的系统特性。

RAMS四个概念的关系可以这样理解:可靠性描述设备"多久坏一次"(MTBF);可用性描述设备"需要用的时候能不能用"(可用率);可维护性描述设备"坏了多久能修好"(MTTR);安全性描述设备"坏了会不会导致危险"。这四个指标相互影响:提高可用性可能牺牲安全性(例如旁路安全功能以减少停机时间);降低维护成本可能导致可靠性下降。RAMS管理,就是要在这些相互制约的目标之间找到最优平衡。

EN 50126已经被等同采用为中国国家标准GB/T 28001-2011[来源:等同采用为GB/T 28001-2011]。这意味着国内外铁路信号系统在中国境内建设时,都需要满足这套RAMS管理框架的要求。

EN 50126引入了"安全生命周期"的概念——从系统概念定义、风险分析、系统设计、实现、确认、安装调试、运营维护、直到退役,每个阶段都有对应的安全活动要求。这个框架的价值在于前置管理:安全问题越早发现,修复成本越低。在系统设计阶段发现一个安全漏洞,修改成本可能只是详设阶段的十分之一;如果到了运营阶段才发现,修改成本可能是初始设计的100倍以上。安全生命周期不是线性流程,而是一个迭代过程——在系统运营后发现的隐患,需要反馈到下一代产品的设计阶段,这是RAMS管理"持续改进"原则的体现。


22.3 EN 50128:SIL分级与软件开发

铁路信号系统的软件不是普通软件。一套列控系统的软件如果出现缺陷,可能导致列车在高速行驶中紧急制动(影响准点率)或者更糟的情况——ATP输出逻辑错误可能导致列车越过停车位置。美国1995年"5.28"事故(Amtrak 189次列车超速脱轨)事后调查发现,事故与ATP软件在特定条件下未能正确处理速度传感器数据有关[来源:AREMA事故调查报告]。这起事故推动了业界对信号软件安全开发过程的严格化。

EN 50128:2011是专门针对铁路信号系统软件安全的标准[来源:EN 50128:2011]。它根据软件的安全等级(SIL 0-4),规定了从需求管理、设计方法、编码规范、测试覆盖、到配置管理、变更管理的全流程要求。等级越高,要求越严格。

SIL(Safety Integrity Level,安全完整性等级)是EN 50128的核心概念。SIL等级与软件开发要求的对应关系如下[来源:EN 50128:2011;IEC 61508-3]:

SIL 0几乎不需要特殊控制,普通商业软件开发管理即可。SIL 1需要基本的项目管理控制,但不需要详细的安全论证。SIL 2开始要求使用经过安全认证的编程语言子集(如MISRA-C)、严格的代码审查流程、以及自动化测试工具,分支覆盖率要求大于70%。SIL 3需要更严格的架构设计,包括错误检测和恢复机制,分支覆盖率要求大于90%。SIL 4则是软件工程的"天花板"——必须使用数学方法证明程序正确性,俗称形式化验证(Formal Verification),分支覆盖率要求大于99%。

形式化验证是什么概念?普通软件开发中,测试能证明程序"在已知的测试用例下工作正常",但无法证明"在所有可能的输入条件下都工作正常"。形式化验证则使用数学方法(模型检查、定理证明),从数学上证明"程序的行为在所有可能的输入条件下都满足规范"。形式化验证的代价是极高的:开发SIL 4软件的成本可能是同等规模普通软件的三到五倍,开发周期也更长。全球能完成SIL 4软件认证的团队屈指可数,铁路信号领域的SIL 4软件通常集中在ATP的核心算法(如速度-距离曲线的制动计算)。但形式化验证不是银弹——它要求规范的数学建模本身是正确的,如果规范本身有疏漏,形式化验证无法发现。


22.4 EN 50129:安全电子系统

EN 50129:2018(Railway Applications - Safety-related Electronic Systems for Signalling)是针对安全电子系统的认证标准[来源:EN 50129:2018]。它的核心框架是:任何安全相关的电子系统,从概念设计到退役,都必须满足这部标准规定的安全生命周期要求。

EN 50129定义了三个关键文档,作为安全论证的"证据链":

安全案例(Safety Case)是整个认证的核心。安全案例是一套结构化的论证,用来说明"在规定的运行条件下,本系统满足规定的安全目标"。它不是测试报告的堆砌,而是逻辑论证——每一项安全要求是如何被满足的,通过什么证据(分析结果、测试数据、经验数据)证明。技术安全报告(Technical Safety Report)是安全案例的技术支撑,详细记录了系统架构、故障模式分析(FMEDA)、危险和风险分析(HARA)、安全需求追踪等。运行安全记录(Operational Safety Report)则关注系统在运营阶段的安全管理,包括维护规程、事故调查程序、人员培训记录等。

EN 50129定义了SIL等级与危险失效率(Dangerous Undetected Failure Rate)的对应关系[来源:EN 50129:2018]:

SIL等级危险失效率(每小时)典型应用
SIL 110^-5 ~ 10^-6非安全相关系统
SIL 210^-6 ~ 10^-7辅助安全系统
SIL 310^-7 ~ 10^-8主要安全系统(ATP输出)
SIL 4< 10^-8极致安全系统

"危险失效"(Dangerous Failure)是指导致系统进入危险状态的失效——比如ATP本应在列车超速时制动,但因故障未能制动。SIL 3要求危险失效率低于10^-7/小时,意味着在系统运行的一千万小时(约1,140年)内,危险失效不超过一次。这不是理论要求,而是需要在设计中通过FMEDA(故障模式、影响及其诊断分析)等方法实际计算和验证的目标。EN 50129已经被等同采用为中国国家标准GB/T 34092-2017[来源:等同采用为GB/T 34092-2017]。


22.5 为什么一张SIL4证书值几千万

安全认证不是免费午餐。以EN 50128 SIL 3为例,一套完整的软件开发安全认证文档(包含安全计划、需求规格、设计规格、代码、测试用例、测试报告、配置管理记录等)可能超过数万页。一个中型信号系统项目的认证过程可能需要12-18个月,涉及厂商内部安全工程师、第三方认证机构(如TÜV、SGS、BV)、以及最终用户三方的大量沟通和反复修订。

第三方认证机构在安全认证中扮演"独立审计"的角色。厂商内部的安全工程师有利益冲突——他们既负责开发又负责证明安全,这不能让人信服。第三方机构(如德国的TÜV莱茵、法国BV、美国UL)基于独立的分析和测试,验证厂商的安全论证是否充分。独立认证的价值在于,它提供了"不是厂商自己说安全就算安全"的制衡机制。

中国在安全通信协议上有自己的积累。RSSP-I(铁路信号安全协议-I)和RSSP-II是中国通号集团研发的专有安全通信协议,分别针对环形网络和以太网架构[来源:中国通号集团RSSP-I/RSSP-II技术白皮书;GB/T 33190-2017《铁路信号系统安全通信协议》]。RSSP-II的危险失效率设计目标为 < 10^-9/小时,对应SIL4要求。RSSP-II的核心技术特点在于"双套冗余+交叉验证":两套完全独立的协议栈同时运行,接收端必须两套数据一致才将数据提交给应用层。这种"二取二"(2oo2)的架构——与通常的"二取一"(2oo2)冗余不同——它牺牲了可用性,换取了更高的安全性,任何一套协议栈检测到异常,系统都会拒绝该数据。

认证的成本为什么这么高?因为安全认证的本质是把"可能出事"的概率压到可接受的低水平。每一次降低一个数量级的危险失效率,都意味着更多的设计冗余、更严格的测试、更详尽的安全分析。以SIL 4为例,危险失效率要低于10^-8/小时,这意味着系统运行一亿小时(约11.4万年)内,危险失效不超过一次。这个量级的论证,需要设计阶段的FMEDA分析、仿真测试、硬件在环测试(HIL)、软件背后的形式化验证、长期的老化测试——每一项都需要专业人员和时间投入,成本自然就上去了。

更重要的是,安全认证不是一次性的"过关"。EN 50129要求,系统在获得认证后,运营方必须建立变更管理(Change Management)机制——任何对系统的修改(软件升级、硬件更换、配置变更)都必须重新评估安全影响。如果变更涉及SIL 3及以上功能,可能需要重新认证。认证机构也会对已认证系统进行监督审核(Surveillance Audit),确认系统在运营中持续满足认证时的假设条件。监督审核通常每2-3年一次,检查内容包括配置管理是否合规、安全相关变更是否按程序处理、运营维护记录是否完整等。

安全认证的真正价值,在于它建立了一套行业公认的"信任基础设施"。当业主采购一套信号系统时,他不需要自己去验证每一个晶体管、每一行代码是否符合安全要求——他只需要相信持有有效SIL认证的系统和厂商。这套信任机制,是整个铁路信号行业规模化发展的制度基石。

第五部分:未来趋势

第23章:车车通信——未来的列车"自己商量"怎么开

23.1 北京地铁早高峰的通信延迟问题

2019年早高峰,北京地铁10号线列车以最小追踪间隔行驶。这是全中国最繁忙的地铁线路之一,日均客流量超过170万人次,高峰期发车间隔已压缩至接近两分钟——这已是传统CBTC架构下的极限。

后续列车司机室的显示屏上,精确显示着前车的位置、速度和距离。这些数据看似简单,背后却经历了一个复杂的信息旅程:前车通过应答器校准自身位置,通过车载ATP计算实时速度,通过LTE-M无线网络上传到地面区域控制器(ZBC),ZBC经过安全运算后再下发给后续列车。这条信息链条的每一个环节,都存在处理延迟。

这套系统运行了二十年,足够可靠。但有一个问题始终存在:所有信息都必须经过"地面中转"。当列车密度越来越高,追踪间隔越来越短,这个"中转站"开始成为瓶颈。

实际数字更能说明问题:在传统CBTC架构下,车地通信延迟约50-100毫秒,地面处理延迟约100-200毫秒,地车通信再需50-100毫秒。总延迟约200-400毫秒——在80公里/小时的速度下,400毫秒意味着列车已经行进近9米。如果系统负载较高或无线环境较差,延迟可能超过500毫秒,对应的距离超过11米。

这个"盲区"必须被纳入安全防护距离的计算。ATP无法区分前车是静止还是在减速——它只能根据最后收到的位置信息做最保守的假设。这意味着,即使前车正在匀速行驶,后续列车也必须按照"前车可能随时停车"的最坏情况来计算制动曲线。

解决思路看似简单:既然列车之间需要知道彼此的位置和速度,为什么不跳过地面,让列车直接对话?这就是车车通信(T2T,Train-to-Train Communication)的核心思路——让列车之间建立直接的数据链路,实时共享位置、速度、制动曲线等信息,不再依赖地面设备转发。

这个转变的意义,远不止是减少一次信号传输。它意味着铁路信号系统的架构正在发生根本性变化:从"地面中心"走向"分布式智能"。过去一百五十年,铁路信号系统的进化逻辑始终是"地面告诉列车该怎么做";T2T的出现,第一次让列车成为信息处理的主体——它们不仅接收指令,还能主动交换信息、协同决策。

23.2 为什么需要列车直接对话

23.2.1 现有CBTC系统的信息延迟链条

在传统CBTC系统中,列车位置信息的传递是一个完整的闭环:

第一步:位置获取。列车通过车载速度传感器测量行驶距离,通过应答器(Balise)校准绝对位置。每经过一个应答器,列车就知道自己在线路上的精确坐标。

第二步:V2G上传。列车通过车载无线电台(如LTE-M模块)将位置数据发送到地面接入点(AP)。这个过程在良好无线环境下约需20-50毫秒。但在隧道弯道等遮蔽场景下,无线信号可能经历多次反射和衰减,导致误码率上升,需要重传,延迟可能增加到100毫秒以上。

第三步:地面处理。地面RBC(无线闭塞中心)接收到列车位置数据后,需要完成几项关键工作:验证数据完整性(检查CRC校验)、更新列车追踪列表、计算移动授权(Movement Authority)、生成速度曲线限制。这些安全计算必须遵循EN 50129标准,需要冗余校验。正常负载下,地面处理延迟约100-200毫秒。

第四步:G2V下发。RBC将移动授权信息通过下行无线链路发送给后续列车,同样需要20-50毫秒。

总延迟:四个环节相加,正常情况下总延迟约200-400毫秒。在极端情况下(如RBC切换期间、多列车同时上报位置时),可能超过500毫秒。

23.2.2 延迟如何限制了追踪间隔

列车制动距离取决于初始速度和减速度。以80公里/小时(约22.2米/秒)为例,常用制动减速度约1米/秒²,紧急制动约1.2米/秒²。计算表明,80公里/小时列车从制动到完全停止,制动距离约150-170米。

如果ATP只知道500毫秒前的位置,那么在这500毫秒内,前车可能已经又行驶了11米。ATP必须假设前车在这11米内随时可能开始制动——这意味着它需要额外预留11米的"模糊距离"。在极端情况下,这个模糊距离会叠加到安全制动距离上,迫使追踪间隔增大。

理论极限:在传统CBTC架构下,移动闭塞的极限追踪间隔约为60-90秒。60秒意味着追踪间隔已接近"首尾相接"的极限——列车间距仅略大于安全制动距离。这个极限不是算法不够好,而是物理约束:地面中转的固有延迟,决定了安全裕量不可能无限缩小。

T2T的价值:列车直接获取前车实时位置,省去地面转发环节,可以将端到端延迟降低到50毫秒以下——甚至更低。50毫秒对应80公里/小时下的行驶距离仅约1.1米,相比500毫秒的11米,缩小了90%。安全裕量大幅压缩,追踪间隔有望进一步压缩到60秒以内。

这个提升在高密度运营线路(如北京10号线、上海2号线)上的意义极其重大:发车间隔每压缩10秒,理论运力可提升约5-8%。

来源:3GPP TS 22.289(下一代列车通信);Railway Gazette International, "Train-to-train communication"(2020)

23.3 LTE-M与5G URLLC:车车通信的无线承载

23.3.1 LTE-M:任务关键型LTE的成熟应用

T2T通信需要可靠的无线通信网络作为承载。在中国城市轨道交通领域,LTE-M(Long Term Evolution - Mission Critical)是目前应用最广泛的无线通信制式。

LTE-M由3GPP在Release 14中定义,专门针对公共交通等任务关键型场景。与普通LTE公众网络相比,LTE-M针对铁路信号的需求做了多项关键增强:

语音与数据并发:LTE-M同时支持语音调度和列车控制数据,而普通LTE需要分别占用不同频道或通过VoLTE实现。在CBTC系统中,语音调度和自动控制数据必须同时传输,两者不能互相干扰。LTE-M的双工机制确保了语音通话时控制数据不受影响。

快速切换:列车在隧道中高速移动时,会频繁穿越不同基站覆盖区域。以100公里/小时行驶的列车,每隔约400-500米就可能需要切换基站。LTE-M优化了基站切换机制,切换时延控制在50毫秒以内,并通过双网覆盖(重要路段部署主备两个基站)确保切换过程中数据不丢失。

高可靠性设计:LTE-M支持冗余覆盖和热备份。在关键区域(如换乘站咽喉、隧道出入口),部署双网热备——主用网络故障时,备用网络可以在毫秒级接管,保证列车控制不中断。这与信号系统"故障导向安全"的设计哲学一脉相承。

LTE-M在中国城市轨道交通中已大规模应用。北京、上海、广州、深圳、成都、武汉等城市的CBTC系统普遍采用LTE-M作为车地无线通信承载。北京地铁燕房线(GoA4级全自动驾驶)是LTE-M在无人驾驶场景下的典型应用,验证了其在高密度运营环境下的可靠性。燕房线全长约21公里,全部为地下线路,LTE-M网络实现了全线连续覆盖。

来源:3GPP Release 14/15/16 LTE-M规范;中国移动5G技术白皮书;北京地铁燕房线技术资料

23.3.2 5G URLLC:超低延迟的下一代网络

LTE-M在CBTC系统中已足够成熟,其端到端延迟通常在50-100毫秒区间。但对于T2T通信来说,这个延迟仍有提升空间——特别是在紧急制动预警场景下,每10毫秒的延迟都关乎安全。

5G URLLC(Ultra-Reliable Low-Latency Communications,超可靠低延迟通信)切片,是T2T通信的未来承载网络。URLLC是5G三大应用场景之一(另外两个是eMBB增强移动宽带、mMTC海量机器通信),专门为极致可靠性+极致低延迟设计。

URLLC的性能目标极为苛刻

  • 端到端延迟:小于1毫秒(单向)
  • 可靠性:高于99.999%,即每年平均故障时间不超过5.26分钟

这个99.999%的可靠性,意味着在99.999%的时间里,数据包传输延迟必须在1毫秒以内。对于列车控制这种安全性极高的应用,这不是一个"尽力而为"的目标,而是必须满足的强制性指标。

URLLC的技术基础包括:

新型空口设计:5G NR(新无线)采用更短的传输时间间隔(TTI)。LTE的TTI固定为1毫秒,而5G NR的TTI可短至0.125毫秒(14个符号,参数集μ=1)。更短的TTI意味着更快的调度周期,端到端延迟自然更低。

边缘计算(MEC):传统移动通信中,数据包需要经过基站、传输网、核心网才能到达目的地。边缘计算将数据处理能力下沉到基站甚至列车上,数据在本地完成处理,无需往返核心网。以T2T紧急制动预警为例:如果制动指令可以在基站附近处理并广播,延迟可以从端到端的数十毫秒降低到真正的"本地"延迟——亚毫秒级。

高密度天线阵列(Massive MIMO):大规模天线技术通过在基站部署数十甚至上百根天线,配合波束赋形算法,可以精确指向目标列车。即使列车在高速移动中,也能保持优质连接。波束追踪技术让天线主瓣跟随列车移动,减少切换需求。

网络切片:5G网络可以根据不同业务需求划分独立"切片"。T2T通信使用专用的URLLC切片,与普通数据业务物理隔离——即使网络拥塞,T2T切片的性能也不受影响。这保证了关键控制的优先级。

标准化进展:3GPP在Release 16/17中定义了URLLC的完整规范。针对轨道交通的专用增强(如高速移动场景下的多普勒补偿、高可靠性的重传机制)正在Release 18及后续版本中完善。预计2025-2030年,5G URLLC将在铁路领域开始试点;真正的规模化商业部署,可能要到2030年以后。

来源:3GPP Release 16/17 URLLC规范;华为5G技术白皮书;IMT-2020(5G)推进组技术白皮书

23.4 从地面中心到分布式智能

23.4.1 直接通信与间接通信

T2T通信存在两种实现模式,各有适用场景。

直接通信模式:列车之间通过专用频段或共享频谱直接交换数据,不经过地面基站转发。这种模式的优势是延迟最低——真正的"列车到列车"直连,没有中间节点;劣势是对通信设备要求高,需要列车具备直接通信能力,且通信距离受限于无线覆盖范围(通常几百米到几公里)。

直接通信的实现有两种技术路径:一是利用5G NR的Sidelink(侧行链路)机制,类似于车联网(V2X)中的PC5接口,列车之间可以直接通信而无需基站转发;二是使用专用的短程通信频段(如Ku/Ka频段的车载卫星终端),但这种方式成本较高,目前主要用于特定场景(如货运列车列尾装置)。

间接通信模式:列车数据通过地面基站或路侧单元(RSU)转发。列车端"感知"不到中转延迟——通信对上层应用是透明的。在5G网络中,通过URLLC切片和网络边缘计算,转发延迟可以压缩到接近直接通信的水平。

间接通信的优势是复用现有的基站基础设施,不需要为T2T单独建设网络。但它本质上仍然是"地面中转",延迟下限受制于基站处理和边缘计算的延迟。

实际系统中的混合策略:T2T通信通常是两种模式的混合。常规运营时,通过地面基站转发(延迟可接受,且可以利用现有基础设施);紧急情况下(如前车触发紧急制动),切换到直接通信模式(最低延迟),立即向后方列车广播紧急制动指令。这种策略在可靠性和成本之间取得了平衡。

23.4.2 T2T信息类型与优先级

T2T通信中交换的数据可分为几个层次,不同层次有不同的实时性要求:

第一层:常规位置与速度广播。这是T2T的基础数据。前车实时广播自身位置(通过应答器校准的精确位置,含经纬度或里程标)、当前速度、运动方向。这些数据让后续列车可以精确计算与前车的相对距离和追及时间。这是周期性的广播,广播间隔通常为100-500毫秒。

第二层:制动曲线预告。前车向后续列车发送当前制动曲线预告——不仅是"我现在在哪里",还包括"我计划在哪里开始制动、减速度是多少"。这让后续列车可以提前预测前车的减速轨迹,更精确地计算最优追踪策略。这比传统系统仅传输"当前位置"要丰富得多,接近于"驾驶意图共享"。

第三层:紧急制动预警。这是T2T中延迟要求最高的数据。当任一列车触发紧急制动时(例如司机按下紧急制动按钮,或ATP检测到前方的危险状态),立即向其后方所有列车广播紧急制动指令。这条信息的延迟目标是亚毫秒级,需要直接通信模式支撑。

紧急制动预警的典型场景是:前车突然检测到前方有异物或前方列车紧急制动。后方列车收到预警后,可以在几百毫秒内启动制动,而不需要等待地面RBC的确认——这比传统架构快了整整一个地面处理周期。

来源:Railway Gazette International, "Train-to-train communication"(2020);X2Rail项目最终报告(2020年)

23.4.3 从"地面决策"到"分布式智能"

传统CBTC系统的核心逻辑是"地面决策":列车位置上传到RBC,RBC计算移动授权并下发,车载ATP负责执行和超速防护。列车的控制决策主要由地面做出,车载系统更像是"执行者"而非"思考者"。

T2T通信的实现,让列车本身具备了更完整的"视野"。列车不仅知道自己的位置和速度,还能直接获取前车的实时状态——位置、速度、运动方向、制动意图。这使得车载系统可以做出更精确的追踪决策,而不需要完全依赖地面RBC。

架构演进的三个阶段

第一阶段(当前):地面RBC主导,车载ATP执行。T2T作为补充手段,用于紧急制动预警等特定场景。这是目前大多数CBTC系统的实际状态。

第二阶段(过渡):地面RBC与T2T混合决策。列车在RBC覆盖区域依赖地面决策,在RBC边缘或故障时切换到T2T协同。T2T从"补充"升级为"备份"或"协同"角色。5G URLLC的成熟将加速这一阶段。

第三阶段(远景):分布式智能架构。列车作为信息处理主体,基于T2T通信实现协同控制;地面设备退化为定位校准(应答器)和冗余备份。RBC的算力需求大幅降低,部分功能可以"下沉"到车载或轨旁。

23.4.4 对移动闭塞的增强

移动闭塞(Moving Block)是CBTC的核心优势:区间不是固定划分的,而是根据列车实际位置和制动曲线动态计算,后续列车可以"逼近"前车车尾行驶,而不需要停在固定的分界点之前。

T2T通信让移动闭塞更加精确和"智能":

精确性提升:后续列车不仅知道前车"在哪里",还知道前车"正在做什么"——是加速、减速还是匀速?当前的减速度是多少?制动曲线预告让追踪列车可以精确预判前车的减速轨迹,而不是只能根据最后收到的位置做最保守的假设。

安全裕量降低:传统移动闭塞中,追踪列车需要为"位置不确定性"预留裕量。T2T消除了这个不确定性——你能看到的不是500毫秒前的位置,而是前车的实时状态。安全裕量可以大幅降低,追踪间隔自然缩小。

理论上,T2T可以让移动闭塞的追踪间隔接近"首尾相连"的极限——后续列车车头与前车车尾的距离,仅需满足制动距离要求。这个极限在数学上比现有系统小得多。

23.5 行业视角:欧洲的T2T研究实践

23.5.1 Shift2Rail:欧盟铁路创新框架

Shift2Rail是欧盟 Horizon 2020 框架下的铁路创新联合项目,运营周期为2014年至2020年。这是近年来欧洲铁路领域最大的研发倡议,由欧盟出资约2.2亿欧元,行业配套约2.3亿欧元,总预算约4.5亿欧元。

Shift2Rail的目标极具野心:降低铁路系统全生命周期成本50%,将铁路运输能力提高一倍以上。这不仅仅关乎信号系统,而是涵盖机车车辆、基础设施、能源效率等多个领域的系统性创新。

Shift2Rail下设五个技术创新领域(Innovation Programme,IP):

  • IP1:机车车辆(转向架、牵引系统)
  • IP2:信息技术与通信(信号系统、列车通信)
  • IP3:基础设施(轨道、桥梁、隧道)
  • IP4:旅客服务与货物运输
  • IP5:能源效率与可持续发展

IP2(信息技术与通信)负责信号和通信系统的研发,是T2T研究的主要推动者。IP2的核心任务包括:开发下一代列车通信架构(包括T2T)、研究卫星定位替代应答器的可行性、以及5G/FRMCS(未来铁路移动通信系统)在铁路的应用。

23.5.2 X2Rail:T2T通信研究的先锋

X2Rail项目是Shift2Rail旗下专门研究下一代信号通信的项目,由阿尔斯通、西门子、泰雷兹等多家厂商以及欧洲多所大学联合执行。X2Rail涵盖多个子项目,其中:

X2Rail-1专注于"列车间通信与定位",是T2T研究的核心项目。

X2Rail-1的主要研究成果

T2T通信协议栈设计:项目定义了列车之间直接通信的完整协议栈,涵盖物理层(射频)、MAC层、网络层和应用层。协议栈的设计考虑了与现有ETCS标准的兼容性,确保不同厂商的列车可以互操作。这是T2T从"实验展示"走向"商用部署"的关键一步。

5G与卫星混合组网:X2Rail研究了如何将5G网络与卫星通信结合,在山区、隧道等地面基站覆盖困难的区域,用卫星作为补充通信手段。对于欧洲的阿尔卑斯山铁路和货运铁路,这项研究有特殊价值——这些线路穿过大量隧道和山区,地面基站部署困难,卫星通信可以提供无缝覆盖。

自适应列车编组:这是T2T通信的一种高级应用场景。利用T2T通信实现列车之间的协同控制,让多列列车在运行时自动组成紧密编组(Platooning),共享制动和牵引信息。编组内的列车可以几乎同时制动,显著缩短整体制动距离。这项技术对于货运铁路尤其有价值——在既有线路上,通过紧密编组可以在不改造基础设施的情况下大幅提升运输能力。

X2Rail-2则专注于"卫星定位与传感器融合",研究用北斗/GPS+惯性导航替代应答器作为列车定位的主要手段。

X2Rail项目于2020年完成,最终报告总结了T2T通信的标准草案和现场测试结果。这些成果正在被欧洲铁路局(ERA)纳入ERTMS/ETCS标准,被3GPP纳入铁路5G专用的标准序列。欧盟正在论证将X2Rail成果纳入"欧洲铁路交通管理系统"(ERTMS)的未来版本。

来源:Shift2Rail官网(shift2rail.org);X2Rail项目最终报告(2020年);ERA(欧洲铁路局)ERTMS技术文档

23.5.3 T2T的挑战与展望

T2T从概念到大规模部署,仍有多个技术挑战需要系统性解决:

通信可靠性:列车在高速移动中保持稳定通信,本身就是难题。当两列列车相向而行时,相对速度可达200-300公里/小时,多普勒频移(Doppler Shift)会导致载波频率显著偏移,需要专门的补偿算法。此外,列车车体对无线信号有遮挡效应,特别是当两列列车"首尾相接"时,车载无线电台之间的直接通信可能受到列车本身的阻挡。

安全认证:T2T通信涉及列车控制安全,需要通过EN 50129的SIL 4认证。SIL 4是铁路信号系统的最高安全等级,要求危险失效概率小于10^-8每小时,并且需要形式化验证(Formal Verification)——用数学方法证明程序的正确性。这对T2T通信软件的开发方法、测试要求、配置管理都提出了极高要求,开发周期长、成本高。

互操作性:不同厂商的列车需要能够相互通信。这要求T2T通信协议标准化——包括消息格式、时序要求、安全机制等。目前相关标准由3GPP和UIC(国际铁路联盟)联合制定,但正式标准发布仍需时日。在标准成熟之前,不同厂商的T2T系统可能无法互通,限制了实际部署的规模。

部署展望:综合技术成熟度和标准进展,T2T通信的部署路径如下:

近期(2025-2030年):5G URLLC开始试点,T2T通信在特定场景(如高速铁路、货运铁路)开展试验。LTE-M仍是主流车地通信制式,T2T作为增强功能在少数线路上试运营。

中期(2030-2035年):5G URLLC逐步商用,T2T作为标准功能集成到列车控制系统。混合架构(地面RBC+T2T协同)成为主流,新建线路开始原生支持T2T。

远期(2035年以后):分布式智能架构成熟,地面RBC的作用逐步弱化,列车协同控制成为常态。T2T与自动驾驶(GoA4)深度融合,实现真正的"列车编队"运行。


第24章:智能运维——让设备"告诉"你它要坏了

24.1 上海地铁道岔电流曲线的秘密

2023年4月的一个早高峰,上海地铁2号线龙阳路站附近发生一起道岔故障,导致列车晚点约15分钟,部分列车需要绕行。

故障原因听起来很简单:道岔转辙机的牵引电机老化,输出力矩不足,导致道岔在转换过程中卡滞,无法到位。ATP检测到道岔位置异常后,自动触发保护区段关闭,相关进路无法排列。

但事后复盘发现,这台电机的劣化趋势在三个月前就已经显现——每次道岔转换时,电机电流曲线都在悄然变化:启动电流逐渐增大、到位电流超时次数逐渐增加。这些数据变化肉眼难以察觉,但通过系统分析可以发现明显的趋势性异常。

如果当时有PHM系统监测并分析电流曲线,就能提前2-3周发现电机老化,在计划修时更换电机——而不是等到故障发生、列车晚点。

这就是PHM(Prognostics and Health Management,故障预测与健康管理)的核心价值:在故障发生前就预测到它,让维护从"被动响应"变为"主动预防"。

这个转变的意义,不仅仅是减少一次延误。它代表着铁路信号系统维护理念的根本性变革:从"定性"到"定量",从"经验"到"数据"。

24.2 四种维护模式对比

24.2.1 维护模式的演进

要理解PHM的价值,需要先理解信号系统维护模式的演进过程。

事后维修(Corrective Maintenance,CM)是最原始的维护模式:设备坏了才修。好处是维护成本低——不需要预防性投入,不需要定期更换状态良好的部件;坏处是故障导致的运营中断损失可能远超维护本身的成本。

对于地铁这种高密度运营系统,一次非计划故障的代价是巨大的:上海地铁2号线日均客流约170万,故障晚点15分钟,受影响乘客可能达数万人次;更严重的是,故障可能引发连锁反应,导致整个区段运营紊乱。事后维修的隐性成本(声誉损失、乘客投诉、应急处置投入)往往远超设备本身的维修费用。

定期维修(Time-based Maintenance,TBM)是目前中国铁路和城市轨道交通中最普遍的维护模式:按照固定的时间周期(如每月、每季度、每年)对设备进行强制维护,不管设备状态如何。这种模式源于制造业的"定期大修"传统,在铁路系统已有几十年历史。

定期维修的好处是维护工作可以计划,备件可以提前准备,应急响应更有序。但坏处是"一刀切"——状态良好的设备被过度维护,白白浪费维护资源;状态已经劣化但未到维护周期的设备,反而可能带病运行。定期维修无法适应设备的个体差异和实际使用环境。

状态维修(Condition-based Maintenance,CBM)和PHM代表了维护模式的进化方向。CBM通过传感器监测设备状态,当设备状态劣化到预设阈值时触发维护。PHM则更进一步:通过AI算法预测设备的剩余寿命(Remaining Useful Life,RUL),在最优化的时间点进行维护。

维护方式触发条件优点缺点
事后维修设备坏了才修维护成本低(无预防性投入)故障导致中断服务,隐性成本高
定期维修按时间间隔强制维护可计划性,备件可预置过度维护或维护不足
CBM(状态维修)设备状态劣化到阈值维护精准,针对性强需要传感器和算法支撑
PHM(预测维修)AI预测剩余寿命最优维护时机,避免过度维护技术难度高,实施成本大

来源:PHM Society期刊;IEEE Transactions on Reliability, "Prognostics for Railway Signalling"

24.2.2 PHM的闭环流程

PHM不是单一技术,而是一套完整的闭环流程,涵盖五个核心环节:

数据采集:通过传感器获取设备运行数据。数据类型包括电气参数(电流、电压、功率、功率因数)、机械参数(振动、位移、转速、温度)、环境参数(环境温度、湿度)等。数据采集是PHM的"感知"环节。

状态监测:实时展示设备当前状态,当参数超出正常范围时发出报警。这是PHM的"看得见"部分,让维护人员能够实时掌握设备健康状态。状态监测解决的是"设备现在怎么样"的问题。

故障预测:基于历史数据和智能算法,预测设备剩余寿命或故障概率。这需要机器学习或物理模型支撑,是PHM的"最强大脑"。故障预测解决的是"设备还能用多久"的问题。

维护决策:根据预测结果,制定最优维护计划。目标是"在故障发生前更换",但也不宜过早——过早更换造成浪费(设备仍有剩余寿命),过晚更换则可能导致故障。维护决策需要综合考虑设备状态、运营计划、备件库存、维护成本等多方面因素。

反馈优化:维护完成后,将实际故障数据(电机确实老化了,还是其他原因?)反馈到预测模型,持续优化预测精度。PHM系统"越用越准",是因为它能不断从实际结果中学习。

24.3 道岔电流曲线:PHM的典型应用

24.3.1 电流曲线分析原理

道岔转辙机是信号系统中故障率较高的设备之一,负责推动道岔尖轨转换位置,实现列车进路的建立。道岔转辙机的核心部件是牵引电机,其工作状态可以通过电流曲线精确反映。

正常情况下的电流曲线:道岔转换时,电机电流曲线呈现标准的"S"形变化过程。

  • 启动阶段(0-200毫秒):电机刚通电,需要克服静摩擦和惯性,电流较大,通常为额定电流的2-3倍。
  • 正常运转阶段(200毫秒-到位前):道岔尖轨开始移动,摩擦力相对稳定,电流维持在额定电流的1-1.5倍。
  • 锁闭阶段(到位前100毫秒至到位):道岔尖轨进入锁闭位置,需要克服锁闭阻力,电流再次上升至额定电流的2倍左右,然后迅速归零。

这条"S"曲线的形状、峰值、持续时间,都是电机和机械结构状态的"指纹"。

异常情况下的电流曲线:当电机老化、轴承磨损、润滑不良或机械卡阻时,电流曲线会出现可识别的异常模式:

  • 启动电流异常增大:可能意味着轴承锈蚀、润滑失效,静摩擦力增大。
  • 运转电流波动增大:可能意味着齿轮间隙增大、连接松动。
  • 到位电流超时:到位后电流没有迅速归零,可能意味着锁闭机构卡滞或电机输出力矩下降。
  • 曲线整体右移(到位时间延长):可能意味着机械阻力系统性增大。

实际案例:西门子在其Predix平台(现整合到西门子Xcelerator)上开发了道岔转辙机电流曲线分析系统,已在德国铁路(DB)有实际部署。该系统通过对比实时电流曲线与标准曲线,自动识别异常模式,并预测电机剩余寿命。

预测模型的核心是时序分析:将每次道岔转换的电流曲线分解为若干特征(启动电流峰值、运转电流均值、到位时间、曲线下面积等),建立这些特征随时间变化的趋势模型。当趋势指向"即将失效"时,发出预警。

来源:西门子技术白皮书;IEEE Transactions on Reliability, "Prognostics for Railway Signalling"

24.3.2 轨道电路与车载ATP的PHM应用

轨道电路的电压趋势监测:轨道电路是检测列车位置的传感器设备,其工作状态通过轨道继电器端的电压反映。正常情况下,轨道电路输出电压稳定在设定范围内;当钢轨阻抗变化、绝缘节老化或存在分路不良时,输出电压会出现漂移。

轨道电路的输出电压受多种因素影响,其中环境温度是最主要的影响因素。钢轨的电阻随温度变化:夏季高温时,钢轨膨胀,电阻增加,可能导致轨道继电器端电压偏低;冬季低温时,情况相反。

传统维护的解决方案是"温度补偿":根据统计学数据,设定不同温度下的电压调整参数。但这种统计补偿有其局限性——它反映的是"平均"情况,无法考虑特定线路的实际条件。

PHM方法通过持续监测轨道电路输出电压,建立"个体化"的电压-温度关系模型。用回归分析(如多元线性回归或高斯过程回归)建立针对这条轨道电路的个体化补偿模型。当实际电压偏离模型预测值时,说明设备可能存在隐性故障——绝缘节阻抗变化、连接线接触不良、送电端或受电端设备老化等。

中国厂商实践:中国通号已建立轨道电路状态监测系统,在部分高铁线路上试点应用。该系统通过实时采集轨道电路电压数据,结合温度补偿模型,自动识别异常并报警。与传统"阈值报警"不同,PHM系统能够识别渐进性劣化趋势,在劣化发展到故障之前提前预警。

来源:中国通号技术白皮书;行业公开信息,待核实

车载ATP的处理器健康监测:车载ATP(列车自动防护)是列车控制的核心处理器,其可靠性直接关系到行车安全。车载ATP的故障通常表现为处理器错误率上升、温度异常、内存泄漏等。

关键监测参数包括:

  • 处理器温度:硬件故障通常伴随温度异常上升。正常运行时,处理器温度与环境温度的温差应相对稳定;当散热系统效率下降或处理器内部出现短路时,温差会逐渐增大。
  • 错误率:包括ECC(纠错码)错误、CRC(循环冗余校验)错误、帧错误等。硬件老化初期,错误率可能很低但逐渐上升,PHM系统能够捕捉这个趋势。
  • 内存使用率:内存泄漏会导致可用内存逐渐减少,内存使用率呈线性上升趋势。
  • 看门狗复位次数:看门狗定时器用于检测程序是否"死机",频繁复位说明程序稳定性存在问题。

来源:IEEE Transactions on Reliability相关论文;行业公开信息,待核实

24.4 西门子HealthHub:TGV的预测维修

24.4.1 西门子Predix与工业互联网生态

西门子是PHM领域的先行者,其工业互联网平台Predix(2023年整合到西门子Xcelerator统一平台)是最早的工业级PHM平台之一,在铁路、能源、制造业等多个领域有广泛应用。

Predix的核心能力

设备连接:Predix支持OPC UA、Modbus、MQTT等多种工业通信协议,能够接入几乎所有主流厂商的设备数据。在铁路信号领域,西门子的Sicas联锁系统、TrafiGuard ATP等设备的数据都可以通过Predix采集。

数据分析:Predix内置机器学习算法库,支持时序数据分析(如LSTM用于趋势预测)、异常检测(如 Isolation Forest 用于离群点识别)、寿命预测(如 Weibull 分析)等PHM核心功能。用户不需要从零开发算法,可以直接调用平台提供的分析引擎。

应用开发:Predix提供低代码应用开发环境,支持快速构建PHM可视化大屏、报警管理界面、维护工单系统等。维护人员可以通过图形化配置,而不需要写代码。

铁路信号领域的实践:西门子的PHM应用主要聚焦于三类设备:道岔转辙机、轨道电路、车载ATP。在道岔转辙机领域,西门子与德国铁路(DB)合作多年,积累了大量实际部署经验。DB宣称,部署PHM后,道岔故障导致的非计划维护减少了约25%。

来源:西门子官网;西门子Xcelerator平台介绍;DB技术白皮书

24.4.2 阿尔斯通HealthHub与TGV实践

阿尔斯通的PHM平台名为HealthHub,是其"智能化服务"战略的核心组成部分。HealthHub的特点是与阿尔斯通的信号系统深度绑定——设备数据从阿尔斯通的列车控制系统(如Atlas ATP、Urbalis CBTC)直接采集,不需要额外的网关设备,数据集成度更高。

TGV应用案例:阿尔斯通在法国TGV高速列车上部署了HealthHub系统,覆盖列车网络、制动系统、门控系统、受电弓等关键部件。

TGV是欧洲高速铁路的标杆列车,运营速度高达320公里/小时,其可靠性要求极高。HealthHub在TGV上的核心应用包括:

  • 制动系统监测:监测制动风缸压力、制动夹钳力度、制动盘温度等参数,预测制动片剩余寿命。
  • 受电弓监测:监测受电弓碳滑板厚度、接触网电压波动等,预测受电弓维护周期。
  • 门控系统监测:监测车门关闭时间、阻力变化等,预测门控电机寿命。

阿尔斯通声称,HealthHub在TGV上的预测准确率超过85%,已帮助法国铁路(SNCF)减少了约30%的非计划维护。TGV的非计划维护率本已是全球铁路的标杆,PHM让这个数字进一步下降。

地铁扩展:HealthHub正在向城市轨道交通领域扩展。在部分地铁运营商(如巴黎地铁、迪拜地铁)的试点中,HealthHub被用于道岔转辙机、站台门、轨道电路等设备的状态监测。

来源:阿尔斯通年报;阿尔斯通HealthHub产品介绍

24.4.3 泰雷兹Flytxt与中国厂商

泰雷兹的PHM能力主要通过其数据分析子公司Flytxt实现。Flytxt专注于大数据分析和机器学习,为交通、能源、公共安全等行业提供预测性维护解决方案。

Flytxt的技术特点是小样本学习和可解释AI。工业设备故障是小概率事件,能用于训练的历史故障样本非常有限。Flytxt的机器学习算法针对小样本场景做了优化,能够在有限故障数据的情况下仍做出有价值的预测。

泰雷兹在铁路信号领域的PHM应用主要面向地铁运营商,提供设备状态监测和故障预警服务。其优势在于泰雷兹在地铁信号市场的深厚积累——SelTrac CBTC系统在全球有大量部署(在中国的上海、广州、北京等城市有应用),这些系统的运行数据为PHM算法训练提供了丰富的素材。

中国厂商的迎头赶上:中国厂商在PHM领域起步较晚,但进步迅速,且拥有独特的优势——全球规模最大的城市轨道交通网络,设备运行数据的丰富程度是任何其他国家无法比拟的。

中国通号:作为中国铁路信号系统的"国家队",中国通号拥有国内最全面的信号设备运行数据。其轨道电路和道岔状态监测系统已在部分高铁线路上试点应用。中国通号的优势在于与铁路局、地铁运营商的深度合作关系,能够获取大量一手现场数据;劣势在于AI算法能力与国际巨头仍有差距,高端传感器依赖进口。

交控科技:作为中国第一家自主CBTC厂商,交控科技在地铁运维系统中集成了PHM模块。交控科技的优势在于与地铁运营商的紧密合作关系——其CBTC系统覆盖北京、重庆、成都、乌鲁木齐等城市,大量现场应用为算法优化提供了数据基础。

众合科技:众合科技的PHM聚焦于道岔监测和轨道电路监测两大方向。其技术特色是将"专家经验"和"机器学习"结合——先用领域专家的知识设定初始规则,再用历史数据训练规则参数,实现"人机协同"的预测模式。

华为:华为自身不生产信号设备,但与部分地铁公司合作开展PHM研究。华为的优势在于云计算和AI能力——其ModelArts机器学习平台可以用于PHM模型的训练和部署,华为云的对象存储服务可以用于海量传感器数据的存储。

来源:行业公开信息,待核实

24.5 PHM的技术体系与挑战

24.5.1 数据采集:传感器与边缘计算

PHM的基础是数据。没有高质量的数据,就没有准确的预测。这句话看似简单,却是PHM实施中最大的挑战。

传感器技术:现代信号系统普遍配备了大量传感器,但这些传感器主要是为控制功能设计的,采样频率和精度可能不满足PHM需求。

以道岔转辙机为例:控制系统的电流采样频率通常为毫秒级,足以支持道岔位置判断;但PHM分析需要捕捉电流曲线的细微形态,需要亚毫秒级的采样频率。轨道电路的电压监测同理——控制系统每秒采样一次就足够,但PHM需要捕捉电压的瞬态波动和长期趋势。

因此,PHM系统通常需要部署专用监测传感器,与原有控制系统独立运行,避免相互干扰。

边缘计算:信号设备分布在沿线数百个车站,将所有原始数据上传到云端分析既不经济(带宽和存储成本)也不必要(实时性要求高的分析应在本地完成)。

边缘计算在站级设备(如维护工作站、工业PC)完成初步的数据处理和异常检测。具体包括:数据清洗(去除噪声和异常值)、特征提取(从原始波形中提取关键参数)、实时报警(当参数超出阈值时立即报警)。只有分析结果或特征数据上传到云端,大幅减少了网络传输压力。

24.5.2 故障预测:机器学习与物理模型

PHM的核心是预测算法,主要分为两大流派:

数据驱动方法:利用机器学习算法,从历史数据中学习设备劣化的规律。这种方法不需要深入理解设备内部的物理机理,只需要有足够的历史数据。

主要算法:

  • LSTM(长短期记忆网络):一种特殊的循环神经网络,擅长处理时序数据。在PHM中,LSTM可以捕捉设备参数的长期依赖关系——比如电机电流曲线在过去三个月的变化趋势,并预测未来一周的走向。
  • 随机森林:一种集成学习方法,由多棵决策树组成,每棵树独立进行预测,最终结果通过投票或平均得出。随机森林对异常检测有较好效果,且对噪声数据鲁棒。
  • 高斯过程回归:一种贝叶斯非参数方法,输出预测值的同时给出置信区间。在PHM中,高斯过程回归特别适合设备寿命预测——当置信区间很宽时,说明预测不确定性高,维护决策应更保守。

物理模型方法:基于设备劣化的物理机理建立数学模型。这种方法的预测结果可解释,能够直接关联到具体的物理机理。

典型模型:

  • Arrhenius方程:描述温度对化学反应速率的影响,可用于预测电机绝缘老化。电机绝缘的寿命与温度呈指数关系——温度每升高10°C,绝缘寿命大约减半。
  • Miner法则:描述金属疲劳的累积损伤规律。道岔转辙机的机械部件在反复转换过程中承受交变应力,每次转换的损伤累积,最终导致疲劳断裂。
  • Weibull分布:描述设备失效时间的统计分布,广泛用于设备可靠性分析。

混合方法:目前工业界最先进的方法是将数据驱动和物理模型结合。物理模型提供"基础预测"——基于物理机理,电机在当前温度下预计还能运行多久;数据驱动模型则"修正"这个基础预测——考虑到这台电机的实际运行数据可能与"标准"模型有偏差。这种"物理引导的机器学习"既有物理可解释性,又能适应个体差异。

24.5.3 PHM的挑战与局限

数据质量挑战:PHM的前提是有足够的高质量历史数据。但现实情况充满挑战:

数据缺失:很多老旧设备没有安装传感器,或者传感器数据没有长期保存(很多老系统的数据只保留几天就覆盖了)。能提供十年以上完整数据的信号设备凤毛麟角。没有足够的历史数据,机器学习模型无法有效训练。

标注困难:PHM模型训练需要"标签"——设备在什么时间发生了什么故障、根本原因是什么。但故障样本本身就是稀缺的(好设备不常坏),且故障原因的标注需要专业人员(不是所有工程师都了解设备内部机理),标注成本很高。半监督学习和无监督学习正在被研究用于解决标注数据不足的问题。

数据孤岛:信号系统的监测数据通常分散在不同厂商的设备中,缺乏统一的数据格式和接口标准。不同厂商的设备可能使用不同的通信协议、数据格式、采样率,数据互通性差。这是PHM大规模推广的系统性障碍。

预测准确性挑战

小样本问题:设备故障是小概率事件。以道岔转辙机为例,一台质量合格的道岔转辙机可能平均每5年才发生一次故障(MTBF约40万小时)。在PHM项目通常2-3年的实施周期内,可能收集不到足够的故障样本来训练可靠的预测模型。

误报与漏报的两难:PHM系统的报警策略需要在误报(假阳性)和漏报(假阴性)之间权衡。

  • 误报过多:会导致运维人员"报警疲劳"——收到太多报警,其中大部分是误报,最终忽视真正的问题。误报会消耗运维资源,降低PHM系统的可信度。
  • 漏报:直接违背了PHM的目的——该预测到的问题没有预测到,设备故障仍然发生。漏报会让PHM失去存在价值。

第25章:云平台ATS——把调度中心"搬上"云端

25.1 调度员老张的屏幕变迁

2019年冬天,北京地铁10号线某控制中心,调度员老张盯着面前三块大屏幕。这是他从事调度工作的第十二年,屏幕上是整条线路的列车位置、信号状态、进路排列——所有信息都汇聚在控制中心的本地服务器上。这些服务器是2008年线路开通时采购的,如今已经老化,运维厂家每个月来一次,定期更换零件,费用一年比一年高。

老张不知道的是,就在那一年,距离控制中心几十公里外的某个数据中心里,一套全新的系统正在悄悄测试。交控科技的工程师们正在把传统分布在每个车站的ATS功能,一点一点迁移到云平台上。如果测试成功,未来整条线路的ATS将不再依赖本地服务器,而是运行在一个统一的云环境中——服务器硬件成本降低,运维人员可以远程诊断,新功能上线只需要在云端更新软件,而不用跑到每个车站去施工。

这个场景,是"云ATS"从概念走向落地的缩影。

来源:交控科技技术白皮书;中国城市轨道交通协会"云平台在轨道交通信号系统中的应用"研究报告

25.2 传统ATS架构的问题

25.2.1 传统ATS的分布式架构

在说云ATS之前,有必要先理解传统ATS的架构。

传统城市轨道交通线路的ATS系统,每个车站都部署一台服务器,运行该车站的ATS应用软件——包括列车追踪、进路排列、运行图管理等功能。这些服务器通过专用网络互联,由中心ATS统一协调。控制中心通常设在线路的中段或起点,调度员在这里通过人机界面(HMI)监控和操作整个线路。

这套架构运行了二十多年,但随着线路越来越多、运营要求越来越高,问题也逐渐暴露:

硬件成本高:每站一台服务器,整条线路几十个车站,服务器采购和维护成本惊人。更重要的是,这些服务器大部分时间负载很低——夜间列车稀疏时,服务器利用率可能不到10%——但依然要全功率运行,电力消耗和设备磨损都是浪费。

运维复杂:服务器分布在沿线各站,一旦故障,运维人员必须赶到现场。城市地铁多在地下,车站之间通勤耗时;夜间作业窗口有限,有时候凌晨两三点才能进轨行区排查故障。

功能扩展难:如果要在某条线路上线新功能(比如新的运行图算法),需要逐站更新每台服务器软件,几十个车站就要几十次施工,周期长达数月。

数据孤岛:各站ATS数据分散存储,难以做跨线路、跨区域的大数据分析。调度优化、故障诊断都只能在本地数据上做,无法利用全网数据进行更高级别的智能分析。

这些问题不是某一家厂商的问题,而是分布式架构本身的天性局限。

25.2.2 云ATS的解决思路

云ATS的核心理念很简单:把原来分布在每个车站的ATS功能,集中到一个云平台上

这个云平台可以是一个私有数据中心,也可以是地铁公司自建的私有云,或者是交给专业云服务商管理的混合云。关键变化是:沿线车站不再需要独立的ATS服务器,取而代之的是轻量化的边缘网关,负责采集现场数据并上传云端;所有计算、存储、分析功能都集中在云端。

从技术架构上,云ATS通常分为三层:

IaaS层(基础设施即服务):基于OpenStack或类似私有云平台,将物理服务器虚拟化为多个虚拟机(VM)或容器,统一管理计算和存储资源。

PaaS层(平台即服务):在虚拟化资源之上,ATS功能被拆解为独立的微服务——列车追踪服务、运行图服务、进路服务、报警服务等。每个微服务独立运行、独立升级,服务之间通过API通信。

SaaS层(软件即服务):调度员的人机界面(HMI)不再依赖专用客户端软件,而是通过Web浏览器访问。调度员可以在任何有网络的终端上登录系统,不再受限于控制中心的多屏工作站。

这套架构的变化,用一个通俗的比喻:传统ATS像是每个家庭自备发电机,云ATS则像是接入统一电网——电力集中生产、统一配送,家庭不再需要自己的发电设备,按需使用、按量计费。

来源:交控科技技术白皮书;Kubernetes官方文档

25.3 云ATS三层架构

25.3.1 交控科技的"云信号"实践

交控科技是中国城市轨道交通信号领域第一家推出云ATS概念的厂商。2020年,其"云信号"产品正式发布,被视为国产信号厂商在云平台领域的重要探索。

微服务拆分:传统ATS是一个大而全的软件包,所有功能打包在一起。云信号将ATS拆分为多个独立微服务:列车追踪服务负责实时计算每列车的位置和速度;运行图服务负责管理时刻表和调整计划;进路服务负责排列和锁闭进路;报警服务负责收集和呈现各类故障告警。每个微服务独立开发、独立测试、独立部署。

容器化部署:微服务运行在Docker容器中,容器由Kubernetes编排管理。相比传统虚拟机,容器启动更快、资源开销更低、更容易横向扩展。一个容器故障不会影响其他容器,实现了故障隔离。

Web化HMI:调度员的操作界面从Windows桌面软件改为Web应用。Web应用通过HTTPS与云端服务通信,支持多终端访问(控制中心大屏、工作站、甚至Pad)。这对于移动值守、远程专家支持等场景特别有用。

来源:交控科技技术白皮书(2020年)

25.3.2 云ATS的实际优势

云ATS相比传统ATS的优势,在实际运营中可以归纳为四点:

硬件成本降低:服务器数量大幅减少,运维成本相应下降。根据交控科技的测算,云信号可将沿线服务器数量减少70%以上,硬件采购和维护费用降低50%左右。

运维效率提升:云平台的监控和管理集中化,运维人员在控制中心就能看到所有"车站"的系统状态,故障定位时间大幅缩短。远程运维在5G和宽带普及后成为可能,夜间故障不必再派人驱车赶往偏远车站。

功能迭代加速:新功能上线不再需要逐站更新软件,只需要在云端部署新版本服务实例,灰度发布逐步切换,对运营的影响降到最低。一个功能从开发到全网上线,周期可以从数月缩短到数周。

数据统一分析:云平台汇总了全线数据,可以做跨专业的综合分析。比如将信号数据与供电数据、客流数据关联分析,发现某些区段频繁出现的隐性故障模式,这在传统分散架构下是做不到的。

25.3.3 面临的技术挑战

云ATS并非没有挑战。交控科技在白皮书中坦承了几个关键技术问题:

网络延迟:云平台部署在数据中心,车站现场与云端之间的广域网(WAN)延迟必须控制在100毫秒以内,才能满足ATS实时性要求。这在运营商专网或5G专网条件下可以满足,但在公网环境下存在不确定性。

网络安全:传统ATS运行在封闭的专用网络上,与外部互联网隔离。云ATS的云端服务需要暴露部分接口给调度终端,网络攻击面扩大。网络安全防护需要从网络层、应用层、设备层多层设防,并通过等保认证。

可靠性要求:传统ATS的服务器虽然分散,但单站故障影响范围有限。云ATS一旦云平台整体故障,影响的是整条线路。私有云需要冗余部署,包括双数据中心热备、自动故障切换,恢复时间目标(RTO)需要满足运营要求。

SIL认证:这是最核心的挑战。传统信号系统的安全认证基于EN 50128/EN 50129标准,要求软件配置管理、变更控制、测试覆盖等满足严格规范。容器化部署中,微服务实例的创建、销毁、迁移更加频繁,如何在频繁变更中保持配置管理的完整性、如何在容器重启后保持安全状态,都是需要解决的新课题。EN 50129:2018框架下,云原生部署的安全认证路径仍在探索中。

来源:交控科技技术白皮书;EN 50129:2018(安全电子系统);Kubernetes官方文档

25.4 虚拟化与容器化:技术路径

25.4.1 虚拟化(Virtualization)

虚拟化是最早的云基础设施技术。其核心原理是:在单台物理服务器上,通过虚拟化软件(Hypervisor)运行多个虚拟机(VM),每个VM包含完整的操作系统和应用程序

举例来说,一台高性能物理服务器(64核CPU、256GB内存)通过VMware或KVM虚拟化软件,可以切分为4个虚拟机,每个虚拟机运行独立的Ubuntu或Windows Server操作系统,各自运行不同的应用。物理服务器的硬件资源被多个VM共享,但每个VM觉得自己运行在一台独立的物理机上。

虚拟化的优势是成熟稳定、隔离性好,一个VM崩溃不会影响其他VM。但劣势是资源开销大——每个VM都要运行一个完整操作系统,消耗大量CPU和内存;VM启动慢,通常需要几十秒到几分钟。

25.4.2 容器化(Containerization)

容器化是比虚拟化更轻量的技术。其核心原理是:多个容器共享宿主机的操作系统内核,但每个容器包含自己的应用程序和依赖库,相互隔离

相比VM,容器的优势显著:启动快(毫秒到秒级)、资源开销小(不需要模拟整个硬件和操作系统)、横向扩展容易(新建一个容器实例只需秒钟)。这些特性对于需要频繁变更、弹性伸缩的互联网应用是巨大优势。

Docker是容器化的行业标准。Docker将应用程序及其依赖打包为一个镜像(Image),镜像可以快速部署为容器(Container)。Kubernetes(简称K8s)则是容器编排平台,负责管理大量容器的部署、扩缩容、负载均衡、自愈等。

容器化在互联网行业已经全面普及,但在工业控制领域(包括铁路信号)面临一个核心问题:如何满足SIL认证要求?

EN 50128标准对软件开发过程有严格的配置管理要求:每一行代码的变更必须记录、每一次构建必须可追溯、每一个版本必须测试。容器化中,应用的部署单元是镜像,镜像由Dockerfile定义,Dockerfile的变更同样需要受控——这在技术上是可以实现的。但更大的挑战在于:容器会被调度到不同的物理节点运行,如何保证容器所在的主机操作系统、中间件、运行时库都处于配置管理的受控状态?如何在容器动态漂移(migration)时保持安全功能的连续性?这些问题的答案仍在行业讨论中。

来源:Kubernetes官方文档;EN 50128:2011

25.5 安全挑战:功能安全+信息安全

25.5.1 功能安全的挑战

传统铁路信号系统的功能安全基于EN 50128/EN 50129标准,这些标准是在单机和局域网时代制定的,对分布式、云化部署的场景考虑不足。

配置管理的复杂性:在容器化环境中,微服务实例可能会被调度到不同的物理节点,容器的创建、销毁、迁移更加频繁。如何在这种情况下保持配置管理的完整性,是一个严峻挑战。

故障隔离与安全状态:传统系统中,单台服务器故障只影响本站功能。在云ATS中,云平台的整体故障可能影响整条线路。私有云需要双数据中心热备,自动故障切换,但故障切换本身也可能引入新的风险点。

认证路径:EN 50129:2018框架下,云原生部署的安全认证路径仍在探索中。国际上已有研究项目在尝试将DevOps(开发运维一体化)与SIL认证结合,但完整的认证方法学尚未成熟。

25.5.2 信息安全的挑战

当ATS系统从封闭网络走向云端,信息安全成为与功能安全同等重要的话题。

攻击面扩大:传统ATS运行在封闭的专用网络上,外部攻击几乎不可能。云ATS需要暴露部分接口给调度终端,网络攻击面扩大。黑客可能通过调度终端的漏洞渗透到云平台,进而影响列车控制。

数据安全:云平台中存储着线路拓扑、列车位置、客流数据等敏感信息。这些数据的外泄可能造成安全隐患,需要加密存储和传输。

纵深防御:传统铁路信号的设计范式是"故障安全"——任何故障都默认导向安全停车。网络安全的设计范式是"纵深防御"——假设任何防线都可能被突破,需要多重防护机制。这种范式的融合,是未来铁路信号系统设计的重大挑战。

来源:中国城市轨道交通协会"云平台在轨道交通信号系统中的应用"研究报告(2021年)


第26章:AI赋能——机器学习能给信号系统什么

26.1 DeepMind与英国铁路的时刻表优化

2017年8月,Google旗下人工智能公司DeepMind与英国铁路(Network Rail)联合宣布:他们用深度强化学习算法优化列车时刻表,将英国铁路的延误时间减少了17%。论文发表在《Nature》杂志上,标题是"机器学习用于实时列车调度"。

这是AI在铁路领域最著名的一次成功应用。

项目的背景是这样的:英国铁路的某条主要干线(英格兰西部干线,Western Route)每天运行约1800列列车,调度员在控制中心实时处理各种延误和冲突——列车晚点、道岔故障、乘客耽误 whatever。调度员需要快速决策:是否允许列车晚点出发?是否需要调整进路?是否需要合并某些班次?这些决策直接影响后续列车的衔接,一个错误可能导致整个路网的连锁晚点。

传统做法是靠调度员的经验和规则手册。但DeepMind的团队认为,这个问题可以被建模为一个强化学习问题:列车的运行状态是"环境",调度员的每一个决策是"动作",延误时间是"奖励"。他们用深度神经网络近似"奖励函数",训练出一个能实时给出调度建议的系统。

这个系统在实验中展现出惊人的能力:它能预测某个调度决策在30分钟后对整个路网的影响,并给出最优建议。更重要的是,它能在毫秒级时间内完成计算,而人类调度员通常需要几分钟。

当然,这个案例也有局限性:它只在一条特定线路上验证,迁移到其他线路需要重新训练;它目前是辅助工具而非全自动系统,最终决策权仍在调度员手中。但它向行业展示了一个可能性:AI可以成为调度员的"超级助手",在复杂路网中找出人类难以察觉的优化空间

来源:Nature, "Optimizing train scheduling with deep reinforcement learning"(2017年,DeepMind团队)

26.2 AI在铁路信号领域的三个方向

AI在铁路信号领域的应用,目前主要集中在三个方向:时刻表优化、视觉检测、故障根因分析。这三个方向分别对应AI的三大能力:优化推理、模式识别、因果推断。

26.2.1 时刻表优化

时刻表(Timetable)是地铁运营的核心文件——规定每列列车何时从某站出发、何时到达下一站、在各站的停站时间是多少。时刻表的质量直接影响运营效率:发车间隔短,运力足但能耗高;发车间隔长,能耗低但乘客等待时间长。

传统的时刻表编制是运筹学问题,通常用混合整数规划(MIP)求解。工程师输入线路参数(站间距、列车速度、加速度)、客流数据(各站上下车人数)、约束条件(最小追踪间隔、最小停站时间),算法输出最优时刻表。这个过程通常需要数天甚至数周。

AI的介入,是将时刻表优化从"一次性离线求解"变为"实时在线调整"。

深度强化学习是主要方法之一。以"正点率"和"能耗"为双目标奖励函数,训练神经网络输出最优发车间隔和停站时间。训练过程中,神经网络不断试错,逐步学会在各种客流场景下给出最优决策。这种方法的优势是:神经网络的推理速度极快,可以在毫秒内给出建议;而且能处理传统MIP难以建模的随机性(如突发大客流、临时故障)。

遗传算法是另一种经典方法。模拟生物进化的"选择-交叉-变异"过程,在解空间(所有可能的时刻表配置)中逐步淘汰差的解、保留好的解,最终收敛到近似最优解。遗传算法的优点是不需要梯度信息,适合离散优化问题;缺点是收敛速度慢,通常需要数千次迭代。

日本JR东日本铁路公司在时刻表优化领域有成熟实践。他们开发了AI实时调度系统,能在列车延误后自动重新计算后续列车的发车时机,减少延误传播。2020年东京奥运会期间,这套系统成功应对了超大客流的挑战。

来源:Nature(DeepMind论文,2017年);JR东日本公司技术报告;IEEE Transactions on Intelligent Transportation Systems

26.2.2 视觉检测:道岔状态自动识别

铁路系统有大量需要"看"的场景:道岔尖轨位置对不对?接触网吊弦有没有断丝?轨道上有没有异物?这些以前靠人工巡检,现在可以用摄像头+AI视觉算法自动完成。

道岔状态视觉检测是典型应用。道岔是铁路的关键设备,列车通过前必须确认尖轨已经密贴。如果道岔没有到位就放列车,轻则挤岔,重则脱轨。传统检测靠人工扳道确认或者道岔缺口监测。视觉检测的方案是:在道岔区域安装高清摄像头,拍摄尖轨位置图像,AI算法识别图像中的尖轨边缘,计算尖轨与基本轨的间隙,判断是否密贴。

接触网检测是另一个成熟应用。接触网(架空接触网)为列车提供电力,吊弦断丝、定位器脱落、绝缘子脏污等问题都需要及时发现。综合检测车在铁轨上行驶,车顶的摄像头和传感器对接触网进行扫描,AI算法自动识别缺陷并标注位置。这项工作以前靠人工逐杆检查,效率极低;现在用AI可以将检测效率提升数十倍。

轨道异物检测在地铁站台有重要应用。地铁站台屏蔽门与列车门之间如果落入异物,列车关门时可能夹住异物或人员。视觉方案是在站台安装摄像头,AI实时分析视频画面,检测是否有异物侵入列车限界,发现后立即报警。

视觉检测的技术基础是深度学习(Deep Learning)。卷积神经网络(CNN)在图像分类、目标检测、语义分割等任务上已经超越人类。训练数据通常来自大量现场图像,由人工标注缺陷位置和类别,神经网络学习从图像到缺陷的映射关系。数据标注的质量和数量,是决定AI检测效果的关键因素。

来源:IEEE Transactions on Intelligent Transportation Systems(计算机视觉在铁路检测中的应用论文);中国城市轨道交通行业技术报告

26.2.3 故障根因分析:AI比"老法师"更准吗

信号系统发生故障时,快速定位根因是恢复运营的关键。传统做法是:维护人员查看故障日志,根据经验和电路图逐级排查。这个过程可能耗时数小时,期间列车只能降级运营。

AI故障根因分析的思路是:建立故障现象与故障原因之间的知识图谱或统计模型,当新故障发生时,AI自动分析日志,推断最可能的根因,给出修复建议。

知识图谱方法是其中的代表。将历史上所有故障记录建库,包括:故障现象(如"某站ATS显示红光带")、故障设备(如"2号道岔转辙机")、维修记录(如"更换了转辙机电机")、根因分析(如"电机碳刷磨损导致接触不良")。当新故障发生时,AI搜索知识图谱,找到相似案例,推荐根因和修复步骤。

深度学习方法则用历史故障数据训练分类器。输入是故障日志的文本或时序数据,输出是根因类别(如"轨道电路分路不良"、"无线干扰"、"电源故障")。这种方法需要大量标注数据,且只能处理训练集中出现过的故障类型,对于新型未知故障效果有限。

因果推理是更前沿的方向。传统AI擅长发现相关性("A故障经常和B故障一起出现"),但难以推理因果性("A故障导致了B故障")。因果推理方法试图从数据中学习因果结构,从而更准确地定位真正的根因。这方面的研究在学术期刊上已有不少成果,但工业落地案例仍然较少。

需要指出的是,故障根因分析是AI+铁路信号领域最具挑战性的方向之一。原因是:铁路信号系统的故障样本本身就很少(MTBF以万小时计),高质量标注数据难以获取;故障的因果链复杂,且经常涉及硬件和软件的交互;系统的安全属性要求AI的判断必须有可解释性,不能给出"黑箱"式的结论。这些挑战决定了故障根因分析在短期内仍将处于研究和试点阶段。

来源:Nature Scientific Reports, "AI for railway fault diagnosis";Science China Technological Sciences相关论文

26.3 AI赋能的技术基础

26.3.1 深度学习、强化学习、知识图谱

支撑上述三类应用的AI技术,核心是三个方向:深度学习、强化学习、知识图谱

深度学习(Deep Learning)是当前AI领域最成熟的技术。其核心是多层神经网络(Deep Neural Network),通过大量数据训练自动学习特征表示。

在铁路信号领域的应用包括:

  • 图像识别:道岔状态检测、接触网检测、站台异物检测
  • 时序分析:轨道电路电压曲线分析、道岔电流曲线分析
  • 文本处理:故障日志分析、维修报告分类

深度学习的效果高度依赖数据质量和数量。铁路领域的高质量标注数据获取成本高,这限制了深度学习在铁路信号领域的推广速度。

强化学习(Reinforcement Learning)是"让AI通过试错学会决策"的方法。智能体(Agent)在环境中采取行动,获得奖励或惩罚,逐步学会最优策略。

在铁路信号领域的应用包括:

  • 时刻表优化:以正点率和能耗为奖励,训练时刻表生成策略
  • 列车调度:实时调整列车发车时机和进路排列
  • 节能驾驶:在保证正点的前提下优化牵引制动曲线

强化学习的关键挑战是安全性。AI在训练过程中会探索各种行为,有些行为可能是危险的(如闯信号、超速)。在铁路这种安全关键系统中,必须对AI的探索空间进行严格约束,确保AI永远不会给出违反安全规则的建议。

知识图谱(Knowledge Graph)是将知识结构化为"实体-关系-实体"的三元组。例如:(道岔,转辙机故障,碳刷磨损)是一个三元组,表示"道岔因碳刷磨损导致转辙机故障"。

知识图谱的优势是可解释性:AI的推理过程可以追溯到具体的知识条目,而不是黑箱输出。这对于安全关键系统至关重要——当AI给出故障根因建议时,工程师需要知道背后的逻辑依据。

知识图谱的构建和维护成本较高,需要领域专家的参与。在铁路信号领域,积累了几十年的故障案例和维修经验,是宝贵的知识来源,但将这些隐性知识转化为结构化知识图谱,需要大量的人工投入。

来源:深度学习相关教材;强化学习基础(Richard Sutton, "Reinforcement Learning: An Introduction");知识图谱技术综述(IEEE Access)

26.4 AI的局限:当AI出错,谁来负责

26.4.1 当前AI应用的核心瓶颈

尽管AI在铁路信号领域展示了潜力,但必须清醒认识到:目前大多数应用仍停留在试点和研究阶段,离大规模工业落地有相当距离。

数据问题是最大的瓶颈。铁路信号系统的故障率低、样本少,高质量标注数据获取困难。以道岔故障为例:某型号道岔的转辙机可能一年才出一次故障,要积累足够训练的样本需要数年时间。而深度学习需要海量数据,这在铁路领域是结构性矛盾。

可解释性要求与AI黑箱特性存在冲突。铁路信号系统属于安全关键系统,当AI给出建议时,工程师和监管机构需要理解AI为什么给出这个建议。但深度神经网络本质上是黑箱——没有人能解释某个特定输出是如何从数亿个参数中推导出来的。这种不可解释性,在SIL认证框架下是一个巨大的挑战。

误报和漏报的风险难以接受。AI视觉检测系统在实验室环境下准确率可能达到95%,但5%的误报意味着每检测20个缺陷就有一个是假的。在实际运营中,大量误报会导致运维人员对系统失去信任;而漏报则可能导致真正的缺陷被忽视,后果更为严重。

标准规范滞后。EN 50128等传统铁路软件安全标准诞生于AI大规模应用之前,标准中对"机器学习组件"没有明确的认证路径。欧标和国标目前都在修订中,尝试为AI组件在信号系统中的应用建立框架,但标准制定的速度赶不上技术发展的速度。

来源:EN 50128:2011;IEEE Spectrum, "AI in Safety-Critical Systems"(相关讨论)

26.4.2 责任归属:当AI出错谁来负责

当AI在铁路信号系统中做出错误决策并导致事故时,责任归属是一个法律和制度层面的问题,目前没有明确答案。

一个可能的方向是:责任归位于运营主体。无论AI参与程度多高,铁路运营公司对列车安全运行负有最终责任。AI系统是运营公司采用的工具,运营公司需要确保工具的正确使用和有效监督。

另一个方向是:明确AI决策的适用范围。在不同自动化级别下,明确AI可以参与哪些决策,不能参与哪些决策。比如AI可以辅助优化时刻表,但不能直接控制列车运行;AI可以提供故障根因建议,但最终诊断结论需要工程师确认。

来源:国家铁路局技术政策文件(2023年);中国城市轨道交通协会AI应用研究报告(2023年)


第27章:数字孪生——在虚拟世界里开一万列火车

27.1 新线仿真:不用上路就能测试

2019年冬天,北京地铁10号线通信信号系统改造项目进入关键阶段。这条每天运送170万人次、号称北京最繁忙的环线,任何信号系统的改动都必须慎之又慎。改造内容包括更换车载ATP软件——如果新软件有bug直接上线,轻则列车晚点,重则事故发生。

传统的测试方式是"滞后上线":在新线夜里停运的几小时窗口内,让列车在真实线路上跑几圈,工程师在旁边盯着。这种测试效率极低——每晚最多测试三四个小时,而且只能覆盖有限的场景。更要命的是,有些故障是低概率事件,可能跑几十个夜晚才触发一次。

交控科技的工程师团队决定换一种思路。他们搭建了一套离线仿真平台,将10号线的真实CBTC系统运行数据——列车位置、速度、信号状态——实时同步到仿真平台中。仿真平台里运行的,是与真实系统几乎一模一样的"数字克隆体"。工程师可以在这个数字镜像上注入各种故障场景,测试新版本ATP软件的响应,而不会影响任何一列正在运营的真实列车。

测试结果令团队印象深刻:在仿真平台连续运行一个月后,新软件暴露出了七个在实车测试中从未发现的边缘场景bug。这七个bug如果漏到真实环境里,按照10号线的客流量估算,每次故障可能导致3000到5000名乘客延误30分钟以上。

这个案例解释了什么叫做数字孪生(Digital Twin)——物理世界里的铁路信号系统,在数字空间里有一个精确到几乎一模一样的"克隆体"。真实系统在运营,仿真系统在测试;真实系统里的故障还没发生,仿真系统里已经推演过无数遍。

数字孪生并不是一个新概念。NASA在1960年代阿波罗计划中就使用物理模型来模拟飞行器状态,算是数字孪生的雏形。工业界真正大规模应用数字孪生,是在2010年代云计算和物联网技术成熟之后。对于铁路信号系统而言,数字孪生的核心价值在于:在虚拟世界里做实验,成本远低于在真实线路上做实验

来源:交控科技技术白皮书;中国城市轨道交通协会"云平台在轨道交通信号系统中的应用"研究报告;IEEE 1474.3-2004(CBTC测试推荐规范)

27.2 列车运行图仿真:数字孪生的基础应用

列车运行图仿真(Train Operation Simulation)是数字孪生在铁路信号领域最基础、也最成熟的应用。在一条新线开通前,或者在既有线进行重大软件升级前,工程师需要回答一个根本问题:按照设计的时刻表,列车真的能跑出来吗?

这个问题看似简单,实际上涉及非常复杂的系统工程。列车的加减速性能是物理约束——牵引电机有多大力、制动系统能提供多大的减速度、列车重量是多少,这些决定了列车在每个坡度段、每个弯道能跑多快。信号系统的追踪间隔是另一个约束——后续列车必须与前车保持最小安全距离,这个距离由ATP逻辑决定,而不是司机想停就能停。供电能力也是约束——同一供电区段内不能同时有太多列车加速,否则电压会跌落。

仿真软件把这些物理约束全部量化建模,然后用计算机模拟列车在线路上行驶的全过程。国际上主要的仿真软件包括西门子旗下的Numetrics(全球应用最广的城市轨道交通仿真工具)、德国铁路使用的Ramsys,以及各信号厂商自己开发的仿真平台。

仿真系统的输入数据包括三类:

第一类是线路参数——坡度数据(每段线路的坡度值,以千分比表示)、曲率数据(每段弯道的曲线半径)、曲线超高(弯道处外轨高于内轨的高度)。这些数据决定了列车通过时的限速和能耗。

第二类是列车参数——列车长度、重量、牵引电机功率、制动率、常用制动和紧急制动的减速度差异。这些参数决定了列车的动力学特性。

第三类是时刻表参数——各站的发车时间、到达时间、停站时间,以及列车在折返站的折返作业时间。

仿真系统将这些输入数据送入列车动力学模型和信号系统模型,然后"跑"出列车在全线的速度-距离曲线、运行时间、追踪间隔。工程师根据仿真结果判断:设计的时刻表是否可行?如果不可行,是哪个区间的追踪间隔太短、哪个站的停站时间不够?调整哪个参数可以优化?

验证内容主要有三项:

时刻表可行性——仿真系统会检查每列车在每个区间的运行时间,是否超出了时刻表分配的运行时分。如果某列车在某个区间的仿真运行时间超过了时刻表规定的时间,说明时刻表本身不可行,需要调整发车间隔或停站时间。

追踪间隔验证——CBTC系统的移动闭塞基于列车位置报告,追踪间隔的极限取决于列车定位精度、通信延迟和制动距离。仿真系统会输出每对相邻列车之间的最小追踪间隔,检查是否满足设计要求(通常为120秒、90秒或更短)。

信号逻辑验证——仿真系统会模拟信号系统的敌对进路检查逻辑。例如,当排列某条进路时,系统是否正确锁闭了与该进路冲突的其他进路?道岔位置错误时,信号机是否正确显示停车?

北京、广州、上海等城市的轨道交通仿真实验室已经建立了相当完整的数字孪生系统。广州地铁的仿真实验室可以同时仿真12条线路的运行图交互影响,这在真实线路上几乎不可能测试。

来源:IEEE 1474.3-2004(CBTC测试推荐规范);城市轨道仿真实验室技术资料;西门子Numetrics产品技术文档

27.3 离线仿真平台:软件升级的安全阀

27.3.1 离线仿真平台的核心架构

离线仿真平台(Offline Simulation Platform)是数字孪生概念在铁路信号领域最直接的技术实现。与单纯的列车运行图仿真不同,离线仿真平台的"孪生"程度更深——它不仅仅是模拟列车怎么跑,而是将真实CBTC系统的运行状态完整地复制到仿真环境中。

核心架构包括三个层次:

数据采集层:从真实CBTC系统的ATS、ATP、车载设备中实时采集数据。采集内容包括每列车的当前位置和速度、信号机的显示状态、道岔的位置、轨道电路的占用状态。这些数据通过接口服务器输出到仿真平台,保持与真实系统的实时同步。

仿真引擎层:仿真平台接收到真实系统的运行数据后,在虚拟环境中重构整个线路的信号系统状态。仿真引擎包括列车动力学模型、ATP逻辑模型、ATO自动驾驶模型、联锁逻辑模型。仿真引擎可以注入故障或加载新版本软件,进行各种测试。

人机交互层:仿真平台提供图形化界面,让工程师可以观察仿真环境中的列车运行状态、信号状态,也可以手动注入故障(如道岔失表、轨道电路红光带、车地通信中断),观察系统的响应。

27.3.2 三类典型应用

第一,软件升级测试。 信号系统的ATP、ATO、ATS软件升级,在上线前必须在仿真环境中充分验证。传统方式是利用夜间停运窗口进行实车测试,但窗口时间有限(通常只有3-4小时),测试场景覆盖不足。离线仿真平台可以24小时不间断运行,新版本软件在仿真环境中连续运行数周,暴露所有潜在bug。国内主要信号厂商(交控科技、众合科技等)都有专门的仿真测试团队,利用仿真平台进行新版本软件的验证测试。

第二,故障复现与分析。 当真实线路发生信号故障后,工程师通常面临"故障已发生、现场已恢复、原因不明"的情况。离线仿真平台的价值在于:它可以将故障发生时的列车位置、信号状态等数据重新导入仿真环境,重现故障发生的完整过程,帮助工程师分析根因。这种"黑匣子回放"功能,是真实线路测试完全无法提供的。

第三,调度员培训。 调度员的培训一直是铁路运营的难题——不可能为了培训就让列车真的晚点。离线仿真平台可以模拟各种运营场景,包括正常运营、早高峰客流拥挤、设备故障、信号系统瘫痪、恶劣天气影响等。调度员在仿真环境中处理这些"虚拟危机",积累经验,而不影响任何真实列车。深圳地铁、成都地铁等已经建立了调度员仿真培训系统。

值得注意的是,离线仿真平台在技术上存在一个关键挑战:实时性要求。仿真平台需要与真实系统保持"准同步"——仿真环境中的时间推进速度必须与真实时间匹配,否则无法真实反映系统的动态特性。这要求仿真引擎的计算延迟必须在毫秒级,对硬件性能有较高要求。

来源:交控科技、众合科技等厂商的仿真测试系统介绍;IEEE 1474.3-2004

27.4 数字孪生与PHM的结合

数字孪生技术在铁路信号领域的另一个重要应用方向,是与PHM(故障预测与健康管理)技术的结合。传统运维是"故障发生后去修",PHM是"预测什么时候会坏,提前更换部件",而数字孪生则为PHM提供了一个更精确的预测基础。

这个逻辑链条是这样的:数字孪生系统积累了信号设备在全生命周期内的运行数据——道岔转辙机的动作次数和电流曲线、轨道电路的输出电压漂移趋势、车载ATP的处理器温度变化。这些数据结合设备劣化模型,可以在数字孪生中模拟设备"还能跑多久",从而在故障发生前安排预防性维护。

西门子在其Predix工业互联网平台中,已经将数字孪生与PHM结合,用于道岔转辙机的健康管理。道岔转辙机的寿命通常以"动作次数"衡量,西门子的数字孪生系统记录每一次道岔转换的电流曲线,并与设计基准曲线对比,当实测曲线出现明显偏移时,系统会预警"转辙机电机可能即将劣化"。这项技术已在德国铁路(DB)有实际部署案例。

阿尔斯通的HealthHub平台则更进一步——它不仅监测道岔,还整合了列车动力学模型和线路数据,预测列车在不同区间的制动性能变化,从而提前调整ATP的防护曲线。这种"基于数字孪生的预测性维护",将传统的定期维护升级为"按需维护"。

来源:西门子Predix/Xcelerator平台技术文档;阿尔斯通HealthHub白皮书;IEEE Transactions on Reliability, "Prognostics for Railway Signalling"

27.5 行业视角:数字孪生的局限与挑战

数字孪生并非万能。它的局限性主要体现在三个方面:

第一,模型精度决定孪生质量。 数字孪生是"模型驱动的镜像"——如果模型本身有偏差,仿真结果就会失真。列车动力学模型的精度取决于输入参数(列车重量、制动率等)的准确性;信号系统模型的精度取决于对ATP/ATO逻辑的理解程度。在实际工程中,建立一个与真实系统高度一致的数字孪生体,本身就需要大量的调试和验证工作。

第二,安全认证的难题。 数字孪生系统本身是否需要SIL认证?当工程师基于仿真平台的测试结果决定新软件是否上线,这个决策过程是否需要认证?EN 50128对软件测试有明确的覆盖率要求,但数字孪生环境下的测试是否满足这些要求,目前在标准层面仍有争议。这是数字孪生技术在铁路信号领域推广面临的一个监管难题。

第三,建设成本高。 建立完整的数字孪生系统需要投入大量的人力和资金。线路参数测量、列车参数标定、仿真平台开发、运维人员培训,每一项都需要专业能力和时间积累。目前国内只有少数几条线路建立了完整的数字孪生系统,大多数既有线路还没有条件实施。

尽管如此,数字孪生仍然是铁路信号系统未来发展的主流方向之一。随着云计算成本下降、仿真软件成熟,以及行业对运营安全要求的持续提高,数字孪生将从"高端配置"逐步变成"标准配置"。

来源:EN 50128:2011(软件安全);Kubernetes官方文档关于容器化部署的讨论(与信号系统云化相关)


第28章:北斗替代应答器——卫星定位的极限与可能

28.1 应答器为什么那么贵

如果你坐过地铁,可能会注意到列车行驶时地板上偶尔会闪过一道微弱的蓝光——那就是应答器(Balise)。地铁线路沿线每500米左右就有一个应答器,像钉子一样嵌在轨道中间。列车经过时,车载天线向应答器发送电磁能量,应答器被激活,立即向列车回传一串报文。报文内容包括线路坡度、限速值、定位基准等关键信息——没有这些信息,CBTC系统的列车定位精度会逐渐漂移,最终无法保证安全。

应答器是CBTC系统的"定位校准点",每500米一个,每换一个多少钱?根据行业公开信息,进口应答器单价在3000到8000元人民币之间,国产化后价格有所下降,但仍不便宜。一条20公里的地铁线路,应答器数量约40个,光应答器本身的设备费用就是一笔可观的数字——更别说每次更换都需要申请施工点、封锁线路、测试验证的运营成本。

如果能用卫星定位替代应答器,理论上可以让列车自己知道自己在哪里,不需要地面安装大量昂贵的设备。GPS定位已经是成熟技术,智能手机都能做到米级精度。但问题在于:铁路信号的精度要求与手机导航完全不同。CBTC系统的列车定位精度要求是±5米,而GPS民用定位精度通常也是5到10米——看起来差不多,但这是理想条件下的数据。在隧道里、在高架下方、在高楼林立的城区,GPS信号会严重衰减甚至完全丢失,根本无法满足铁路信号的可用性要求。

中国自主研发的北斗三号(BDS-3)系统,定位精度与GPS相当,也在面临同样的挑战。不过,北斗系统有一个GPS没有的优势——中国境内可以建设地基增强系统(GBAS),通过地面基准站校正卫星信号的误差,将精度提升到亚米级。

那么,北斗替代应答器,距离实用还有多远?这就是本章要回答的问题。

来源:应答器价格——行业公开信息,待核实;CBTC定位精度要求——IEEE 1474.1-2004;北斗系统定位精度——中国卫星导航系统管理办公室北斗白皮书

28.2 GPS民用精度与CBTC要求

28.2.1 卫星定位的误差源

要理解卫星定位为什么难以直接替代应答器,首先要理解GPS民用精度的实际水平。

GPS卫星信号到达地面时,会受到多种误差源的影响:电离层延迟(信号穿过大气层时速度变慢)、对流层延迟、多径效应(信号被建筑物或地面反射后产生叠加)、卫星轨道误差、时钟误差等。在开阔天空下(四周无遮挡),这些误差可以通过差分技术部分消除,民用GPS的定位精度约为5到10米(CEP,即50%的测量值落在以真实位置为圆心的5到10米圆内)。

这个精度对于手机导航是够用的——你不会因为导航显示你在路的左侧3米还是右侧3米而迷路。但对于CBTC系统,5到10米的精度意味着:列车不知道自己具体在哪个位置。CBTC的移动闭塞依赖于精确的列车位置报告——后续列车需要根据前车的精确位置计算安全追踪距离,如果定位误差达到10米,系统必须预留10米的安全余量,导致追踪间隔被迫拉长,线路运力下降。

28.2.2 RTK与厘米级精度

RTK(实时动态定位,Real-Time Kinematic) 技术可以将GPS精度提升到厘米级。RTK的原理是:地面建设若干基准站,基准站的精确坐标已知,实时比较自己接收到的GPS信号与理论值的差异,将误差校正量发送给移动站(列车)。通过差分消除共同误差,RTK可以达到2到3厘米的定位精度——完全满足CBTC的要求。

但RTK有一个致命问题:需要密集的基准站网络。RTK的有效工作范围通常只有10到20公里(取决于基线距离和大气条件),超出这个范围就需要新建基准站。一条100公里的地铁线路,如果全程需要RTK覆盖,需要每隔15公里左右建设一个基准站,加上通信链路和数据处理系统,成本相当可观。更为关键的是,RTK对可见卫星数量有要求——在卫星信号被遮挡的隧道内,RTK完全失效。

北斗三号(BDS-3) 的定位精度与GPS相当,民用单点定位精度约5到10米。但北斗系统在中国境内有地基增强网的支持,通过GBAS(地基增强系统)校正,精度可提升至亚米级(优于1米)。这比纯GPS有优势,但仍然达不到RTK的厘米级精度。

来源:中国卫星导航系统管理办公室北斗白皮书;IEEE 1474.1-2004 Annex C;EN 50617-1:2015(列车定位标准)

28.3 场景分析:卫星定位的极限

卫星定位在铁路信号中的适用性,取决于线路的具体场景。以下是行业公开信息对各场景的适用性分析:

开阔地面的地面线路:这是卫星定位表现最好的场景。四周无遮挡,卫星信号质量最佳,定位精度可达5到10米,基本满足CBTC的±5米定位精度要求(严格来说还有差距,但可通过算法补偿)。在这种场景下,卫星定位可以作为应答器的补充,减少应答器的布设密度——比如原来每500米一个应答器,可以改为每1000米一个,用卫星定位填补中间的空隙。

隧道内:这是卫星定位最大的盲区。隧道内完全收不到GPS/北斗信号,卫星定位完全不可用。在这种场景下,必须依靠其他定位手段——轨道电路、计轴器、或者惯性导航系统(INS)。这也是卫星定位无法完全替代应答器的根本原因之一:隧道内的定位校准仍然需要地面设备。

高架区段:城市轨道交通中有大量高架线路。高架区段的问题在于:列车在桥上行驶时,车载接收机可能同时接收到来自桥下建筑物反射的多径信号(多径效应),导致定位精度严重下降至10到30米,完全无法满足CBTC要求。此外,高架两侧的高压电线、变电站也可能对卫星信号产生干扰。

密集城区:这是卫星定位的另一个软肋。城市轨道交通的地下线路贯穿市中心,高楼林立,卫星信号被严重遮挡,可用卫星数量不足,多径效应加剧。北斗和GPS在密集城区的定位精度通常只有10到20米,且稳定性差,同一位置连续两次测量的结果可能相差十几米。这种精度连手机导航都难以满足,更别说铁路信号。

场景适用性汇总

场景卫星定位精度是否满足CBTC要求(±5m)
开阔地面线路5-10m基本满足(需辅助算法)
隧道内不可用不满足
高架区段10-30m(多径干扰)不满足
密集城区10-20m(多径+遮挡)不满足

结论:卫星定位目前无法完全替代应答器,但可以作为应答器在特定场景(开阔地面)下的补充手段。完全替代的技术方案需要等待卫星定位技术本身取得突破,或者找到更可靠的低成本补充方案。

来源:中国卫星导航系统管理办公室北斗白皮书;IEEE 1474.1-2004 Annex C;行业公开信息,待核实

28.4 组合导航:卫星+惯性+应答器

28.4.1 惯性导航(INS):隧道里的"盲人导航术"

既然卫星定位在隧道内不可用,那就需要一种不依赖外部信号的定位技术——这就是惯性导航系统(INS,Inertial Navigation System)。

惯性导航的原理,可以用一个比喻来理解:你被蒙上眼睛放在车里,告诉你车的初始位置、初始朝向、初始速度,然后你凭感觉感知车加减速和转向——加速时你能感觉到背部的压力,转向时你能感觉到身体的侧倾。积分这些加速度和角速度,你就能推算出一段时间后车的大致位置和朝向。

惯性导航的核心器件是惯性测量单元(IMU,Inertial Measurement Unit),包括三个加速度计和三个陀螺仪。加速度计测量三个方向的加速度,陀螺仪测量三个方向的角速度。将加速度积分两次得到位置变化,将角速度积分得到姿态角度。

惯性导航的优势是自主性强——不依赖外部信号,在隧道内、地下、水下任何环境中都能工作。短期的定位精度相当高——高品质的惯性导航系统(如光纤陀螺仪IMU),在GPS信号中断后的定位误差累积速度约为行驶距离的0.1%,即行驶1公里后误差约1米,对于短距离隧道完全没有问题。

但惯性导航有一个根本性弱点:长期漂移。陀螺仪存在零偏漂移,加速度计存在偏置误差,这些微小的误差在积分过程中会不断累积。行驶距离越远,定位误差越大。一套低成本MEMS IMU在GPS信号中断60秒后,定位误差可能达到几十米——这对CBTC系统来说是不可接受的。

因此,惯性导航不能单独使用,必须与卫星定位或应答器定期校准。组合导航的逻辑是:卫星定位或应答器提供绝对位置基准,惯性导航提供连续的位置更新,两者融合——当有卫星信号或经过应答器时,用绝对位置校正惯性导航的漂移;当信号中断时,用惯性导航的推算结果填补空白。

地铁列车定位系统的典型架构是:卫星定位(开阔段)+ 惯性导航(全程)+ 应答器校准(特定点)。卫星定位在有信号的地方提供绝对位置,惯性导航在所有环境下提供连续位置更新,应答器在关键校准点(如站台入口、限速变化点)纠正累积误差。

来源:惯性导航原理教材;EN 50617-1:2015(列车定位标准)

28.4.2 多传感器融合:组合定位的现实路径

基于上述分析,卫星定位完全替代应答器的条件目前尚不成熟:隧道内无法使用、高架和密集城区精度不足、RTK成本过高。但卫星定位作为应答器的补充是完全可行的——在开阔的地面段减少应答器密度,用卫星定位填补中间的空隙,可以显著降低定位系统的整体成本。

然而,即使是在开阔地面段,纯卫星定位的5到10米精度与CBTC要求的±5米精度之间仍有差距。这个差距需要通过组合定位算法来弥补。

主流的组合定位方案包括:

多传感器融合:将卫星定位、惯性导航、测速仪(安装在车轮上的速度传感器,测量列车实时速度)、轨道电路占用信息等多种来源的数据融合,用卡尔曼滤波等算法输出最优位置估计。多传感器融合的核心思想是:每种传感器都有误差,但不同传感器的误差特性不同——惯性导航短期精度高但长期漂移,卫星定位没有漂移但有随机噪声,测速仪的误差与轮径磨损相关。将这些信息按统计最优的方式加权融合,可以得到比任何单一传感器都更准确的结果。

地图匹配:铁路线路是固定的,列车只能沿着轨道行驶。将卫星定位的结果与电子地图匹配,可以剔除明显不合理的位置(如列车"飞"到建筑物的屋顶上)。地图匹配还能利用轨道拓扑信息——道岔位置、站台位置都是已知的,当列车经过这些特征点时,可以用这些"路标"来校正位置。

RTK+PPP组合:在地基增强系统覆盖的区域,使用RTK技术获得厘米级精度;在地基增强信号中断时,切换到PPP(精密单点定位)模式维持亚米级精度。这种无缝切换的技术目前在高铁上有较多研究,但城市轨道交通受限于城区环境,RTK基站密度不足,仍有挑战。

来源:3GPP TS 22.289(下一代列车通信);Shift2Rail/X2Rail项目最终报告(2020年);EN 50617-1:2015

28.5 北斗在中国:自主可控的优势

28.5.1 北斗系统的独特优势

北斗系统相比GPS,在铁路信号应用中有两个独特优势:

第一,中国境内地基增强网的支持。 北斗系统在中国境内有覆盖较完善的地基增强网(GBAS),通过全国范围内的基准站网络提供误差校正服务,可将定位精度提升至亚米级。这是纯GPS难以实现的——GPS的地基增强网在中国境内的覆盖远不如北斗。

第二,自主可控。 使用北斗意味着定位系统的核心技术自主可控,不依赖外国卫星系统。对于铁路信号这种安全关键系统,自主性有特殊的战略意义——如果定位系统依赖GPS,万一出现信号关闭或干扰(中国在非常时期可能面临的场景),整个CBTC系统将陷入瘫痪。北斗的民用信号是开放的,不收费,且不存在被关闭的风险。

但北斗也面临与GPS相同的根本性问题:隧道内不可用、密集城区精度不足。此外,北斗的高精度服务目前主要面向开阔场景,在复杂电磁环境(如牵引供电系统的高频干扰)下的性能数据仍不充分,需要更多实地测试验证。

值得关注的是,北斗三代(BDS-3) 在亚太地区的定位性能已经与GPS相当,部分地区甚至更优。这为中国城市轨道交通的卫星定位应用提供了技术基础。中国通号、交控科技等国内信号厂商已经开始研发基于北斗的列车定位系统,部分项目在2020年代初期进入了试验段测试阶段。

来源:中国卫星导航系统管理办公室北斗白皮书(2020年);中国通号技术白皮书

28.5.2 欧盟X2Rail的启示

欧盟的Shift2Rail项目专门设立了X2Rail子项目,研究卫星定位替代应答器的技术路线。X2Rail的结论是:卫星定位技术已经足够成熟,但完全替代应答器仍需解决隧道和高精度两个核心问题。X2Rail建议的过渡方案是"应答器密度降低+卫星定位补充",而非直接替代。

来源:Shift2Rail/X2Rail项目最终报告(2020年)

28.6 展望:应答器会消失吗

从技术发展的角度,应答器作为CBTC系统的定位校准基础,其地位在短期内不会被动摇。但从成本优化的角度,应答器的布设密度存在降低空间——如果卫星定位和惯性导航的组合定位精度足够高,可以在保证安全的前提下减少应答器数量。

一个可能的技术演进路径是:应答器从"每500米一个"逐步变为"每1-2公里一个",卫星定位负责中间段的定位。在这种模式下,列车在经过应答器时进行精确校准,在两个应答器之间依靠卫星定位和惯性导航的组合推算。随着卫星定位精度的提升和组合导航算法的进步,应答器的密度可能会进一步降低。

但完全取消应答器,需要满足一个前提:卫星定位或替代技术的精度和可用性,在全线所有场景下都满足CBTC要求。这在目前的技術条件下还做不到——隧道内仍然是卫星定位的死角,惯性导航的长期漂移无法完全消除。

另一个值得关注的方向是5G URLLC(超可靠低延迟通信)在列车定位中的应用。5G URLLC的目标延迟小于1毫秒,可靠性大于99.999%,未来可能支持一种新的定位模式:列车通过5G基站知道自己与周边列车的相对距离,从而实现更精确的协同定位。这种技术目前仍在标准完善阶段,预计2025到2030年在铁路领域开始试点。

来源:3GPP Release 14/15/16 LTE-M规范;中国移动5G技术白皮书;IEEE 1474.1-2004


第29章:从手信号到智慧大脑——150年的主线

29.1 技术替代人的四个阶段

当我们把视线从具体的信号机、轨道电路和联锁系统中抽离出来,站在历史的高处俯瞰1825年至今的铁路信号史,会发现一条清晰得近乎残酷的主旋律:人是不可靠的,技术一直在试图替代人

这不是对人的贬低,而是对物理世界的诚实。人的注意力会疲劳,判断力会受情绪影响,反应速度有生理极限,而列车重量大、制动距离长、惯性不可抗拒——一旦人犯错,代价是灾难性的。铁路信号的一切技术演进,从旗语到轨道电路,从臂板信号机到色灯信号机,从机械联锁到计算机联锁,从ATP到CBTC,都是在回答同一个问题:如何把人的不确定性从安全关键环节中剔除

1825年的达灵顿铁路,列车碰撞的风险完全押在调度员的旗语和司机的眼睛上。一个调度员分心三十秒,一列列车就可能驶入已有列车占用的区间。1841年切斯菲尔德事故,两条生命换来了一个认知:仅靠人的纪律和注意力,不足以保障铁路安全。这才催生了臂板信号机的推广——把"通行/停车"的决定权从调度员转移到了机械装置。

第一阶段:机械替代。臂板信号机把"通行/停车"的决定权从调度员转移到了机械装置。但机械臂板仍然依赖司机看见信号后自己执行。司机在高速行驶中看见红灯,需要在几百米内把几千吨重的列车停下来,这个过程有太多不可控因素。

第二阶段:电路替代。1870年轨道电路的发明让机器第一次能够"看见"列车——列车占用区间,地面设备自动向后续列车发出停车信号,不需要人工确认。这就把安全保障从"人的注意力"转移到了"电路的可靠性"。6502电气集中把道岔和信号机的操作逻辑从人工扳动变成了继电器自动组合。

第三阶段:计算机替代。计算机联锁进一步把继电器逻辑软件化,让硬件故障率大幅降低。ATP/ATO系统在车载设备和地面设备之间建立了双向数据通信,让列车不仅能被地面"看见",还能被地面"指挥"。CBTC取消了地面信号机,让列车完全依靠通信定位和车载智能来运行。

第四阶段:智能增强。当前正在发生的转变,是AI和数字孪生等技术让机器不仅能执行命令,还能提供决策支持。但这个阶段与前三个阶段有本质不同——机器不再是单纯的执行者,而是开始具备"思考"能力,尽管这种思考目前仍局限于特定领域。

每一步技术进步,都在把安全关键决策从人转移给机器。这是铁路信号史的内在逻辑,也是整个工业安全史的内在逻辑。

29.2 人的角色:从操作者到监督者

29.2.1 被替代的不只是操作工人

技术替代人的过程,最容易观察到的是一线操作岗位的消失。旗语信号员被臂板信号机替代,扳道员被电气集中替代,调度员的部分职能被计算机系统替代。每一次技术升级,都伴随着"XX岗位是否会被取代"的讨论。

但更深刻的变化发生在技术替代人之后。人的角色不是消失了,而是升级了——从执行者变成了监督者,从操作员变成了决策者。扳道员不再亲手扳动道岔,但需要确认进路排列的正确性;调度员不再用电话协调闭塞,但需要处理系统无法自动判断的异常情况;司机不再只靠眼睛看信号,但需要对车载系统的判断进行最终确认。

这种角色升级带来了一种新的复杂性:人从"直接操作者"变成了"系统监督者"。监督者的任务不是执行具体动作,而是确保机器在正确运转——这对人的要求不是降低了,而是更高了。人的注意力需要更长地集中,判断需要更准确地识别机器的失误场景,在紧急情况下需要更快地接管机器。

这就引出了铁路信号史中最容易被忽视的一个议题:人机交互。技术越先进,对人的要求越高,而不是越低。一个只会在驾驶室里推拉操作杆的司机,无法驾驭装有全套ATP的车载智能系统;一个只会按按钮确认进路的调度员,无法处理计算机联锁无法自动判断的非标准场景。

29.2.2 人的不可靠性:从失误到系统性风险

把铁路事故中的人因失误简单归结为"个人疏忽",是一种认知上的偷懒。深入分析铁路事故报告会发现,真正可怕的不是个体的失误,而是系统性的风险累积。

2005年伦敦地铁列车撞楼事故,调查显示调度员在事故前已经处于疲劳状态,连续值班超过十小时,注意力严重下降。但这不是调度员个人的问题——这是整个排班系统和人员配置的系统性问题。2009年柏林地铁追尾事故,列车司机在进站时加速而非减速,调查发现该司机此前已经连续多日超时工作,工时记录存在违规。这些事故的直接原因都是人的失误,但深层原因是系统对人的压迫——让疲劳的人在安全关键的岗位上工作。

铁路信号的冗余设计和故障安全原则,本质上是对人的不可靠性的制度性回应。轨道电路的继电器吸起表示空闲、落下表示占用的逻辑,遵循的是"任何导致电路中断的故障都默认显示停车"的故障安全原则。这不是工程师不信任电路的可靠性,而是工程师深刻理解到:任何技术系统最终都要由人来维护和操作,而人会在系统最脆弱的时刻介入。

最安全的铁路系统,不是把人的作用最小化,而是在承认人不可靠的前提下,把人的作用放在最合适的位置。

29.2.3 人的判断力:机器无法替代的部分

技术替代人的过程有一个边界:判断力。当信息完备、逻辑清晰时,机器可以替代人;当信息不完备、情境复杂时,人的判断力仍然不可替代。

铁路信号系统越来越自动化,但总有机器无法处理的场景:暴雨导致轨道积水,列车的制动距离无法准确计算,需要调度员根据实际情况决定限速;道岔区段出现异常占用模式,可能是轨道电路故障,也可能是低速运行的调车作业,需要人工现场确认;设备检修后的测试运行,需要有人监控设备状态而不是完全交给自动测试程序。

这些场景有一个共同特征:信息不完备,逻辑不清晰,无法用程序化的规则来处理。机器擅长的是规则明确、逻辑清晰、信息完备的任务;人擅长的是规则不明确、逻辑需要判断、信息需要解读的任务。这个边界,在可预见的未来不会消失。

这就引出了一个重要的设计原则:自动化程度的提高,不应该以牺牲人的判断力为代价。过度自动化会让操作人员失去对系统的直观理解,在真正需要人工判断时无法做出正确决策。

29.3 信号工的专业进化

29.3.1 被技术改变的群体

在铁路信号的整个生态中,有一个群体最能感受技术替代的冲击——信号工。他们负责信号设备的安装、调试、维护和故障处理,是铁路信号系统正常运转的最终保障。

早期的信号工更多是机械工人,处理臂板信号机的连杆调整、信号握柄的润滑、道岔的机械锁闭。6502电气集中出现后,信号工需要理解继电器逻辑和电路图纸,工作中多了万用表和示波器。计算机联锁推广后,信号工需要掌握计算机操作和软件日志分析。ATP/ATO系统上车载设备的维护,需要信号工具备通信协议和数据传输的知识。

每一次技术升级,信号工的专业门槛都在提高。这种提高不是线性的,而是跳跃式的——从机械到电气是一次跳跃,从电气到计算机是一次跳跃,从计算机到网络通信又是一次跳跃。那些在1980年代熟练处理6502继电器故障的老师傅,面对现代计算机联锁的软件日志,可能需要重新学习。

但信号工的核心价值没有改变:他们是铁路信号系统在实际物理世界的最终守护者。再先进的信号系统,最终都要通过轨道上的设备和列车上的装置来运行,而这些设备的物理状态——螺丝是否松动、接插件是否接触良好、轨道区段是否潮湿——决定了系统能否正常工作。软件可以控制逻辑,但无法控制物理世界的磨损和老化。信号工的价值,正在从"处理设备故障"升级为"保障设备健康运行"。

29.3.2 从人治到法治:制度的进化

回到1825年,铁路安全主要靠"人的纪律"——调度员尽责,司机守规矩,铁路公司有自己的内部规章。但这种"人治"的上限在切斯菲尔德事故中暴露无遗:两个人死亡,《铁路法规》出台,政府开始设定强制标准。

此后的铁路安全史,也是制度规范的进化史。英国的《铁路法规》、美国的《铁路安全法》、欧洲的TSI(技术互操作性规范)、国际铁路联盟的信号标准——每一次重大事故都推动了规范的升级,而规范的升级又推动了技术的进步。

有意思的是,技术进步和规范演进之间形成了双向促进的关系。一方面,技术进步为规范提供了新的可能性——轨道电路让自动闭塞成为可能,规范因此升级为要求新建线路必须具备自动闭塞能力;ATP让列车自动防护成为可能,规范因此对高速铁路提出强制安装要求。另一方面,规范的要求也推动了技术进步的方向——当规范要求所有新建高速铁路必须兼容ETCS时,设备制造商才有动力研发统一的信号系统,技术标准才得以统一。

规范是技术的下限,人是技术的上限。再严格的技术规范,也无法覆盖所有可能出现的异常情况;再先进的信号系统,最终都要靠人来理解它的局限性并在必要时介入。


第30章:2035年的信号系统——开放性问题

30.1 AI与安全责任的重新界定

站在2024年回望1870年,轨道电路的发明是革命性的;站在2035年展望未来十五年,我们正在经历另一场可能同样深刻的转变。

这场转变的核心,不是某一项具体技术的进步,而是技术与人关系的重新定位。过去一百五十年,技术的主旋律是对人的替代——用轨道电路替代人工确认,用电气集中替代扳道操作,用ATP替代司机判断。这种替代背后的逻辑是清晰的:人在安全关键环节不可靠,需要机器来兜底。

但这个逻辑正在被动摇。不是因为人的不可靠性消失了,而是因为机器的不可靠性被重新认识了。软件故障、网络攻击、传感器漂移、数据噪声——当铁路信号系统的自动化程度越来越高,系统性故障的风险也在增加。

这就催生了一种新的设计哲学:人机协同,而不是"人机替代"。在这种哲学下,技术不是替代人的工具,而是增强人能力的手段。AI辅助驾驶系统帮助司机更好地判断路况,而不是替代司机的决策;智能调度系统为调度员提供优化建议,而不是替代调度员的指挥;预测性维护系统帮助信号工提前发现设备隐患,而不是替代信号工的人工巡检。

30.1.1 AI与铁路信号:从辅助到自主

人工智能在铁路信号领域的应用,正在经历一个从辅助到自主的渐进过程。

第一阶段:辅助决策。AI系统分析历史数据,为调度员提供运行优化建议——比如在客流高峰时段建议增加列车班次,在设备故障时建议临时运行方案。这时的AI是纯粹的辅助工具,不直接控制任何安全关键功能。

第二阶段:异常检测。AI系统实时监控信号设备的运行状态,从海量日志数据中识别异常模式,在故障发生前发出预警。这种应用已经在中国部分铁路干线上试点——信号设备的故障预测准确率可以达到80%以上,大幅减少了设备故障导致的列车晚点。

第三阶段:自主控制。AI系统开始在特定场景下承担控制功能,比如在非安全关键的辅助系统中替代人工操作,或者在限定区域内的自动运行列车上替代司机的部分操作。这一阶段目前仍处于试验阶段,伦理和安全验证还在进行中。

第四阶段:协同智能。AI系统与人类操作员形成深度协同,AI处理规则明确、数据完备、逻辑清晰的常规任务,人处理规则不明确、信息不完备、需要判断的异常情况。这是理想中的人机协同状态。

2035年的铁路信号,最可能处于第三阶段向第四阶段过渡的状态。AI在辅助决策和异常检测方面的应用会相当成熟,在特定场景下的自主控制也会逐步推广。但AI完全替代人类在安全关键环节的判断和决策,仍然有很长的路要走——不是因为技术上不可能,而是因为社会对AI在安全关键系统中自主决策的接受度还需要时间。

30.1.2 安全责任:谁是最终责任人

当铁路信号的自动化程度越来越高,一个根本性的问题浮出水面:谁是铁路安全的最终责任人

在传统模式下,责任的链条是清晰的:司机对列车安全负责,调度员对行车指挥负责,信号工对设备状态负责。事故发生后,通过调查可以追溯到具体环节和具体人员的具体失误。责任认定是线性的、可追溯的。

在高度自动化模式下,这个链条变得模糊了。列车在ATO系统控制下自动运行,司机只是监督者;道岔和信号机由计算机联锁控制,调度员的直接干预越来越少;设备状态由预测性维护系统监控,信号工的主要工作变成了响应系统预警。当事故发生时,谁来承担责任?

这个问题没有简单的答案,但有几个方向值得思考。

方向一:责任归位于运营主体。无论自动化程度多高,铁路运营公司对列车安全运行负有最终责任。自动化系统是运营公司采用的工具,运营公司需要确保工具的正确使用和有效监督。

方向二:明确人机界面责任划分。在不同自动化级别下,明确人和机器各自负责的范围。比如在全程ATO模式下,列车运行的安全由车载系统保障,司机负责监督和紧急接管;紧急情况下司机接管后发生的事故,由司机负责,但需要证明系统设计存在缺陷导致司机无法有效接管。

方向三:建立AI决策的可解释性要求。当AI系统参与安全关键决策时,需要具备可解释性——能够说明为什么做出了某个决定。这不仅是法律追责的要求,也是安全改进的基础。如果无法解释AI的决策,就无法从事故中学习,AI系统就会成为安全改进的黑箱。

30.2 网络安全:新的攻击面

当铁路信号系统越来越多地依赖软件和网络通信,网络安全从一个技术议题变成了安全议题。

传统的铁路信号系统是封闭的,物理隔离是其安全性的基础。轨道电路、继电器联锁、电气集中——这些系统的通信都是局域的、有线的、不联网的,外部攻击几乎不可能。ETCS的推广让铁路信号系统开始网络化和标准化,这为跨线路互联互通提供了基础,但也打开了网络安全的大门。

2015年,一组研究人员展示了通过无线接口攻击城轨CBTC系统的可能性——在实验室环境下,他们能够伪造列车位置信号,导致联锁系统做出错误判断。这不是实际发生过的攻击,但这个演示敲响了警钟:高度网络化的铁路信号系统,需要认真对待网络安全威胁。

30.2.1 安全设计范式的转变

安全设计范式的转变。传统铁路信号的设计范式是"故障安全"——任何故障都默认导向安全停车。网络安全的设计范式是"纵深防御"——假设任何防线都可能被突破,需要多重防护机制。这种范式的融合,是未来铁路信号系统设计的重大挑战。

安全与效率的权衡。更高的网络化程度意味着更高的运行效率——列车可以更紧密地追踪运行,道岔和信号可以远程统一调度。但更高的网络化程度也意味着更大的攻击面。每一次为了提高效率而增加的网络连接,都是潜在的攻击入口。安全与效率的权衡,将成为铁路信号系统设计中持续的议题。

应急响应能力。当网络安全事件发生时,铁路系统需要具备快速响应和恢复的能力。这意味着需要建立网络安全事件的监测、报告、处置和恢复流程,需要定期进行网络安全演练,需要在系统设计中预留应急备用的通信和控制路径。

30.3 标准全球化:ETCS能否一统天下

铁路信号技术的全球化进程,正在面临新的张力。

一方面,ETCS的推广在欧洲取得了显著进展,越来越多的国家承诺在新建线路上采用ETCS,在既有线路上实施ETCS升级。欧洲之外,中国的高速铁路信号技术已经在东南亚、非洲等地区找到了市场;日本的新干线信号技术在特定技术输出项目中保持了竞争力;美国的铁路信号技术虽然在洲际高铁方面落后,但在货运铁路和城市轨道交通领域仍有影响力。

另一方面,地缘政治正在重塑技术标准竞争的格局。5G通信、卫星导航、人工智能——这些技术的出口管制和禁用,正在向铁路信号领域蔓延。当信号系统的核心组件需要从特定国家采购时,技术标准的竞争就变成了地缘政治博弈的筹码。

2035年的铁路信号标准格局,可能是多极化的:ETCS在欧洲占据主导地位,中国标准在"一带一路"沿线国家有较强影响力,美国标准在北美和部分拉美国家保持存在。这种多极化格局会带来互操作性的挑战——当列车需要跨国运行时,信号系统的兼容性问题会变得更加突出。

解决这个问题的可能路径,不是消除多极化,而是建立多极之间的接口标准。就像互联网的TCP/IP协议让不同国家的网络可以互联互通,铁路信号领域也需要类似的"协议层"标准,来实现不同技术体系之间的互操作。这不是技术问题,更主要是政治和经济问题。

30.4 低速场景:无人驾驶的新战场

高速铁路信号是技术难度最高、投入最大、关注度最深的领域,但铁路信号的另一片广阔天地——低速和末端场景——往往是技术创新的沃土。

城市轨道交通的CBTC系统,已经在自动驾驶方面走得比高速铁路更远。全自动运行的地铁线路(GoA4级别)在全球已经有上百条,列车完全在系统控制下运行,不需要司机监督。这些线路的信号系统,比任何高速铁路的信号系统都更接近"无人化"的终极形态。

最后一公里的铁路信号,是另一个创新方向。从货运铁路的末端站场,到工业专用线,到港口和物流中心的内部轨道,这些场景的列车运行速度低、密度低、但调车作业频繁、轨道环境复杂。传统铁路信号系统的成本和复杂度,在这些场景下往往不划算。低成本的轨道占用检测技术(如基于加速度传感器的列车检测)、简化的道岔控制装置、基于移动互联网的调度系统——这些技术创新正在让铁路信号进入过去无法覆盖的领域。

既有线的智能化改造是另一片蓝海。全球铁路总里程中,绝大多数是既有线——建设年代久远、设备老旧、运力接近饱和。这些线路无法像高速铁路那样从头建设全套信号系统,但可以通过增量式智能化改造来提升运力和安全水平。比如在既有线上加装列车定位系统,与现有轨道电路结合,提供更精确的列车追踪能力;比如在关键道口加装视频分析系统,自动检测违章行为并向监控中心报警;比如在老旧电气集中信号楼中嵌入智能诊断模块,用AI算法预测设备故障。

30.5 最后一个问题:当列车足够智能,还需要信号系统吗

未来十五年,另一个值得关注的趋势是铁路与公路交通边界的模糊

自动驾驶汽车的发展,正在让公路交通的效率和安全水平快速提升。高速公路上的自动驾驶卡车,已经在特定场景下实现了商业化运营。当公路货运可以自动驾驶时,铁路货运的成本优势会受到挑战——铁路的固定成本高、灵活性低,如果公路自动驾驶大幅降低了公路运输的成本和风险,铁路需要找到自己不可替代的价值。

这种竞争关系会反过来影响铁路信号技术的发展方向。一个可能的方向是铁路信号向公路开放的尝试。比如在铁路道口,信号系统向公路车辆发送碰撞预警信息——不是取代公路车辆的自动驾驶系统,而是在铁路道口这个关键场景下提供额外的信息输入。这在技术上是可以实现的,在法律和责任划分上需要新的框架。

而最终极的开放性问题是:当列车足够智能,还需要信号系统吗?

这个问题看似荒诞,实则触及了铁路信号存在的根本理由。铁路信号系统存在的理由,是因为列车本身无法自主判断安全状态——它需要地面设备告诉它前方是否有车、是否可以通行。但当列车具备了足够智能的感知和决策能力(比如通过车车通信T2T直接知道前车的位置和速度),信号系统的存在理由就开始动摇。

也许未来的列车,不再需要地面的"命令"来知道该怎么做——它们自己能"商量"出该怎么运行。但这并不意味着信号系统完全消失,而是它的形态会发生根本性变化:从"指挥者"变成"协调者",从"控制者"变成"服务者"。

第三十章本应是本书的终章,但关于铁路信号的未来,我们只能提出问题,无法给出答案。

这不是本书的缺陷,而是技术发展的本质特征。一百五十年前的工程师无法想象今天的列控系统,我们也无法准确预测十五年后的铁路信号会是什么样子。但有一件事是确定的:技术会继续演进,人在系统中的角色会继续调整,安全始终是铁路信号最核心的关切

从1825年的旗语到今天的CBTC,从人工确认到AI决策,铁路信号史告诉我们:技术的进步不是替代人的历史,而是人不断重新定义自己与技术关系的历史。这个过程没有终点。

当我们在2035年回望今天这本写于2024年的书,希望留下的不是对具体技术的描述,而是对这种关系的思考:技术是人创造的工具,工具改变了人的工作方式,人在适应工具的过程中创造了新的技术,如此循环,永无止境

列车还在跑,信号还在亮,工程师还在解决问题。这个故事,没有终章。


全书完


结语:150年的逻辑,以及下一个问题

回顾本书讲述的150年铁路信号史,有一条清晰的技术逻辑贯穿始终。

第一步:人治。 达灵顿铁路时代,铁路安全完全依赖人的判断——调度员举旗,司机看旗。人的判断是链条中最可靠的环节,也是最不可靠的环节。

第二步:法治。 臂板信号机出现后,"通行/停车"的决定权从调度员个人转移到了机械装置。但执行权还在司机手里。

第三步:机器代替人。 轨道电路发明后,机器能够感知列车的实际位置。联锁系统出现后,道岔和信号机的逻辑关系由机器保证。

第四步:机器比人更快。 ATP出现后,机器比任何司机都先知道危险。列控系统出现后,列车间隔从3分钟压缩到90秒。

这条逻辑还在继续:车车通信让列车之间直接对话,智能运维让设备提前告知故障,人工智能让调度系统具备预判能力。每一步演进,都压缩了"人"在安全链条中的权重,同时增加了"技术系统"的责任。

但这带来一个根本性的问题:当AI决定列车的运行,安全责任如何界定?

轨道交通信号系统的下一个十年,不是技术的竞赛,而是对"人与机器责任边界"的重新定义。这或许是读完全书后,最值得深思的问题。

“您的支持是我持续分享的动力”

微信收款码
微信
支付宝收款码
支付宝

目录