在财经畅销书《高频交易员:华尔街的速度游戏》中,作家迈克尔?刘易斯通过惊心动魄的故事描述了高频交易背后一场足以刷新我们认知的网络技术大对决。
为了将信号传输时延缩短3毫秒,不惜动用2000多名工人夜以继日地凿穿岩石,挖开河床,以让铺设的光缆线路尽可能走直线毫秒,哪怕线万美元,高频交易机构们也蜂拥而至。而当传输线路的物理距离无法再缩短时,人们开始关注线缆两端的服务器、交换机等设备,以赢得区区几微秒的时间差......
天下武功,唯快不破。在高频交易中,交易系统的处理速度是致命武器。如今,随着计算机技术和金融科技慢慢的提升,尤其是投资的人机构化发展步伐加快,推动量化交易和高频交易加速发展,这场速度的角逐已从毫秒级、微秒级升级至纳秒级。那在“纳秒必争”激烈竞争中,交易系统组网技术如何持续演进?
什么是量化高频交易?在数字化、信息化时代,利用海量数据分析进行实时决策已成为主要流行趋势,在金融投资领域也不例外,量化交易正是顺应这一趋势而生的时代产物,其依据庞大的历史交易数据作回测分析,并通过计算机技术实现自动化决策和执行交易,以帮助投资者避免情绪化交易及更好管理大规模资金,实现稳定盈利。而高频交易作为量化交易的一个重要分支,是指通过自动交易系统从极为短暂的市场变化中寻求获利的一种交易方式。
具体而言,一次完整的交易流程大致上可以分为接收行情信息、分析行情、发出订单并成交三个步骤。在高频交易中,要在瞬息万变的市场中把握先机,要求有一套足够快的交易系统,既能快速将行情信息从交易所传递至客户策略服务器,也能快速将订单发送至交易所。从接收交易所行情入口到下单至交易所之间产生的端到端时延,是衡量交易系统能力的重要依据,也是高频交易能不能成功的关键。
那到底有哪一些原因影响交易系统的端到端时延?交易系统通常由行情柜台、交易柜台、策略服务器、交换机等设备组成,交易软件、服务器、网卡、交换机等软硬件设备的性能都会直接影响交易系统的整体延迟。其中,交换机作为总系统连接的桥梁,是影响系统延迟的重要的条件,已成为证券和期货公司“军备竞赛”的关键设施。
我们先来回顾一下以太网交换机的工作原理。众所周知,以太帧由前导码、目的地址、源地址、类型、数据和帧末尾的校验序列FCS组成。从帧结构很容易理解,交换机在转发以太帧时一般会用存储转发(Store&Forward) 模式,当从某个端口收到一个以太帧数据包时,会通过目的地址查找与之相对应的目的端口,再通过FCS检查该帧在传输过程中出没出现损坏,假如没有,然后将该帧复制到目的端口。
整个过程中,从查找地址,到把整个以太帧放入缓存区并进行FCS检查,都会产生延迟。同时,对于组播报文,在根据VLAN和端口列表进行组播复制过程中,也会产生延迟,端口数量越多,组播复制延迟越大。据统计,传统交换机转发时延一般是800ns以上,有的设备甚至到1us,这显然不足以满足高频交易中对交易系统的极低时延要求。
如何破解?超低时延交换机应运而生,超低时延交换机分为L1、L1.5和L3三类。其中L1超低时延交换机绕开了OSI模型下对数据逐层封装和剥离的传递过程,直接在最底层的物理层进行比特级数据传输,就好比让0、1 比特流在一条光纤上直通传输一样,从而相比二层或三层交换机可大幅度缩短时延。通过交叉开关矩阵,L1交换机不仅支持任意两个端口之间的数据流“快进快出”,而且一个输入端口支持连接多个输出端口,可将数据流从一个端口同时发送给多个端口。
通过CDR(Clock Data Recovery,时钟数据恢复)电路,对通过的信号进行重整再生,可在不损失信号完整性的前提下,按需多次复制数据流。在极速交易系统组网中,交换机通常连接多台策略服务器,通过这一些技术可将行情数据快速分发至各个客户策略服务器。
L1.5超低时延交换机通过交叉矩阵结构、CDR电路、FPGA应用等技术,还能构建出效果大于L1的能力,更好匹配高频交易需求。在极速交易系统组网中,交换机通常连接多台策略服务器,并将来自多台策略服务器的数据流汇聚传输至交易所,在这样的一个过程中由于需对同时到达的数据包进行缓存处理,因此导致传输延迟较高。而L1.5超低时延交换机采用基于FPGA的多路复用技术可大幅度降低该延迟,利于将订单快速发送至交易所。
L3超低时延交换机摒弃传统交换机的存贮转发模式,采用Cut-Through模式转发,收到报文头后根据目的MAC或者目的IP确定出端口,然后直接转发到出端口,同时对报文的处理做了流程上的优化,省去了传统模式下接收完整报文和报文处理所消耗的时延。
通过以上技术,通常能将L1交换机的数据转发时延做到几纳秒,将L1.5交换机多路复用时延做到几十纳秒,L3交换机的转发时延做到几百纳秒。
物理层交换技术降低了单个交换机的时延,为构建极速交易系统打下了良好的基础,但如上所述,在高频交易中,从接收行情信息到报盘至交易所需经过多跳网络设备,总系统的端到端时延才是最终决定高频交易能不能成功的关键,因此,要系统性提升时延性能,还需覆盖全链路、全场景的超低时延交换机解决方案来实现。对此,新华三基于在交换技术二十多年的深厚积累,以及对极速交易系统的深入理解,投入核心研发力量开发并最新推出了L1(S6116-48X)、L1.5(S6116-48X-M)、L3(S6826-48Y8C/S9826-32C)全系列超低时延交换机,以业界领先的时延性能打造出覆盖行情、交易、风控等全业务场景的极速交易方案。
L1(S6116-48X)超低时延交换机通过逻辑矩阵定制化设计及特殊设计的信号再生和增强技术,可提供最小1.5ns的数据转发时延,完美契合行情广播下发场景,且支持对以太网报文的端口统计,具有普通以太网交换机的可维护性。
该L1超低时延交换机主要支持Patch panel、Tapping、Fan-out三种典型应用。可通过配置Patch Panel,实现任意两端口之间的流量双向快速流通;可通过Tapping功能将从指定端口接收到的流量镜像到其他端口,使金融客户能实时保存交易数据,利用服务器分析这些镜像过来的数据实现交易监督管理和后期追溯;通过Fan-out功能实现流量的1:N快速复制,把流量从一个端口同时发送给多个端口,实现时延小于4ns的行情数据快速分发。
L1.5(S6116-48X-M)超低时延交换机进一步引入了业内领先的FPGA链路复用、精准时间戳处理等技术,主要在极速交易场景中完成策略机上行数据的多路复用,及行情数据及回程数据的链路解复用。
在策略机至交易所的上行方向,L1.5超低时延交换机通过基于FPGA的链路复用技术,可实现最小35ns的数据转发时延。
在交易所至策略机的下行方向,L1.5超低时延交换机采用链路解复用和Fan-out两种技术,来保证行情数据快速、安全传输。对于追求极致低时延和对安全要求不高的场景,Fan-out功能通过交叉矩阵以低于4ns的时延将行情数据极速分发至多个策略机。对于有一定安全要求的场景,FPGA链路解复用技术将收到的报文广播复制到同一个MUX组的所有端口,并通过在下行口配置ACL,实现不同用户的策略机隔离,防止金融安全的问题。
同时,该L1.5超低时延交换机还支持镜像汇聚功能,可通过FPGA在报文的入端口打时间戳,再送到内部缓存,然后通过FPGA镜像引擎转发到镜像出端口,从而能更好帮助客户进行交易数据收集、分析、监管和回溯等。
对于L3(S6826-48Y8C/S9826-32C)超低时延交换机,可提供最小450ns的数据转发时延,支持丰富的二、三层特性,支持与交易所构建稳定的BGP邻居路由以及行情组播分发特性,能明显提升极速交易网络传输效率。
目前,新华三全场景低时延交换机已得到多家高频交易系统、期货、证券等客户的广泛应用和高度认可。
到今天,随着科学技术慢慢的提升,量化交易和高频交易已慢慢的变成为市场的主流。目前欧美金融市场量化交易和高频交易的比例超过百分之七十,亚洲市场超过百分之二十。从国内市场看,据相关多个方面数据显示,A股机构投资的人持股占比已超过37.8%,国内量化私募总规模已超过万亿,量化交易和高频交易迅速增加已是大势所趋。
在此趋势下,新华三推出业界领先的全系列超低时延交换机,并将之落地应用于实际业务中,无疑将助推极速交易在证券期货行业的加快速度进行发展,进而助力提升市场的流动性和效率。
值得一提的是,新华三还联合生态伙伴成立了量化金融实验室,继续在极速交易领域深入探索,聚焦交易时延、可靠性、稳定性等关键性能指标,研发更多场景化的量化解决方案和前沿技术。相信以后将逐步推动极速交易系统时延不断向0秒逼近,为我国金融科技加快速度进行发展持续添砖加瓦。