编辑:147小编 来源:147小编
2024-06-05 13:40:45
现在市面上出现了很多供各人进行量化投资研究的网站,好比优矿 - 大数据时代的量化投资 - 通联量化实验室、JoinQuant聚宽量化交易平台、BigQuant - 人工智能量化投资平台、RiceQuant米筐量化交易平台)等,几乎清一色地在底层使用Jupyter Notebook环境来供各人进行量化投资研究。这些网站通常都为各人提供一些基本的量化投资所需要的数据,教各人使用一些基本的量化模型,而且提供封装好的数据接口、回测接口,甚至模拟盘和实盘接口。
ps. 突然发现京东也开始做量化投研了,跑去看了一下,大公司做的至少示例代码至少比其他家的规范。链接[JD Quant](多快好省,购物上京东!)。(更新,好像据说京东的这个要凉凉了?)
在这些网站上进行量化投资的研究可以资助各人很快速的了解量化投资的过程,把各人从繁琐的数据清洗、系统搭建中解放出来,能把更多的精力投入到计谋的开发上来。但是其坏处就是,数据和回测等的封装让各人很难去了解到量化投资的工作细节,但是如果要想真正真枪实弹去市场上挣钱,除了有很好的想法之外,拼的就是这些细节。因此,要想严肃地来做量化投资研究,肯定还是需要自己对于这些底层的细节进行一定的了解。
个人并不反对在上面列举的这些第三方量化投研网站上面进行研究,不外这里主要讲一下如何自己在当地开展量化投资的研究。
量化投资的开发流程一般是:回测-模拟盘-实盘测试-实盘运行,我们这里主要讲第一个。
上一讲里面提到了,量化投资计谋就是数据+量化模型。在第三方量化投研的网站上,数据通常以API的提供,使得你能够直接在网站内的Jupyter Notebook中访问。那么想要在当地进行量化投资研究的话,就需要通过网络API调用这些数据,或者把数据下载到当地再进行读取。
首先,讲一下我们可能用到的数据类型有哪些。可能用到的主要有以下几类数据
历史日行情数据:即提供历史上每天每只股票的高开低收等价格信息以及成交量相关的信息,这也是量化中最基础的数据。通常能提供历史日行情数据的,几乎都能在当天交易日收盘之后提供更新的数据,因此也是实时更新的日行情数据。历史日内行情数据:即能提供历史上每一天中间更为细节的价量信息,通常为5分钟一个数据点,也有一分钟甚至半秒频率的数据。每个数据点的形式一般为该数据点代表时间段内的一个价量综合统计,包罗高开低收和成交量信息。历史分笔数据:即历史上每一笔交易的明细,每一个数据点是一笔交易,记录了每一笔成交的价格、数量、时间等信息,是记录实际成交信息最为细致的数据。历史限价委托薄数据:记录了历史上每一个时刻限价委托薄的快照,每一个数据点代表一个时刻,每个数据点之间的间隔通常较小,好比0.5秒。每个数据点包罗该时刻十档(或者五档)报价和挂单量等数据。限价委托薄数据是市面上反映盘口信息最为细致的数据。历史财政报表数据:提供各个公司所发布的财政报表数据,用于计算一些基本面因子。历史日度因子数据:提供历史上计算好的一些基本面和技术面因子,第三方提供的基本面和技术面因子通常都是一些市面上公开的因子。其他辅助数据:包罗指数数据、指数身分数据、行业板块概念分类数据、个股基本信息等。其他特色数据:包罗公告数据、新闻舆情热度数据、宏观经济数据等。如果只是做回测,使用以上的数据就足够了,但是如果计谋开发进行到了模拟盘甚至实盘的步调,除了需要一个交易接口供你发出下单指令之外,你还需要以上数据的实时接口。因此,以上数据都对应相应的实时版本,这里不再一一介绍。需要注意的是,真正的实时分笔数据和实时限价委托簿数据好像交易所是不让分发的,各人看到的一般是延迟过后的数据。虽然以上很多数据都能找到免费的来源,但当你真正想要实盘的时候,还是建议去购买相应的数据,究竟要是数据出了问题导致亏