本文选自《交易技术前沿》第二十六期 (2017年03月)。
沙 明
技术开发总部
2016年3月,AlphaGo与围棋世界冠军、职业九段选手李世石进行比赛,并最终以4比1的总比分获胜。
2016年7月18日,世界职业围棋排名网站GoRatings公布最新世界排名,AlphaGo以3612分超越3608分的柯洁成为新的世界第一。
2016年12月29日至2017年1月4日,AlphaGo以Master为注册名,依次对战数十位围棋界的顶尖高手,最终以60胜0负的辉煌战绩横扫围棋界。
一时间AlphaGo的名字响彻全球,他不是隐居于桃源的世外高人,也不是精于围棋技巧的精英团队。他是一款围棋人工智能程序,由Google旗下DeepMind公司的团队开发。其主要工作原理是“深度学习”。“深度学习”是指多层的人工神经网络和训练它的方法。一层神经网络会把大量矩阵数字作为输入,通过非线性激活方法取权重,再产生另一个数据集合作为输出。这就像生物神经大脑的工作机理一样,通过合适的矩阵数量,多层组织链接一起,形成神经网络“大脑”进行精准复杂的处理,就像人们识别物体标注图片一样。另外AlphaGo还用到了很多其他新技术,如神经网络、蒙特卡洛树搜索法等,使其实力有了实质性飞跃。
正因此,人工智能已经成为一个非常热门的话题,设想应用的领域也越来越广泛,当然炙手可热的金融领域也一定列入其中。两大核心结合,便形成新的热门话题——金融科技(Fintech)。
现阶段的Fintech主要分为互联网金融和智能金融两块。其中互联网金融以IT和FA形式为主,它解决的是“如何让交易方在平台上发生交易机会”的问题。目前国内已经存在大量互联网公司。而另一块,智能金融,也就是用人工智能(AI)来做金融,在国内则有待发展。
目前许多金融领域从风险投资到孵化器,从券商到私募,从银行到交易所等,面临的问题主要集中在“价值判断”和“风险评估”两个大问题上。以前,传统做金融的方法是凭借经验和人脉来进行价值判断。那么机器能不能替代人来做出价值判断和风险评估呢?比如说告诉机器一些因素,然后它自动告诉你写事情成不成。其实市场上也有很多这样的探索者,但是最后我们发现,短期内很难实现。
在证券期货业,Fintech中流行两个概念,互联网券商和机器人投资顾问。互联网券商就是把原来人做的工作,分担给机器做一部分。然而现在所谓的互联网券商,只是把一些业务放到了互联网平台上,其实这不是真正的互联网券商。而对于机器人投资顾问,则大部分人还是持怀疑态度——从在物理世界获取信息到作出价值判断,这里面有许多链条,可否用机器生成,其中的一些工作可否用机器承载。还需要进一步探讨和研究,未来的路可能还很长。
本次主要想就关于自动化生成金融业报告的技术问题进行一次探讨。
首先想先整理一下金融业的报告类型,大致可以分为以下四种:第一种是信息披露类的报告。如股转书、做债报告、贷款报告等。沪深A股、新三板、美股都有招股说明书、股转书,这是信息披露类型的报告。还有年报、季报等等,全球每年有几百万份。第二种是研究类的报告。基于这些公开的材料再做一些加工,如卖方的券商报告、买方的基金报告,还有中介机构、咨询公司的报告等。第三种是摘要类的报告。一般在各个大券商公众号里面每天都会发,如说分行业、计算机行业、汽车行业,发生了很多事情,做一个每天的摘要这样一个报告。有些网站每天也都会发一些重要公告列表,这是一种公告摘要。还有一种是日常的跟踪报告,有按天的、有按小时的,有按月的、按周的,报盘的新闻,在很多的财经媒体上,这种股票走势、大盘走势,这种行为都是机器人写的。再有一种就是企业的信息图、基本要素的分析,很多刚入行的分析师、实习生,每天都在写这种东西,把这个企业拿过来看一下,基本亮点是什么,股转书里面弄一个PPT出来,写这种东西。最后一种是陈述性类的报告。所有前面不能够囊括的东西都归在这个里面,如各种各样的新闻,背景介绍、公司介绍、行业介绍,或者介绍一个新公司等等信息。然后深度进行观点分析,认为这件事情是什么样的,展开讲述。还有一些像八卦类的东西,机器人肯定替代不了。
对于上述列举的那么多报告,如果都能自动化生成,那带来的成本上的降低和效率上的提升会大大推进Fintech的前进。其实自动生成报告并不是什么新技术了。自动生成的报告大致可以分为两类:一种是图表,一种是文本。关于图标,用过 Excel 表格的基本都会,不是新鲜事物。但是生成文字就不是了,不像绘制图表一样简单了。但是,生成文字也有简单的方法。按照难易度可以分为篇章级别、段落级别、句子级别。在篇章级别上用一种模板,替换里面的数字或关键字是最简单的。也用不到深度学习这种技术。不过,如果使用也是可以的。段落级别的自动生成报告就有点难了,尽管还是在段落级别的模板上替换数字或关键字,但是要考虑段落的组合。句子级别那就相当难了,句子组合成一个段落真是相当不容易的。但是,深度学习不只是替换关键字,最基本的句子也是可以自动生成的。我们用过各类翻译软件或者网站,很明显能感觉到以前很多句子是不通顺的。但是最近几年这类机器翻译有一个质的飞跃。虽然还是那么烂,但是感觉能看得懂了。机器翻译因为有很多的平行语料,所以可以用深度学习训练。在金融领域里,我们自动生成报告遇到的难点是可以用于训练的数据不多。但是模板级别是不需要的。以应用场景为驱动,在不断迭代过程中让成本更低这个目标下,还是有信息的。
以上用很多文字描述了一些报告的现状和自动化生成的需求,下面就重点来探讨一下怎么去实现这样一个系统。
一般来说,这样一套自动化生成报告的系统会包含以下这些流程:从互联网络云计算平台自动采集;采集到的信息再自由加工;结合公司内部资料再进行汇总、整合;本系统也有现有模板 也可自创模板,采集信息+内部信息进行整理;再进行编辑;再通过一级一级的管理员进行审批(可单个或多个审批);报告存储;报告用印;报告发布(邮件发送、上传、下载、查询等)。
此类自动化生成报告系统应该是一个整体长远的规划,需要券商及其他金融机构对证券期货业的增值服务有比较深入的了解。系统的整体架构可以考虑采用MVC多层架构,并且满足系统对于复用性、扩展性的要求。具体架构如下图所示:
如果觉得我的文章对您有用,请点赞。您的支持将鼓励我继续创作!
赞0
添加新评论0 条评论