财经专业人士应该如何学习人工智能

2019年7月9日 14:52
來源:奇点财经特邀专栏作者 陈波

编者按:陈波,奇点财经的特邀专栏作者。中央财经大学财经研究院副教授,北京财经研究基地专家,绿色金融科技实验室创始人,区块链共识经济学创始人。中国人民大学经济学博士,爱丁堡大学碳金融硕士(志奋领学者),浙江大学控制科学与工程硕士。领导数十人团队研发了首个绿色金融领域人工智能引擎EnRobot,主持发布全球首个区块链经理人指数(BMI)。从事金融科技,人机混合预测,区块链技术等领域的研究和应用。

本文首发在作者微信公众号“海松ta说”,香港奇点财经获授权转载。(以下为内容正文)

在之前的文章里我讨论了财经专业人才在科技时代面临的竞争劣势,这常常让我夜不能寐。今天这篇文章将更为详细的说明财经专业人士应该如何学习人工智能。当然这是一个很新也很深刻的教育问题,我也只是抛砖引玉。

我读大学的时候专业是自动控制,当时正是人工智能的冬天。有一天我对神经网络产生了兴趣,于是问一个老师该如何学习神经网络。结果老师摇着头说,神经网络上世纪就已经被研究烂了。这个画面至今记忆犹新,常在我脑子里浮现。很多年之后我还是很疑惑:神经网络真的没啥前途么?由此可见,大学老师不能随便对一件事情做出主观性太强的判断。

今天我将从三个方面去谈财经专业人士怎样学习人工智能:学习的目的,学习的内容以及学习的方式。

财经人才→财经(金融)科技人才
因为知识背景和思维特点的差异,财经学生和工科学生学习AI的出发点和规律都是不同的。工科学生比较容易上手,但是在寻找应用场景方面会比较薄弱;财经学生专业知识比较强,但是对一些技术的掌握速度比较慢。理想的情况应该是两者相互合作或者财经专家领导工程专家。但从目前的情况来看,传统财经专业的学生很难具备这样的领导力。我认为财经学生学习AI并不是要去替代工科学生,而是要成为领导角色。不是领导人,而是领导机器。这种领导角色具有良好的专业知识,理解编程的基本逻辑,能够将AI的框架与专业知识框架进行融合。这也是未来各行各业顶尖人才必须具备的能力:你不用很会编程,但是你要知道程序是怎么写出来的,以及如何与技术人员进行对话与合作。

在进一步之前,需要破除一个误区。

现在很多人以为金融科技就是量化投资,智能投顾等。不少财经类的学生一听到这样的词汇就感到很兴奋,觉得高大上,趋之若鹜。

我想泼一下冷水:在量化投资领域,财经学生基本上不是工科学生的对手。因为这个应用场景实在是太简单了,无法发挥财经专业的优势。

量化投资只是金融科技里面一个很简单的场景,它的潜力被舆论高估了。真正的蓝海是其他更加广泛的财经领域,比如会计,资产评估,保险等等。这些领域的特点是商业模式更加复杂,需要更深厚的专业背景,并不是简单用一些复杂的机器学习算法就能完成的。

财经专业学生应该把重点放到这些行业,也就是与自己所学专业密切相关的领域,这才是你们真正有优势的地方。每个细分领域都需要一个AI,财经学生应该尽快的去思考自己所在的领域应该如何设计和使用AI,有哪些数据是可用的。你们在学校里虽然不能做出一些非常复杂的应用,但是应该进行一些简化的训练,以具备基本的技能。等你们毕业之后,要用一生的时间去优化和实现自己的AI,就像你的孩子一样,不可复制。

计量模型→数据科学

那么下一个问题,利用AI进行数据分析与现在的计量分析有什么不同呢?UCLA的朱松纯老师做了一个很好的归纳。他讲的比我好,直接把原文复制过来:
同样是在概率统计的框架下,当前的很多深度学习方法,属于一个被我称作“大数据、小任务范式(big data for small task)”。针对某个特定的任务,如人脸识别和物体识别,设计一个简单的价值函数Loss function,用大量数据训练特定的模型。这种方法在某些问题上也很有效。但是,造成的结果是,这个模型不能泛化和解释。所谓泛化就是把模型用到其它任务,解释其实也是一种复杂的任务。这是必然的结果:你种的是瓜,怎么希望得豆呢?我多年来一直在提倡的一个相反的思路:人工智能的发展,需要进入一个“小数据、大任务范式(small data for big tasks)”,要用大量任务、而不是大量数据来塑造智能系统和模型。
沿用朱老师的观点,我认为大家课堂上学的计量分析可以归纳为第三种范式:小数据、小任务范式(small data for small tasks)。虽然我也认为大数据是过度炒作,应该回归到“小数据、大任务范式(small data for big tasks),但从学习的角度来讲,财经学生应该这三种范式都去训练。大数据的好处是可以容错,容易产生一些pattern,但是大部分领域的数据量是远远谈不上大数据的,对模型和场景的理解的要求会更高,这对于财经学生来说是个好消息。

在这里我还要强调一点,计量虽然很重要,但是不要局限在这个层面,一定要从数据科学的高度去理解数据,这样才能更好的理解新的概念和方法。

数据是一个江湖
到目前为止,我们谈到了三个问题:数据,模型(场景)和算法。这三个维度是AI的核心三角。一般来说工科人才强于算法和数据处理,弱于场景设计,财经人才则相反,强于场景,弱于算法和数据。针对这个问题我的建议是,财经学生应该按照场景、数据和算法的顺序设定优先目标。场景也就是建模,这是专业知识的训练,永远是核心竞争力的关键。数据则是第二优先的目标。财经学生要从很早就开始思考,自己行业的数据能够从哪里来,具有什么样的特点,应该如何去组织和结构化?

对于数据,我的观点是公开数据已经足够做出很好的东西。很多人一谈数据就觉得一定要有私有数据。这种狭隘的认知导致在大数据时代,数据孤岛的现象反而更加严重了。

数据是一个江湖,只有数据没有用,必须要有处理数据的技术能力。单一的数据也没有用,必须要与其他的数据进行融合才能发挥价值。对于数据一定要建立开放的价值观,分享优于孤立。你只有不断的与他人分享合作,才能逐渐理解数据的内涵,建立起更强大的AI系统。因为数据本身是死的,处理数据的方式才是关键,你与别人的链接是方法的链接。 如果把一个行业的公开数据搞明白了,那你已经处于绝对领先的地位。还有一个告诫:一定要尽早积累原始数据,因为其实很多数据会很快消失的,时间可能是比数据规模更重要的维度。

风险!风险!风险!
那么财经学生在进行场景设计的时候重点应该考虑什么呢?简而言之:围绕着风险做文章!

财经科技的第一波浪潮以办公自动化为主,通过安装财务管理系统之类的方法,以提高效率,降低成本,而这些工作一般的专业IT公司就能够承担。但人工智能时代,核心问题并不是效率或成本,而是风险管理。

谁能够利用新的方法和数据去发现未知的风险,谁就能占据这个领域的新高点。因此财经学生在利用AI解决问题的时候,必须紧紧围绕风险这一概念。注意这个风险是个广义的风险,并不是简单的信用风险或交易风险。围绕着风险去寻找数据和设计模型,这个方向一定不会错。

越早开始越好
有了上面的认知之后,下面谈一下基本的学习方法,财经学生应该掌握哪些基本技能,从什么时候开始学习最好?我认为从大一下学期就应该开始相关的学习了,重点是编程语言,例如Python。我发现很多学生到了研究生还没学过Python,这实在是太晚了。Python应该成为财经学生的公共基础课。

大二时至少掌握以下基本的编程技能,例如:编写爬虫程序,抓取基本的数据,调用程序接口,自动生成报告,使用AI开源平台等。有了这些准备之后,到了大三就可以开始搜集数据和解决一些更为复杂的问题了。

如果错过了上述的时机,就比较麻烦了,因为高年级学生要做的事情太多,相关的学习就不得不推迟到研究生阶段。一拖再拖,永远落后。

对于一些AI算法,我的观点是会用即可,不用深究其中的细节和原理,因为很多算法本身还是黑箱。要充分利用网络上的资源,多去尝试不同的场景,了解每个算法的优缺点,如果有兴趣再去学习更深的东西。因此,切不可有畏难心理,照葫芦画瓢也是一种很好的学习方式。