金融保險(xiǎn):深度學(xué)習(xí)——挑戰(zhàn)、偏見(jiàn)與路徑(下篇)
“中央財(cái)經(jīng)大學(xué)金融科技書系”第一本書《金融保險(xiǎn):深度學(xué)習(xí)》,在2018年底終于正式出版,這是中央財(cái)經(jīng)大學(xué)中國(guó)精算研究院金融科技中心的又一力作。金融科技中心的成員主要有張寧博士、陳輝博士,主要聚焦于大數(shù)據(jù)、人工智能、區(qū)塊鏈在金融和保險(xiǎn)中的應(yīng)用,已經(jīng)開(kāi)發(fā)上線“保險(xiǎn)大數(shù)據(jù)APP”、“金融腦”金融人工智能平臺(tái),“中央財(cái)經(jīng)大學(xué)金融科技書系”也將陸續(xù)出版。 近年來(lái),“中央財(cái)經(jīng)大學(xué)金融科技書系”編委會(huì)成員先后出版了多本金融科技相關(guān)的專業(yè)書籍,為此,我們梳理了一套金融科技書系,希望通過(guò)金融科技書系去理清金融科技的發(fā)展脈絡(luò),去提升金融科技的認(rèn)知能力,去改變我們的思維方式,去升華我們的智慧。 “中央財(cái)經(jīng)大學(xué)金融科技書系”編委會(huì)成員專注于金融科技研究,我們不僅僅是一個(gè)團(tuán)隊(duì),而是連接金融領(lǐng)域研究力量和人工智能大數(shù)據(jù)等領(lǐng)域研究力量的平臺(tái),希望“中央財(cái)經(jīng)大學(xué)金融科技書系”的每一本書都開(kāi)啟一個(gè)“認(rèn)知革命”的故事,一個(gè)“預(yù)見(jiàn)未來(lái)”的故事,成為金融科技理論研究與實(shí)踐探索領(lǐng)域創(chuàng)新篇章的動(dòng)聽(tīng)音符。 下面我給大家介紹張寧博士所著的《金融保險(xiǎn):深度學(xué)習(xí)》的一些內(nèi)容“人工智能+金融:挑戰(zhàn)、偏見(jiàn)與路徑”,因內(nèi)容比較多,我將分上下兩篇來(lái)介紹。上篇:【挑戰(zhàn)】【偏見(jiàn)】下篇:【路徑】盡管金融仿佛在不斷地與人工智能融合,但是,真實(shí)的情況更加復(fù)雜。 人工智能更像一個(gè)刺猬,在金融業(yè)務(wù)的很多外端,越來(lái)越多的人工智能得以應(yīng)用,并發(fā)揮出效率優(yōu)勢(shì),例如,越來(lái)越多的金融中的投資顧問(wèn)和保險(xiǎn)顧問(wèn)等,但是,這些都起到輔助的作用。 人工智能仿佛只能給金融行業(yè)打工,但是,不能成為股東,也就是說(shuō),金融行業(yè)的核心技術(shù)與人工智能還有相當(dāng)?shù)木嚯x。金融業(yè)本身是數(shù)學(xué)風(fēng)險(xiǎn)的行業(yè),或者說(shuō)是在不確定的條件下,進(jìn)行資本資產(chǎn)配置和定價(jià),其核心是風(fēng)險(xiǎn)管理、資本資產(chǎn)配置和定價(jià),但這些仿佛離人工智能還很遙遠(yuǎn)。 可以預(yù)計(jì),金融與人工智能的融合將分三個(gè)階段進(jìn)行: 第一個(gè)階段——科技賦能階段,這個(gè)階段強(qiáng)調(diào)的是場(chǎng)景應(yīng)用,是其他領(lǐng)域成熟的人工智能技術(shù),平行地應(yīng)用在金融里面,來(lái)提升業(yè)務(wù)某些環(huán)節(jié)的效率。 第二個(gè)階段——科技增能階段,這個(gè)階段強(qiáng)調(diào)的是模型的應(yīng)用,但由于這些模型直接應(yīng)用會(huì)帶來(lái)合規(guī)風(fēng)險(xiǎn),所以,我們預(yù)計(jì)這個(gè)階段會(huì)產(chǎn)生大量為金融行業(yè)服務(wù)的第三方專業(yè)服務(wù)。這個(gè)階段是主動(dòng)的,金融行業(yè)認(rèn)識(shí)到人工智能的特點(diǎn)以及優(yōu)勢(shì),主動(dòng)在業(yè)務(wù)環(huán)節(jié)中應(yīng)用人工智能,獲得效率提升,甚至改變業(yè)務(wù)方式。 第三個(gè)階段——科技產(chǎn)能階段,這個(gè)階段的特點(diǎn)是價(jià)值應(yīng)用,這一類的金融核心業(yè)務(wù)將進(jìn)行人工智能化,人工智能將成為金融核心價(jià)值的創(chuàng)造手段之一,甚至成為主要的創(chuàng)造手段,這個(gè)階段也要求監(jiān)管智能化。 2010~2030年人工智能的路徑如圖2所示。
圖2 2010-2030年人工智能的路徑 在科技賦能階段,很多都是場(chǎng)景應(yīng)用,例如,程序化的交易量化投資,也看到基于車聯(lián)網(wǎng)的保險(xiǎn)的動(dòng)態(tài)定價(jià),還有顯卡用于金融計(jì)算,筆者的團(tuán)隊(duì)在這方面也做了一些工作,將其他行業(yè)成熟的自然語(yǔ)言理解技術(shù),平行地應(yīng)用到金融領(lǐng)域中。例如,為實(shí)現(xiàn)相應(yīng)的金融報(bào)告、行研報(bào)告的理解和特征抽取,經(jīng)過(guò)大量的訓(xùn)練,可以自動(dòng)生成相應(yīng)的行業(yè)報(bào)告或者符合規(guī)則的金融報(bào)告。 在科技增能階段,一些相關(guān)研究成果也成為本書中的內(nèi)容,例如,基于手背紋理的生理年齡的區(qū)別與健康狀態(tài)的評(píng)價(jià)、混合步態(tài)以及身材等參數(shù),這種遠(yuǎn)程評(píng)價(jià)可以大幅度提升效率,可以用于健康險(xiǎn)或者人身險(xiǎn)的定價(jià),也可以用于金融的偏好識(shí)別和估計(jì)。 對(duì)金融的偏好識(shí)別,我們使用了大量的數(shù)據(jù),風(fēng)險(xiǎn)偏好就不再是簡(jiǎn)單的、固定的,而是動(dòng)態(tài)變化的了,例如,身材、健康狀態(tài)以及衰老的狀態(tài)都會(huì)影響風(fēng)險(xiǎn)偏好,這些風(fēng)險(xiǎn)偏好最終會(huì)影響金融的投資和判斷,使用的模型是循環(huán)神經(jīng)網(wǎng)絡(luò)和卷積神經(jīng)網(wǎng)絡(luò)以及注意力模型。 我們還在金融欺詐識(shí)別方面做了一些工作,不管是保險(xiǎn)中的欺詐還是投資信貸方面的欺詐,有許多信息可以捕捉到欺詐的概率,我們使用Res Net(這就是谷歌的Alpha Zero的技術(shù)網(wǎng)絡(luò))來(lái)處理這些信息,從而獲得欺詐的識(shí)別。在這個(gè)過(guò)程中,我們可以評(píng)價(jià)一些如衰老的風(fēng)險(xiǎn)指數(shù)以及身材的指數(shù),這里衰老的風(fēng)險(xiǎn)指數(shù)并不是指老年人口占多少,而是通過(guò)步態(tài)、心理等多方面的數(shù)據(jù)來(lái)分析整體人群的健康狀態(tài)。 在科技產(chǎn)能階段,這是金融和人工智能真正融合的核心,它必須要突破三個(gè)最核心的障礙,金融才能完美地?fù)肀斯ぶ悄?。按照影響程度排序?/p> 第一個(gè)障礙,也是最重要的障礙就是可解釋性,也就是要克服新一代人工智能的黑箱問(wèn)題。 第二個(gè)障礙,就是不確定條件下的人工智能,或者說(shuō)是人工智能處理風(fēng)險(xiǎn)的能力。 第三個(gè)障礙,就是金融中的通用學(xué)習(xí)有沒(méi)有可能。 從來(lái)沒(méi)有一個(gè)行業(yè)像金融這么迫切需要人工智能的可解釋性,而這恰好也與深度學(xué)習(xí)的黑箱特征有關(guān),這里的根本原因在于,世界各個(gè)國(guó)家以及組織對(duì)金融都是進(jìn)行監(jiān)管的,金融業(yè)牽一發(fā)而動(dòng)全身,一旦發(fā)生系統(tǒng)性金融風(fēng)險(xiǎn),將會(huì)波及諸多經(jīng)濟(jì)和政治,2008年金融危機(jī)就是這樣的例子。 這就要求金融業(yè)務(wù)的過(guò)程應(yīng)該是透明的。若不能告訴監(jiān)管機(jī)關(guān),這些結(jié)果就都是由一個(gè)黑箱得出的。盡管金融是在不確定條件下處理問(wèn)題的,但處理機(jī)制不應(yīng)該是黑箱,否則一個(gè)由諸多黑箱組推動(dòng)的行業(yè),將會(huì)產(chǎn)生重大的系統(tǒng)性風(fēng)險(xiǎn)。 就如對(duì)保險(xiǎn)產(chǎn)品來(lái)說(shuō),客戶本身也關(guān)心為什么一個(gè)36歲的人買這款產(chǎn)品要比25歲的人價(jià)格高,你不能告訴客戶這是一個(gè)深度網(wǎng)絡(luò)給出的結(jié)果,而應(yīng)該告訴他,36歲的人死亡率比較高。同樣對(duì)風(fēng)險(xiǎn)也是這樣,公司的管理層或者董事會(huì)想知道風(fēng)險(xiǎn)的特征是什么?影響風(fēng)險(xiǎn)的這些因素到底是如何影響風(fēng)險(xiǎn)的?這都是當(dāng)前深度網(wǎng)絡(luò)面臨的核心問(wèn)題。 我們給出了一個(gè)嘗試性的方案,這個(gè)方案稱為網(wǎng)絡(luò)探針。深度網(wǎng)絡(luò)某種程度是黑箱,所以,我們通過(guò)信息幾何和符號(hào)計(jì)算的基礎(chǔ)數(shù)學(xué)理論,設(shè)置一些相應(yīng)的探針,由此來(lái)發(fā)現(xiàn)這個(gè)黑箱的運(yùn)作機(jī)制,并結(jié)合精算的極端估計(jì),給出這個(gè)黑箱異常行為的可能性判斷。這就如同我們想知道一個(gè)烤地瓜熟沒(méi)熟,最好的方式是用溫度計(jì)插入到不同深度來(lái)看一下溫度,同時(shí),我們還不希望這個(gè)地瓜某些部位糊掉,也就是說(shuō),我們還關(guān)心它的極端風(fēng)險(xiǎn)。這些都是金融行業(yè)需要的,同時(shí),也可以用于其他行業(yè)。網(wǎng)絡(luò)探針示意圖如圖3所示。
圖3 網(wǎng)絡(luò)探針示意圖 有了這樣的技術(shù),金融行業(yè)應(yīng)用人工智能應(yīng)該有這樣的迭代關(guān)系,也就是說(shuō),從成熟的金融模型開(kāi)始,考慮大量潛在的非結(jié)構(gòu)化數(shù)據(jù),通過(guò)使用機(jī)器學(xué)習(xí)或者深度學(xué)習(xí)模型,捕捉這些數(shù)據(jù)的信息,然后,通過(guò)前面提到的探針技術(shù)、稀疏結(jié)構(gòu)、注意力機(jī)制發(fā)現(xiàn)一個(gè)初步可解釋的模型,將這個(gè)模型用于成熟模型的子模型,如此迭代,實(shí)現(xiàn)金融核心技術(shù)與人工智能的結(jié)合。 但是,該技術(shù)仍然是基于工程的方法,在書中我們介紹了金融深度學(xué)習(xí)可解釋問(wèn)題的數(shù)學(xué)工具“信息幾何”。目前看來(lái),它是最后可能解決該核心問(wèn)題的有效工具。 人工智能把握風(fēng)險(xiǎn)的能力,實(shí)際上是我們對(duì)人工智能網(wǎng)絡(luò)風(fēng)險(xiǎn)能力持有的懷疑態(tài)度。 我們用1年多的時(shí)間做了強(qiáng)化學(xué)習(xí)在投資中的應(yīng)用,這里訓(xùn)練出的“投資腦”,完全沒(méi)有人類的投資經(jīng)驗(yàn),而是通過(guò)市場(chǎng)反饋形成了自己的邏輯。 我們做了整體的對(duì)比,做了一個(gè)長(zhǎng)期的投資計(jì)劃,這里面有三個(gè)選手: 選手1:優(yōu)秀的投資經(jīng)理。 選手2:當(dāng)前很火熱的量化投資程序,注意,這里的量化程序并不是人工智能,而是指基于規(guī)則的量化投資,也就是說(shuō),不需要人為干擾,它可以幫助人類實(shí)現(xiàn)規(guī)則錨定的投資方案。 選手3:我們基于強(qiáng)化學(xué)習(xí)、繼續(xù)強(qiáng)化學(xué)習(xí)和訓(xùn)練的金融大腦,這個(gè)金融大腦從開(kāi)始就沒(méi)有受到人類的規(guī)則限制,而是通過(guò)自己近百萬(wàn)次的學(xué)習(xí)(這里面當(dāng)然要有一些技巧,因?yàn)槭褂霉雀杼岢龅募夹g(shù)成本太大),然后,在300多個(gè)交易日,形成了200多次交易,我們對(duì)此進(jìn)行了分析,希望從中得到人工智能對(duì)風(fēng)險(xiǎn)把控的能力判斷。 通過(guò)最終的投資記錄比較,我們可以發(fā)現(xiàn)如圖4示的結(jié)論。


102201/15








