什么是解耦表示學習?使用beta-VAE模型探究醫(yī)療和金融問題!
【導讀】本文介紹并比較了傳統(tǒng)人工數(shù)學建模和機器學習的優(yōu)缺點,介紹了一種結(jié)合兩者優(yōu)點的方法——解耦表示學習。之后,作者使用DeepMind發(fā)布的基于解耦表征學習的貝塔-VAE模型,對醫(yī)療和金融領(lǐng)域的兩個數(shù)據(jù)集進行了探索,展示了模型效果,并提供了實驗代碼。
實驗中GitHub項目的地址:
https://github.com/Rachnog/disentanglment
本文將討論傳統(tǒng)數(shù)學建模和機器學習建模之間的關(guān)系。傳統(tǒng)數(shù)學建模是我們在學校都學過的一種建模方法。在這種方法中,數(shù)學家基于專家經(jīng)驗和對現(xiàn)實世界的理解來建立模型。機器學習建模是另一種完全不同的建模方法。機器學習算法以更微妙的方式描述了一些客觀事實。雖然人類無法完全理解模型的描述過程,但在大多數(shù)情況下,機器學習模型比人類專家建立的數(shù)學模型更準確。當然,在更多的應用領(lǐng)域(比如醫(yī)療,金融,軍事等。),機器學習算法,尤其是深度學習模型,無法滿足我們對清晰易懂決策的需求。
本文將重點討論傳統(tǒng)數(shù)學建模和機器學習建模的優(yōu)缺點,并介紹一種將它們結(jié)合起來的方法——解耦d表示學習。
如果想在自己的數(shù)據(jù)集上嘗試解耦表示學習的方法,可以參考Github上解耦學習的分享,以及Google Research提供的解耦學習的項目代碼。深度學習中的問題
由于深度學習技術(shù)的發(fā)展,我們在很多領(lǐng)域嘗試了神經(jīng)網(wǎng)絡的應用。在一些重要的領(lǐng)域,使用神經(jīng)網(wǎng)絡是合理的,并取得了良好的應用效果,包括計算機視覺、自然語言處理、語音分析和信號處理等。在上述應用中,深度學習方法都是利用線性和非線性變換從復雜數(shù)據(jù)中自動提取特征,并將特征表示為“向量”,也就是俗稱的“嵌入”。之后,神經(jīng)網(wǎng)絡對這些向量進行運算,完成相應的分類或回歸任務:
從特征提取和精度的角度來看,這種“嵌入”的方法是非常有效的,但也存在很多方面的不足:可解釋性:嵌入時使用的N維向量不能很好地解釋模型分析的原理和過程,只有通過逆向工程才能找到對分析有較大影響的輸入數(shù)據(jù)內(nèi)容。對數(shù)據(jù)的巨大需求:如果只有10~100個樣本,深度學習就無法使用。無監(jiān)督學習:大多數(shù)深度學習模型需要標記的訓練數(shù)據(jù)。零樣本學習:這是一個關(guān)鍵問題。基于一個數(shù)據(jù)集訓練的神經(jīng)網(wǎng)絡在沒有重新訓練的情況下很難直接應用于另一個數(shù)據(jù)集。對象生成:除了GANs(生成對抗網(wǎng)絡),其他模型很難生成一個真實的對象。操作:嵌入很難調(diào)整輸入對象的具體屬性。理論基礎(chǔ):雖然我們掌握了一般近似理論,但是還不夠。
這些問題很難用機器學習框架來解決,但是最近,我們?nèi)〉昧艘恍┬碌倪M展。數(shù)學建模的優(yōu)勢
20年、50年甚至100年前,大部分數(shù)學家都沒有遇到上述問題。原因是他們主要以數(shù)學建模為主,通過數(shù)學抽象來描述現(xiàn)實世界中的物體和過程,比如用分布、公式、各種方程等。在這個過程中,數(shù)學家定義了我們在題目中提到的常微分方程(ODE)。通過比較深度學習中的問題,分析了數(shù)學建模的特點。需要注意的是,在下面的分析中,“嵌入”表示數(shù)學模型的參數(shù),比如微分方程的自由度集合。說明:每個數(shù)學模型都是基于科學家對客觀事物的描述,建模過程包含了數(shù)據(jù)科學家對客觀事物的描述動機和深刻理解。比如對物理運動的描述,“嵌入”包括物體質(zhì)量、運動速率和坐標空間,不涉及抽象矢量。大數(shù)據(jù)需求:數(shù)學建模的大部分突破不需要基于龐大的數(shù)據(jù)集。無監(jiān)督學習:它也不適用于數(shù)學建模。零樣本學習:一些隨機微分方程(如幾何布朗運動)可以應用于金融、生物或物理領(lǐng)域,只需要對參數(shù)進行重命名。對象生成:不限,只要采樣參數(shù)即可。操作:不限,只需操作參數(shù)即可。理論:數(shù)百年的科學基礎(chǔ)。
我們之所以不用微分方程來解決所有問題,是因為對于大規(guī)模的復雜數(shù)據(jù),微分方程的性能要比深度學習模型差很多,這也是深度學習發(fā)展迅速的原因。但是,我們?nèi)匀恍枰斯?shù)學建模。把機器學習和人工建模方法結(jié)合起來。
在處理復雜數(shù)據(jù)時,如果能夠?qū)⑿阅芰己玫纳窠?jīng)網(wǎng)絡與人工建模方法相結(jié)合,則可在一定程度上解決可解釋性、生成和操作對象的能力、無監(jiān)督特征學習和零樣本學習等問題。例如,視頻1介紹了一種用于人像的特征提取方法。
對于微分方程等人工建模方法,圖像處理比較困難,但通過與深度學習相結(jié)合,上述模型讓我們可以生成和操作物體,可解釋性很強。最重要的是,該模型可以在其他數(shù)據(jù)集上做同樣的工作。這個模型的唯一問題是建模過程不是完全無人監(jiān)管的。此外,在對象的操作上還有一個重要的改進,就是當我改變“胡子”的特征時,程序會自動讓整張臉變得更像一個男人,這意味著雖然模型中的特征是可解釋的,但這些特征是相關(guān)的,換句話說,它們是耦合在一起的。β -VAE
有一種方法可以幫助我們實現(xiàn)解耦表示,即嵌入中的每個元素對應單個影響因素,嵌入可以用于分類、生成和零樣本學習。該算法是由DeepMind實驗室基于變分自編碼器開發(fā)的。與重建損失函數(shù)相比,該算法更注重潛在分布與先驗分布之間的相對熵。
更多細節(jié),請閱讀貝塔-https://openreview.net/forum·VAE的論文?id = sy 2 fzu 9 GL);也可以參考本視頻2中的介紹,詳細講解一下beta-VAE的內(nèi)在思想,以及這種算法在監(jiān)督學習和強化學習中的應用。
β-VAE可以從輸入數(shù)據(jù)中提取影響變量的因素,包括物理運動的方向、物體的大小、顏色和方向等。在強化學習的應用中,該模型可以區(qū)分目標和背景,并且可以在現(xiàn)有訓練模型的基礎(chǔ)上,在實際環(huán)境中進行零樣本學習。實驗過程
我主要研究模型在醫(yī)療和金融領(lǐng)域的應用。在這些領(lǐng)域的實際問題中,上述模型可以在很大程度上解決模型解釋、人工數(shù)據(jù)生成和零樣本學習等問題。因此,在接下來的實驗中,我使用了beta-VAEs模型來分析心電圖(ETC)數(shù)據(jù)和比特幣(BTC)價格數(shù)據(jù)。這個實驗的代碼可以在Github上找到。
首先,我使用veta-VAE(一種非常簡單的多層神經(jīng)網(wǎng)絡)對PTB診斷數(shù)據(jù)中的心電圖數(shù)據(jù)進行建模,該數(shù)據(jù)包含三種變量:心電圖圖、每個人隨時間變化的脈搏數(shù)據(jù)和診斷結(jié)果(即是否有梗死)。VAE訓練時,歷元大小設(shè)置為50,瓶頸大小設(shè)置為10,學習率為0.0005,容量參數(shù)設(shè)置為25(參數(shù)設(shè)置參考本GitHub項目)。模型的輸入是心跳。訓練后,模型學習了影響數(shù)據(jù)集中變量的實際因素。
下圖是我使用其中一個單一特征操作心跳數(shù)據(jù)的過程,其中黑線代表心跳,使用的特征數(shù)據(jù)值從-3逐漸增加到3。在此過程中,其他功能保持不變。不難發(fā)現(xiàn),第五個特征對心跳的形式影響很大,第八個特征代表心臟病的情況(藍色心電圖代表梗塞的癥狀,紅色則相反),第十個特征可以輕微影響脈搏。
圖:解耦心電圖的心跳
不出所料,金融數(shù)據(jù)的實驗效果并沒有那么明顯。該模型的訓練參數(shù)類似于先前實驗的參數(shù)。使用的數(shù)據(jù)是2017年收集的比特幣價格數(shù)據(jù)集,包含一個180分鐘的比特幣價格變化數(shù)據(jù)。預期的實驗效果是用貝塔-VAE學習一些標準的金融時間序列模型,比如均值回歸的時間序列模型,但是在實際中很難解釋得到的表征。在實驗結(jié)果中可以發(fā)現(xiàn),第五個特征改變了輸入時間序列的趨勢,第二、第四、第六個特征增加/減少了時間序列不同階段的波動,或者使其更穩(wěn)定或者更動蕩。
圖:比特幣收盤價脫鉤
多個對象的解耦
假設(shè)圖像中有多個物體,我們想找出每個物體的影響因素。下面的動
展示了模型的效果。
摘要
以下是對機器學習中問題列表的beta-VAE模型的總結(jié):可解釋:特征是完全可解釋的,我們只需要驗證每個特定的嵌入元素。數(shù)據(jù)需求大:因為模型屬于深度學習框架,所以數(shù)據(jù)需求還是很大的。無監(jiān)督學習:可以實現(xiàn)完全的無監(jiān)督學習。零樣本學習:可以進行,本文展示的強化學習的應用就屬于這一類。對象生成:像普通VAE一樣容易對參數(shù)進行采樣。操作:你可以很容易地操作任何感興趣的變量。理論:待研究。
上述模型幾乎具備了數(shù)學建模的所有優(yōu)質(zhì)特征,同時也具備了深度學習在分析復雜數(shù)據(jù)時的高準確率。那么,如果能以完全無監(jiān)督的方式從復雜數(shù)據(jù)中學習到如此好的表示結(jié)果,是否意味著傳統(tǒng)數(shù)學建模的終結(jié)?如果一個機器學習模型可以建立一個復雜的模型,而我們只需要特征分析,那我們還需要人工建模嗎?這個問題有待討論。
下面是本文視頻的網(wǎng)站鏈接和百度網(wǎng)盤鏈接。供參考:視頻1:鏈接:https://youtu.be/O1by05eX424百度網(wǎng)盤:鏈接:https://pan.baidu.com/s/11qsgCVlRF0R4jm7ZLlzF2w提取代碼:f76s視頻2:鏈接:https://youtu.be/ yv 698 fi 2 xze百度網(wǎng)盤:鏈接:https://pan.baidu.com/s/153FBz8YWaw3PWrqJAbPj2A提取代碼:ee8v
原始鏈接:
https://towardsdatascience . com/gans-vs-odes-the-end-of-mathematical-modeling-EC 158 f 04 ACB 9
(本文為AI技術(shù)大本營整理文章,轉(zhuǎn)載請聯(lián)系微信1092722531)