如今,幾乎每天都有媒體提及銀行或消費者信貸領域的人工智能(AI)與/或機器學習。鑒于你所閱讀文章的作者觀點各異,這項技術給人的感覺不是全球金融普惠的靈丹妙藥,就是即將成為掌控全球金融的霸主。那么,這些新技術工具在消費者信貸方面的實際使用情況如何?近期到中期我們可以預期發(fā)生什么?哪些是宣傳的噱頭,哪些才是事實,哪些又是可以付諸實踐的部分?
消費者信貸行業(yè)大背景
要回答這些問題,不妨以討論全球消費者信貸的現(xiàn)狀和行業(yè)機制為開端。了解和管理消費者風險是該行業(yè)的核心差異,歷來都是企業(yè)亟需解決的重點問題。企業(yè)解決這一問題的方法是,遵循可預測未來的過往消費者行為普遍原則,并根據期望保持在定價區(qū)間內的風險閾值進行相應操作。這使得銀行和監(jiān)管機構創(chuàng)建了追蹤消費者行為的共享數據資源。這些共享的數據存儲庫或“征信局”會整理消費者信貸信息。有了這些信息以及銀行自身獲得的信息,就可以建立預測“風險”的定量信用評分。這些評分通常使用各種能顯著區(qū)分消費者風險的變量。通過使用回歸模型得出評分,而回歸模型已成為業(yè)界的事實標準。
過去10年間消費者信貸行業(yè)發(fā)生的變化
數據量的增長和相對低廉的計算資源使得消費者信貸行業(yè)在過去十多年內發(fā)生了巨大變化。此外,在此期間,監(jiān)管機構還大力推動金融普惠。這些轉變共同為AI的運用提供了肥沃的土壤。將這些要素納入到大背景下,以亞太地區(qū)為例,在該地區(qū)42億人口中,只有約12億人擁有借貸歷史,由此可見金融普惠更趨提上議程。然而,電信、電子商務和電子支付錢包的發(fā)展已經共同造就了涵蓋約35億人口的超大數據集。與此同時,摩爾定律在過去十年間使數據存儲和數據計算的成本呈指數級下降。所有這些因素都為各種AI工具提供了用武之地。
AI如何助力消費者信貸?
AI帶來的前景,是能夠應用其計算能力發(fā)現(xiàn)變量之間復雜而微妙的關系,從而利用這些關系建立模型,將良好信用與不良信用區(qū)分開來。AI可以運用“機器學習”方法,再結合額外輸入的數據,對這些模型進行優(yōu)化,以進一步幫助創(chuàng)建一個良性循環(huán)。AI模型與常規(guī)回歸方程的區(qū)別在于,AI模型在解釋消費者數據方面所能實現(xiàn)的復雜程度更高。一個常規(guī)回歸方程可能會使用8-10個輸入變量來建立方程,以區(qū)分良好信用和不良信用,而AI算法往往會使用一個更豐富的變量集。它們還能夠持續(xù)觀察這些變量,并發(fā)現(xiàn)不斷變化的關系,通過這些關系可模擬人類使用附加數據制定決策的思維方式。
將機器學習應用于消費者信貸的方法是,讓一個以人腦為模型的“神經元網絡”觀察大量數據,然后用(通常)已知的結果對其進行訓練。該算法對數據進行處理,并迭代形成一個模型,由其提供區(qū)分信用表現(xiàn)優(yōu)劣的最佳界限。然后將此初始模型用于新的消費者申請數據,以預測客戶信用是好是壞。這種學習模型的優(yōu)勢在于,它可以保持反饋回路的活躍性,在判斷新消費者信用表現(xiàn)優(yōu)劣的過程中酌情采納附加數據。然后,該學習算法將增量學習整合到模型中,就像人腦建立學習的良性循環(huán)一樣。
所有這些聽起來都相當棒,那么這個方法有什么問題嗎?這是否實際上只是“更好的誘餌”呢?答案仍一如既往,雖然上述場景在理論上表現(xiàn)出色,但AI在邁向消費者信貸決策的實際應用過程中,仍有一些問題亟待解決。
可解釋性——更好詮釋決策
我們當前看到的消費者信貸模型經過銀行系統(tǒng)多年打造,是一個相當透明的體系,幾十年來消費者都是在這個體系中接受規(guī)范的,監(jiān)管機構也習慣于基于此模型管理系統(tǒng)風險。被納入此模型的普通消費者通常對影響他們信用狀況的行為有所了解,也知道他們有權要求獲得銀行系統(tǒng)掌握的個人信息。同樣監(jiān)管機構也有方法理解現(xiàn)有模型,并計算出系統(tǒng)風險以對其進行管理。
AI模型打破了現(xiàn)有模型的秩序,使其決策過程成為一個“黑箱”,在這個黑箱中,變量及其間的相互作用令人費解,而信貸決策便在此狀況下產生。因此,該模型的輸出是“不可解釋”的,這是在消費者信貸決策領域使用AI所亟待解決的一個關鍵問題。幸運的是,這個問題并非無解。我們可用多種方法讓這些模型可解釋。雖然這是一個方法多元的復雜領域,但可以肯定的是,發(fā)展模型的“可解釋性”正迅速成為AI并行研究的一個關鍵領域。實際上,將解釋模型的過程作為AI模型開發(fā)活動的關鍵部分非常有必要。不過,也可能存在一些對可解釋性不太敏感的運用領域,我們將稍后對此進行討論。
偏差
消費者信貸模型經過不斷演進,已經剔除了那些攜帶固有偏差的變量。這意味著信貸模型目前不使用諸如性別、種族等會造成系統(tǒng)偏差固化趨勢的變量。人類以直觀方式理解這些變量,并且有充分時間來發(fā)展他們對于這種偏差的理解。
例如,有鑒于男女薪酬不平等的歷史,如果我們還使用性別作為決定信貸的變量,那我們所做的一切就是在幫助延續(xù)這種不平等。因此,我們在開發(fā)回歸模型時一般就會剔除這些變量。但機器學習缺乏這種對歷史的“理解”。它會使用所有可用變量來區(qū)分信貸。此外,我們前面提到過“黑箱”的比喻,這意味著我們在得到模型結果之前,很難覺察到這種偏差。因此,開發(fā)方法來阻止這些可能帶來偏差的變量,對于信貸決策領域AI的發(fā)展過程非常重要。同樣,有多種方法可以解決這個問題。一種簡單的方法是引入預處理流程,以確保阻止那些帶來偏差的變量。此外,可能需要在模型實際投入使用時引入進一步的核查。
應用領域
對AI在消費者信貸領域的應用加以考量的另一種方式,是清晰界定應用這些模型的領域,同時充分了解其所采用方法論的優(yōu)缺點。例如,可解釋性方面的問題可能不會對欺詐檢測領域產生重大影響。作為銀行業(yè)的一個核心領域,欺詐檢測通常有一套非常規(guī)管理流程。該領域的學習算法可確保我們能夠運用常見、可獲得的大量數據流。消費者也可能更理解這種方法帶來的系統(tǒng)性得益,因為他們最終將從更準確的欺詐檢測中獲益。其他更容易被消費者接受的應用領域為預測消費者生命周期事件,從而更好地開展直接營銷活動。同樣地,只要重視隱私問題,消費者可能會對這一領域的AI運用更為認同。
綜上所述,雖然AI在消費決策領域的應用可能還會有其他問題需要加以考慮,但上述提到的問題是目前亟待解決的關鍵所在。鑒于AI的應用可以通過運用消費者數據來解決金融普惠問題,從而帶來不可否認的收益,所有這些付出都值得我們投入。因此,問題不在于AI能否用于消費者信貸,而在于我們多久才能有效駕馭這些能力,以解決我們這個時代最大的問題之一——金融普惠。