智能風控:評分卡建模原理 方法與風控策略構(gòu)建
定 價:89 元
叢書名:金融科技
- 作者:張偉
- 出版時間:2021/12/1
- ISBN:9787111695677
- 出 版 社:機械工業(yè)出版社
- 中圖法分類:F830.9
- 頁碼:
- 紙張:膠版紙
- 版次:
- 開本:16開
內(nèi)容簡介
這是一部系統(tǒng)講解評分卡建模的智能風控著作,從業(yè)務與技術、理論與實踐、傳統(tǒng)風控與智能風控等角度透徹講解評分卡建模的原理、流程、方法及其風控策略構(gòu)建。
作者在智能風控領域深耕十余年,既熟悉商業(yè)銀行傳統(tǒng)風控體系思想、方法、技術、工具,又熟悉人工智能背景下的創(chuàng)新智能風控相關解決方案、風險策略和風險建模技術,本書是作者實踐經(jīng)驗的系統(tǒng)性總結(jié)。
本書內(nèi)容分為六部分。
第1部分(第1章)介紹評分卡建;A知識,包括評分卡模型的概念和定義、評分卡建模全流程、評分卡模型的評價等。
第二部分(第2章)介紹銀行零售信貸領域產(chǎn)品特征和業(yè)務流程,以及信用風險和欺詐風險概念,介紹評分卡的應用場景和業(yè)務基礎知識。
第三部分(第3~11章)系統(tǒng)介紹評分建模的全流程,覆蓋需求理解、數(shù)據(jù)理解、特征工程、模型設計、模型開發(fā)、模型驗證、模型部署、模型監(jiān)控、模型優(yōu)化等模型全生命周期各環(huán)節(jié)。
第四部分(第12~14章)總結(jié)了評分建模的關鍵問題及其解決方案,包括拒絕推斷、模型可解釋性等,以及模型開發(fā)過程中諸如分布不均衡、模型性能下降、模型迭代漂移等問題。
第五部分(第15章)介紹了當前業(yè)界除評分卡外使用頻率Z高的高維機器學習技術,比較了傳統(tǒng)評分卡模型和高維機器學習模型,并重點介紹了XGBoost和LightGBM模型。
第六部分(第16章)以貸前自動化審批場景為例,介紹基于評分的自動化審批策略構(gòu)建,幫助讀者理解評分卡模型在風險策略設計中的應用。
(1)作者經(jīng)驗豐富:智能風控領域深耕十余年,既熟悉商業(yè)銀行傳統(tǒng)風控體系思想、方法、技術、工具,又熟悉人工智能背景下創(chuàng)新智能風控相關解決方案、風險策略和風險建模技術。(2)內(nèi)容系統(tǒng)扎實:全面系統(tǒng)講解評分建模的理論知識、業(yè)務基礎、建模全流程、Z新建模技術和風控策略構(gòu)建。(3)行業(yè)一致好評:來自上海交通大學、樂信、西南財經(jīng)大學、螞蟻集團、360金融、eBay等學界和業(yè)界的近二十位風控專家高口碑推薦。(4)大量實戰(zhàn)代碼:結(jié)合實際生產(chǎn)環(huán)境,給出了大量Python代碼,便于讀者理解且可直接使用,實操性強。(5)新視角、新觀點、新思考:在部分技術點上提出了作者的新看法和新觀點,特別 是對模型的系統(tǒng)性思考、對拒絕推斷的理解、對業(yè)務需求的理解等。 (6)融入Z新建模技術:評分卡建模是相對傳統(tǒng)的建模技術,作者特地介紹了特征工程、模型可解釋性、高維機器學習等Z新智能化建模技術。
為什么要寫本書
近些年來,智能風控技術在金融風險管理中的應用越來越廣泛。智能風控利用金融大數(shù)據(jù)、機器學習、深度學習、強化學習、時序數(shù)據(jù)分析、異常檢測、社交網(wǎng)絡分析、圖深度學習、知識圖譜、自然語言處理、文本挖掘等智能分析建模技術,以及分布式計算、實時流式計算、實時決策引擎、設備行為分析等數(shù)據(jù)工程技術,賦能金融風控管理,極大地提升了風險決策的準確性和效率。而評分卡模型作為智能風控技術的基礎部分,以其良好的可解釋性和穩(wěn)定性廣泛應用于金融領域。系統(tǒng)地掌握評分卡建模技術是很有必要的,既有助于直接進行量化建模,為金融風控提供決策支持,又有助于加深對風險建模的理解和認識,提升風險建模能力。
十多年前我初入金融風控領域,便是從評分卡建模開始上手的,至今一直從事風險量化建模、風控策略設計、風險解決方案相關工作。在早期做評分卡建模時,我對評分卡沒有太深刻的認識。正所謂“無知者無畏”,我認為評分卡建模是很簡單的事情。隨著工作經(jīng)驗的不斷積累,我逐漸嘗試從更高層面分析和建模:1)從宏觀建模全生命周期流程及全面風控體系的角度構(gòu)建模型;2)開始深入探究和思考建模的技術細節(jié);3)更加重視從業(yè)務角度(而非純技術角度)思考建模問題。此外,我開始更深刻地理解評分卡建模技術的精妙之處,并對建模技術進行了系統(tǒng)性的思考、梳理和總結(jié),也正是因為有了系統(tǒng)性的思考和總結(jié),才有了本書的初稿。
近幾年我經(jīng)常參加智能風控和數(shù)據(jù)分析的線下交流活動,也曾受邀作為講師為金融機構(gòu)做內(nèi)部風控培訓,了解到很多風險建模人員都對評分卡建模缺乏深刻的理解。市面上已有的介紹評分卡建模技術的圖書或者側(cè)重理論介紹,實戰(zhàn)內(nèi)容很少,或者過于聚焦零散的技術片段和細枝末節(jié),不夠系統(tǒng)。不少朋友希望能有一本全面系統(tǒng)地介紹建模全流程和方法的圖書,并能兼顧業(yè)務和技術,本書就是在此背景下完成的。
我曾在FICO和Accenture任職十余年,熟悉銀行傳統(tǒng)風控體系的思想、方法、技術和工具,近幾年我又在國內(nèi)領先的金融科技公司負責智能風控解決方案、風險策略設計和風險建模技術的創(chuàng)新研究,深刻體會到,在理解金融風險業(yè)務本質(zhì)特征的基礎上,既能繼承傳統(tǒng)金融風控核心技術,又能在人工智能背景下創(chuàng)新智能風控技術,實現(xiàn)“傳統(tǒng)風控+智能風控”雙引擎驅(qū)動,對從事金融風控的人員而言是很有必要的。在本書策劃編輯楊福川的邀請下,我基于這些工作經(jīng)驗以及對智能風控的理解寫了本書,供廣大已從事或擬從事智能風控工作的讀者參考,以期促進行業(yè)交流和人才技能提升。
讀者對象
本書主要面向以下讀者:
在金融機構(gòu)(特別是商業(yè)銀行、信用卡中心、持牌消費金融機構(gòu)等)從事風險量化建模、風險數(shù)據(jù)分析、風控業(yè)務策略設計的人員;
在金融科技公司、互聯(lián)網(wǎng)公司等科技類公司從事風險量化建模、風險數(shù)據(jù)分析、風控業(yè)務策略設計的人員;
對智能風控技術感興趣的其他人員;
智能風控相關專業(yè)的在校學生。
本書特色
注重實戰(zhàn),代碼豐富:本書基于作者十余年風險建模和風控策略經(jīng)驗,對評分卡建模技術進行了系統(tǒng)的梳理和總結(jié),所介紹的內(nèi)容都是實際風險建模工作中能用到的。另外還給出了豐富的Python代碼示例,具有較強的實踐性。
結(jié)構(gòu)清晰,邏輯嚴謹:本書不僅包括模型本身的設計、開發(fā)、驗證,還包括模型的工程部署、監(jiān)控和優(yōu)化,按建模方法論的流程對建模的各環(huán)節(jié)依次進行介紹。
新視角、新觀點、新思考:本書在部分技術點上提出了一些新看法和新觀點,特別是我對模型的系統(tǒng)化思考、對拒絕推斷的理解、對業(yè)務需求的理解等方面,以期拋磚引玉,引起更廣泛的交流和探討。
融入建模技術:評分卡建模是相對傳統(tǒng)的建模技術,我結(jié)合當前機器學習領域熱點技術,介紹了特征工程、高維機器學習等技術。
如何閱讀本書
本書內(nèi)容分為6個部分。
第1章介紹評分卡入門知識,包括評分卡模型的概念和定義、評分卡建模全流程、對模型的評價等,以概念性內(nèi)容介紹為主,幫助讀者初步了解評分卡的基本概念。
第2章介紹零售信貸業(yè)務基礎知識,包括銀行零售信貸領域產(chǎn)品特征、業(yè)務流程,以及信用風險概念、欺詐風險概念,幫助讀者理解評分卡的應用場景和要解決的業(yè)務問題。
第3~11章介紹評分卡建模全流程,是全書核心內(nèi)容,覆蓋業(yè)務需求理解、數(shù)據(jù)理解、特征工程、模型設計、模型開發(fā)、模型驗證、模型部署、模型監(jiān)控、模型優(yōu)化等模型全生命周期的各個環(huán)節(jié)。該部分以技術介紹為主,幫助讀者系統(tǒng)地掌握模型需求、設計、開發(fā)、測試、部署和應用全流程技術。
第12~14章介紹評分卡建模關鍵問題,包括拒絕推斷問題、可解釋性問題,以及模型開發(fā)過程中諸如分布不均衡、模型性能下降等常見問題及應對方案。
第15章介紹高維機器學習,討論了當前業(yè)界除評分卡外使用頻率較高的高維機器學習技術,并重點介紹了XGBoost和LightGBM模型。
第16章介紹風險策略應用,以貸前自動化審批場景為例,介紹了基于風險評分的自動化審批策略構(gòu)建方法,幫助讀者理解評分卡模型在風險策略設計中的應用。
本書是量化建模方法論的系統(tǒng)性總結(jié)和介紹,無論是對于已經(jīng)從事評分卡建模多年的“老兵”,還是剛?cè)胄谢蚣磳⑷胄械摹靶率帧保季哂休^好的參考價值。本書既可以作為系統(tǒng)性介紹評分卡建模技術的教科書,帶領讀者進行系統(tǒng)學習,也可以作為案頭工具書,供讀者在工作過程中隨時查閱和參考。
勘誤和支持
由于作者的水平有限,加之撰寫時間倉促,書中難免會出現(xiàn)一些錯誤、疏漏或者不準確的地方,歡迎各位讀者和專家批評指正。可以通過如下方式與作者交流或獲得支持。
本書專屬代碼托管GitHub:https://github.com/jackzhang83/ScoreCard。
知乎:https://www.zhihu.com/people/boypet。
致謝
本書內(nèi)容基于我十余年風險建模和風控策略經(jīng)驗。首先要感謝領我進門的前輩,既包括我工作過的公司的領導、技術專家和業(yè)務專家,也包括在我參與過的20余個大中型銀行項目實施過程中與我深入交流的行方領導和業(yè)務專家。
特別感謝上海交通大學上海高級金融學院李祥林(David X. Li)教授、樂信集團首席風控官喬楊先生和同盾科技副總裁余旭鑫博士百忙之中抽出時間為本書作序。李祥林教授是信用風險特別是信用衍生品估值定價領域的知名學者和行業(yè)領先實踐者,其基于Copula的信用衍生品定價原理在行業(yè)得到廣泛應用。喬楊先生曾在Discover和數(shù)科工作多年,他撰寫的《數(shù)據(jù)化風控》是風控建模從業(yè)者參考書。余旭鑫博士很重視咨詢的專業(yè)性和價值,對于模型風險有獨到見解,是國內(nèi)模型風險管理(MRM)的積極倡導者。
其次感謝來自智能風控和數(shù)據(jù)分析行業(yè)交流圈的朋友。我一直推崇“三人行,必有吾
師”之訓,非常樂于參與或組織行業(yè)交流,也有幸認識了許多業(yè)內(nèi)同行,在交流過程中思想的碰撞對我有很大啟發(fā)。
感謝機械工業(yè)出版社華章公司的策劃編輯楊福川,他在近一年的時間中不斷地鼓勵我,并對本書的寫作提出了一些建設性的意見。感謝本書責任編輯韓蕊,她認真審校了全書,并提出了不少中肯的建議。
后感謝我的妻子邢夢娟和我的女兒。寫作需要犧牲不少陪伴家人的時間,她們非常理解和支持我;寫作是一個既享受又折磨人的過程,她們給予我不少鼓勵和督促。
張 偉(筆名:上善若愚)
2021年11月
作者簡介
張偉(筆名:上善若愚)
金融科技公司技術合伙人、高級風控總監(jiān)及解決方案專家,前FICO風險評分建模與風控業(yè)務策略專家。
在金融風險管理和智能風控領域有近15年工作經(jīng)驗,擅長業(yè)務策略、量化建模、解決方案、風控體系建設,專注于商業(yè)銀行、消費金融和金融科技行業(yè),在智能風控策略模型數(shù)據(jù)決策體系建設、風險業(yè)務架構(gòu)和技術架構(gòu)、信用風險業(yè)務策略與量化模型、信貸資產(chǎn)組合管理、金融資產(chǎn)定價與風險管理、業(yè)務安全技術、巴塞爾新資本協(xié)議等方面積累了豐富的工作經(jīng)驗。
曾作為技術專家或行業(yè)專家多次受邀出席上海市政府組織的行業(yè)產(chǎn)業(yè)聯(lián)盟研討調(diào)研座談,多次受邀出席金融科技領域行業(yè)論壇并做主題演講或圓桌討論,多次接受主流金融科技媒體和財經(jīng)媒體采訪,并受聘為上海交通大學上海高金金融研究院研究員和華東理工大學商學院職業(yè)導師。
贊譽
序1
序2
序3
前言
第1章 評分卡建模理論基礎 1
1.1 評分卡建模常見面試問題 1
1.2 關于模型的系統(tǒng)性理解 2
1.3 與建模密切相關的4個領域 3
1.3.1 機器學習 3
1.3.2 數(shù)據(jù)挖掘 4
1.3.3 數(shù)據(jù)分析 4
1.3.4 統(tǒng)計分析 5
1.3.5 四者之間的聯(lián)系與區(qū)別 5
1.4 評分模型與評分卡模型 6
1.4.1 評分模型和評分卡模型的定義 6
1.4.2 評分卡模型的分類 6
1.4.3 評分卡模型的適用性 7
1.4.4 評分卡模型的價值 8
1.4.5 評分卡模型的應用 9
1.5 評分卡建模全流程 9
1.6 對評分卡模型的評價 10
1.7 本章小結(jié) 11
第2章 零售信貸業(yè)務基礎和風險管理 12
2.1 銀行零售信貸產(chǎn)品的產(chǎn)品特征和業(yè)務流程 12
2.1.1 個人貸款 13
2.1.2 信用卡 17
2.2 信用與信用風險 21
2.2.1 信用風險識別 22
2.2.2 信用風險評估 23
2.2.3 信用風險監(jiān)測 24
2.2.4 信用風險控制 24
2.2.5 征信 25
2.3 欺詐與欺詐風險 26
2.3.1 欺詐風險的分類 27
2.3.2 欺詐風險的防范 27
2.3.3 欺詐風險與信用風險比較 27
2.4 本章小結(jié) 28
第3章 業(yè)務需求理解 29
3.1 業(yè)務需求理解概述 29
3.2 明確擬解決問題和分析目標 29
3.3 業(yè)務訪談的設計和實施 30
3.4 整體分析方案設計 31
3.5 本章小結(jié) 32
第4章 數(shù)據(jù)基礎決定模型效果上限 33
4.1 關于數(shù)據(jù)的系統(tǒng)性認識 33
4.1.1 數(shù)據(jù)基本特征 33
4.1.2 常見數(shù)據(jù)問題 36
4.2 傳統(tǒng)信貸業(yè)務數(shù)據(jù) 37
4.2.1 貸款可用數(shù)據(jù) 38
4.2.2 信用卡可用數(shù)據(jù) 38
4.3 征信數(shù)據(jù) 39
4.3.1 征信數(shù)據(jù)概述 39
4.3.2 一代人行征信 40
4.3.3 二代人行征信 41
4.3.4 一、二代人行征信的差異及映射轉(zhuǎn)換 42
4.3.5 人行征信數(shù)據(jù)的使用 43
4.4 內(nèi)外部大數(shù)據(jù) 44
4.4.1 大數(shù)據(jù)概述 44
4.4.2 銀行內(nèi)部大數(shù)據(jù) 45
4.4.3 銀行外部大數(shù)據(jù) 45
4.5 數(shù)據(jù)質(zhì)量診斷 46
4.5.1 數(shù)據(jù)質(zhì)量診斷目的 46
4.5.2 數(shù)據(jù)質(zhì)量診斷方法 47
4.6 業(yè)務數(shù)據(jù)分析 48
4.6.1 業(yè)務數(shù)據(jù)分析目的 48
4.6.2 業(yè)務數(shù)據(jù)分析方法 49
4.7 本章小結(jié) 49
第5章 利用特征工程提取有效的風險特征 50
5.1 特征工程概述 50
5.1.1 特征與特征工程 50
5.1.2 數(shù)據(jù)處理與特征工程流程 51
5.1.3 特征工程的理論體系 51
5.1.4 特征工程的抽象范式 52
5.2 特征預處理與轉(zhuǎn)換 53
5.2.1 常見數(shù)據(jù)質(zhì)量問題 53
5.2.2 特征清洗與預處理 53
5.2.3 特征編碼 54
5.2.4 特征轉(zhuǎn)換 55
5.3 特征提取與生成 56
5.3.1 業(yè)務專家經(jīng)驗定義 56
5.3.2 工程化自動化衍生 56
5.3.3 表征學習 58
5.4 特征評價、選擇與降維 62
5.4.1 特征評價 62
5.4.2 特征選擇與降維 63
5.5 自動化特征工程技術與工具 65
5.5.1 自動化特征工程概述 65
5.5.2 自動化特征工程工具 66
5.6 本章小結(jié) 74
第6章 評分卡模型設計 75
6.1 模型設計概述 75
6.1.1 模型設計的定義 75
6.1.2 模型設計的工作內(nèi)容 76
6.2 排除規(guī)則與樣本范圍 76
6.2.1 排除規(guī)則和樣本范圍的定義 76
6.2.2 申請評分卡模型排除規(guī)則 77
6.2.3 行為評分卡模型排除規(guī)則 77
6.2.4 催收評分卡模型排除規(guī)則 78
6.3 模型細分 79
6.4 表現(xiàn)期定義與Vintage分析 80
6.4.1 表現(xiàn)期定義 80
6.4.2 Vintage分析 80
6.5 滾動率 83
6.5.1 滾動率定義 83
6.5.2 滾動率分析 84
6.5.3 滾動率計算常見問題 84
6.6 觀察期的定義與選擇 85
6.6.1 觀察期的定義 85
6.6.2 觀察期的選擇 85
6.7 模型設計匯總計數(shù) 86
6.7.1 匯總計數(shù)定義 87
6.7.2 匯總計數(shù)的特別說明 87
6.8 建模方式和模型原型選擇 87
6.9 本章小結(jié) 88
第7章 評分卡模型開發(fā) 89
7.1 模型開發(fā)概述 89
7.2 樣本分區(qū) 90
7.3 樣本抽樣 91
7.4 變量預篩選 93
7.5 變量分箱 94
7.6 變量再篩選 96
7.7 變量轉(zhuǎn)換WOE 97
7.8 使用邏輯回歸進行模型擬合 97
7.8.1 多重共線性檢驗 97
7.8.2 邏輯回歸建模 98
7.8.3 模型訓練結(jié)果 100
7.9 模型驗證 101
7.9.1 排序性 101
7.9.2 區(qū)分能力 101
7.9.3 穩(wěn)定性 103
7.9.4 分值集中度 103
7.9.5 分值分布 104
7.9.6 離散度 104
7.10 評分標尺 105
7.11 模型導出PMML并測試 107
7.12 評分卡建模專用Python包 108
7.12.1 scorecardpy工具包 108
7.12.2 toad工具包 108
7.12.3 RiskModeler工具包 109
7.13 評分卡建模實例 109
7