bài Viết

MÔ HÌNH LOGISTIC TRONG XẾP HẠNG RỦI RO TÍN DỤNG

19/08/2014

Mô hình Logistic (Maddala[1], 1984) là mô hình định lượng trong đó biến phụ thuộc là biến giả, chỉ nhận 2 giá trị là 0 hoặc 1. Mô hình này được ứng dụng rộng rãi trong phân tích kinh tế nói chung và rủi ro tín dụng nói riêng. Cụ thể hơn, mô hình này có thể giúpNgân hàng xác định khả năng khách hàng sẽ có rủi ro tín dụng (biến phụ thuộc) trên cơ sở sử dụng các nhân tố có ảnh hưởng đến khách hàng (biến độc lập).

Trong mô hình này, cấu trúc dữ liệu như sau:

Cấu trúc dữ liệu các biến trong mô hình Logistics

12 - MÔ HÌNH LOGISTIC TRONG XẾP HẠNG RỦI RO TÍN DỤNG

Nguồn: Maddala (1984)

Y đóng vai trò là biến phụ thuộc và là biến nhị phân, chỉ có thể nhận hai giá trị là 0 hoặc 1, cụ thể là:
2 - MÔ HÌNH LOGISTIC TRONG XẾP HẠNG RỦI RO TÍN DỤNG

+ Xi là biến độc lập, thể hiện các nhân tố ảnh hưởng đến khách hàng, ví dụ như giới tính, thu thập, tình trạng nhà,… đối với khách hàng cá nhân, hoặc ROE, ROA, vốn chủ sở hữu,… đối với khách hàng doanh nghiệp.

+ Y^ là giá trị ước lượng của Y, thu được khi hồi quy Y theo các biến độc lập . Một điều cần lưu ý là giá trị của chưa chắc đã thỏa mãn điều kiện do là giá trị ước lượng phụ thuộc vào các biến độc lập.

Khi đó, xác suất một khách hàng trả được nợ (tức là xác suất Y = 1) được tính theo công thức sau, trong đó e là hằng số Euler (xấp xỉ 2,718) :

3 - MÔ HÌNH LOGISTIC TRONG XẾP HẠNG RỦI RO TÍN DỤNG

Như vậy, với các nhân tố có ảnh hưởng tới khách hàng được xác định trước (qua tờ kê khai của khách hàng, báo cáo tài chính,…) chúng ta có thể xác định được xác suất khách hàng đó trả được nợ. Với xác suất trả được nợ càng cao thì khách hàng đó càng ít có rủi ro tín dụng và ngược lại. Dựa vào bảng dự báo xác suất của khách hàng, đối chiếu với thực tế trả nợ, Ngân hàng có thể xây dựng các mức xếp hạng rủi ro tín dụng phù hợp.

Một ví dụ đơn giản như sau: một Ngân hàng dựa trên bộ số liệu và lịch sử tín dụng của khách hàng, đã hồi quy được một mô hình để ước lượng khả năng trả nợ của khách hàng cá nhân như sau:

4 - MÔ HÌNH LOGISTIC TRONG XẾP HẠNG RỦI RO TÍN DỤNG

Trong đó X1 là thu nhập trung bình 1 tháng (đv: triệu đồng) của khách hàng, X2 là biến giả đặc trưng cho trình độ học vấn khách hàng, giá trị này bằng 1 nếu khách hàng có trình độ đại học trở lên, bằng 0 nếu khách hàng có trình độ dưới đại học. X3 là số người phụ thuộc trong gia đình. Giả sử có 1 khách hàng cá nhân tới vay vốn, có thu nhập trung bình 1 tháng là 12 triệu đồng; trình độ Đại học và trong gia đình có 2 người phụ thuộc; khi đó căn cứ vào mô hình trên chúng ta tính được giá trị . Từ đó chúng ta tính được xác suất khách hàng này trả được nợ là:

5 - MÔ HÌNH LOGISTIC TRONG XẾP HẠNG RỦI RO TÍN DỤNG

Như vậy xác suất khách hàng này trả được nợ là 0,711; căn cứ vào các mức xếp hạng mà ngân hàng đã xây dựng để xếp khoản vay của khách hàng vào mức phù hợp. Ví dụ ngân hàng xếp những khách hàng có mức xác suất trả được nợ trên 0,8 là hạng AAA, trên 0,7 đến dưới 0,8 là AA, … như vậy khách hàng trên được xếp vào hạng AA.

Phương pháp ước lượng

Như đã đề cập ở mục trên, phương trình tính xác suất khách hàng trả được nợ:

6 - MÔ HÌNH LOGISTIC TRONG XẾP HẠNG RỦI RO TÍN DỤNG

Trong đó, ký hiệu hàm ; Như vậy để tính xác suất trả được nợ của khách hàng, chúng ta tính các giá trị ước lượng của Y là , để làm được điều này chúng ta cần tình toán các giá trị . Trong mục này tác giả đề cập đến phương pháp ước lượng các hệ số beta , cụ thể như sau:

Hàm xác suất trên được gọi là hàm phân bố logistic. Trong hàm logistic này khi nhận các giá trị từ -∞ đến +∞ thì p_i nhận giá trị từ 0 đến 1. Do là phi tuyến đối với X và các tham số , vì vậy chúng ta không thể áp dụng trực tiếp phương pháp bình phương nhỏ nhất (OLS) để ước lượng, người ta dùng ước lượng hợp ý tối đa (maximum likelihood) để ước lượng β. Do Y chỉ nhận một trong hai giá trị 0 – 1, do vậy Y có phân bố nhị thức nên hàm hợp lý [2] với mẫu kích thước n có dạng sau:

7 - MÔ HÌNH LOGISTIC TRONG XẾP HẠNG RỦI RO TÍN DỤNG

Chúng ta cần ước lượng hợp lý tối đa [3] của β . Để làm được điều này chúng ta lấy logarit cơ số tự nhiên hàm hợp lý, sau đó cho các đạo hàm riêng ứng với các βi bằng 0, thu được 1 hệ phương trình. Sau đó chúng ta sử dụng phương pháp Newton-Raphson để giải hệ phương trình trên và thu được 1 công thức của β . Cuối cùng chúng ta sử dụng quá trình lặp để ước lượng hệ số β . [4]

Ngày nay, phương pháp ước lượng các hệ số đã được tự động hóa dựa trên một số phần mềm kinh tế lượng như Eviews, R, Stata, SPSS, … Trong nghiên cứu thực nghiệm, người ta có thể tìm cách bỏ đi một số biến mà vai trò giải thích cho biến Y không đủ lớn (hệ số không có ý nghĩa thống kê), nhằm tránh hiện tượng các biến độc lập có tương quan lẫn nhau làm sai lệch kết quả của mô hình.

Kiểm định mô hình

Khi chúng ta đã ước lượng được các hệ số β , lúc này trước khi tiến hành dự báo xác suất khả năng trả nợ của khách hàng, điều cần thiết là chúng ta tiến hành một số kiểm định để xem xét mô hình hồi quy đó đã hợp lý chưa, liệu có tồn tại khuyết tật nào của mô hình không. Để giải quyết vấn đề này chúng ta tiến hành một số kiểm định như sau:

Ø Kiểm định tính ngẫu nhiên của phần dư

Các sai số thu được từ mô hình ước lượng so với giá trị thực tế là Y phải là sai số ngẫu nhiên. Để kiểm định tính ngẫu nhiên của các sai số này, người ta có thể sử dụng kiểm định Dickey-Fuller hoặc kiểm định Philip-Perron.

Ø Kiểm định tính định dạng đúng của mô hình

Mô hình hợp lý là mô hình được định dạng đúng, việc định dạng sai mô hình có thể dẫn đến các kết quả sai lệch và làm kết quả dự báo bị méo mó. Để kiểm định xem mô hình được định dạng đúng hay chưa, người ta sử dụng thống kê Hosmer-Lemeshow.

Nêu mô hình có các phần dư là sai số ngẫu nhiên và được định dạng đúng thì mô hình được coi là phù hợp, có thể sử dụng để dự báo. Ngược lại, nếu không thỏa mãn 2 điều kiện trên chúng ta cần hồi quy lại mô hình với các biến độc lập khác hoặc tiến hành một số hiệu chỉnh cần thiết như tăng cỡ mẫu, điều chỉnh định dạng hàm, …

Xác định độ chính xác của kết quả dự báo

Một mô hình được coi là thành công hay không phụ thuộc chủ yếu vào tính chính xác của kết quả dự báo thu được từ mô hình đó. Do biến Y chỉ có thể nhận 2 giá trị là 0 hoặc 1, do vậy người ta đưa vào 1 ngưỡng xác suất để xếp khách hàng vào mức 0 hoặc 1 (tương ứng với không trả nợ đúng hạn – trả nợ đúng hạn). Ngưỡng xác suất ở đây thường được lấy là 0,5; tức là, nếu xác suất khách hàng trả được nợ đúng hạn từ 0,5 trở lên, khi đó xếp khách hàng vào nhóm trả được nợ đúng hạn. Nếu xác suất khách hàng trả được nợ đúng hạn nhỏ hơn 0,5, khi đó xếp khách hàng vào nhóm không trả được nợ đúng hạn. Sau đó so sánh việc xếp loại khách hàng này với thực tế trả nợ của họ xem tỷ lệ đúng là bao nhiêu, đó chính là độ chính xác của kết quả dự báo.

Quay trở lại ví dụ được đề cập ở trên, ngân hàng đã tìm được mô hình hồi quy sau:

8 - MÔ HÌNH LOGISTIC TRONG XẾP HẠNG RỦI RO TÍN DỤNG

Để cho đơn giản, chúng ta xem xét 10 khách hàng cá nhân gửi tiền vào ngân hàng, khi đó tính được xác suât trả nợ đúng hạn của họ, nếu xác suất trả nợ đúng hạn từ 0,5 trở lên thì dự báo là khách hàng trả nợ đúng hạn và ngược lại. Sau đó so sánh với việc trả nợ thực tế của họ, giả sử kết quả như sau:
Kết quả xác suất trả nợ và tính chính xác của dự báo

STT

Khách hàng

Xác suất trả nợ đúng hạn

Ngân hàng dự báo

Thực tế trả nợ

1

Nguyễn Văn A

0,78

Trả nợ đúng hạn

Trả nợ đúng hạn

2

Nguyễn Văn B

0,74

Trả nợ đúng hạn

Trả nợ đúng hạn

3

Nguyễn Văn C

0,46

Nợ quá hạn

Trả nợ đúng hạn

4

Nguyễn Văn D

0,89

Trả nợ đúng hạn

Trả nợ đúng hạn

5

Nguyễn Văn E

0,98

Trả nợ đúng hạn

Trả nợ đúng hạn

6

Nguyễn Văn F

0,34

Nợ quá hạn

Nợ quá hạn

7

Nguyễn Văn G

0,51

Trả nợ đúng hạn

Nợ quá hạn

8

Nguyễn Văn H

0,41

Nợ quá hạn

Nợ quá hạn

9

Nguyễn Văn I

0,64

Trả nợ đúng hạn

Trả nợ đúng hạn

10

Nguyễn Văn J

0,55

Trả nợ đúng hạn

Trả nợ đúng hạn

Quan sát bảng trên, có hai khách hàng mà ngân hàng dự báo sai tình hình trả nợ, trong tổng số 10 khách hàng. Vì vậy độ chính xác của mô hình dự báo là 80%.

Hiện nay những phần mềm chuyên dụng như Eviews, SPSS đều tự động tính toán cho chúng ta độ chính xác của mô hình dự báo, với ngưỡng xác suất do chúng ta tùy ý lựa chọn.

Ưu điểm

– Do mô hình này cũng là mô hình toán học nên có những ưu điểm giống như mô hình điểm số Z. Do đây là mô hình định lượng nên khắc phục được những nhược điểm của mô hình định tính, thể hiện sự khách quan, nhất quán, không phụ thuộc vào ý kiến chủ quan của cán bộ tín dụng.

– Mô hình Logistic này có kỹ thuật đo lường rủi ro tín dụng khá đơn giản, dễ thực hiện bằng phần mềm chuyên dụng (như Eviews). Đây là lợi thế nếu so với mô hình KMV có kỹ thuật đo lường và các bước tính toán khá phức tạp.

– Mô hình Logistic có thể là cơ sở để ngân hàng phân loại khách hàng và nhận riện rủi ro. Thông qua kết quả từ mô hình, chúng ta có thể ước lượng được xác suất không trả được nợ của khách hàng, từ đó Ngân hàng có thể xác định được doanh nghiệp nào đang nằm trong vùng an toàn, doanh nghiệp nào nằm trong vùng cảnh báo và giúp ngân hàng chủ động trong việc đưa ra những biện pháp hạn chế rủi ro.

– Một ưu điểm nổi bật của mô hình Logistic so với mô hình xếp hạng tín dụng truyền thống hay mô hình KMV, đó là mô hình Logistic có thể đo lường vai trò của các yếu tố tác động đến hạng tín dụng của khách hàng. Ngoài ra, trong khi mô hình điểm số Z lại cứng nhắc trong việc xem xét các yếu tố tác động tới biến phụ thuộc và các hệ số của chúng (do Altman đưa ra), trong khi với mô hình Logistic chúng ta có thể dễ dàng hiệu chỉnh hoặc thêm bớt các biến nhằm xác định cụ thể tác động của các yếu tố tới rủi ro tín dụng là như thế nào.

Nhược điểm

– Mô hình Logistic vẫn tồn tại nhược điểm, đó là mô hình phụ thuộc vào mức độ chính xác của nguồn thông tin thu nhập và khả năng dự báo cũng như trình độ phân tích của cán bộ tín dụng. Ngoài ra, mô hình Logistic bản chất là mô hình kinh tế lượng, vì vậy khi hệ số xác định ở mức nhỏ thì mô hình có thể dự báo kém chính xác (thể hiện qua các giá trị phần dư).


[1] Maddala, GS (1983), “Limited dependent and qualitative variables in econometrics”, Cambridge University Press.

[2] Hàm hợp lý của đối số tại 1 giá trị cụ thể :

9 - MÔ HÌNH LOGISTIC TRONG XẾP HẠNG RỦI RO TÍN DỤNG

Trong đó f(x,teta) là hàm mật độ; Hàm L là hàm hợp lý, chính là mật độ xác suất tại điểm (x1,x2,..,xn)

[3] Giá trị của thống kê được gọi là ước lượng hợp lý tối đa của teta nếu ứng với giá trị này của teta hàm hợp lý đạt cực đại.

[4] Chi tiết cách chứng minh sẽ được tác giả cung cấp nếu có yêu cầu.

 

Nguồn: Nguyễn Anh Khoa

Mời bạn đọc thêm bài: Vận tải biển “èo uột”, khai thác cảng tăng ngoạn mục

Bạn muốn chuyên gia tư vấn nhanh?
Bạn đang tìm hiểu về các giải pháp chuyển đổi số và muốn chuyên gia tư vấn trực tiếp tức thì? Đừng ngại ngần kết nối với chúng tôi để được hỗ trợ giải pháp nhanh chóng

    Tặng bạn ebook









      Bạn muốn chuyên gia tư vấn nhanh?
      Bạn đang tìm hiểu về các giải pháp chuyển đổi số và muốn chuyên gia tư vấn trực tiếp tức thì? Đừng ngại ngần kết nối với chúng tôi để được hỗ trợ giải pháp nhanh chóng