import pandas as pd


# Load dataset
df = pd.read_csv("/Users/kimyoungwoo/Downloads/loan_approval_dataset.csv")

# Preview dataset
print(df.head())

   loan_id   no_of_dependents      education  self_employed   income_annum  \
0        1                  2       Graduate             No        9600000   
1        2                  0   Not Graduate            Yes        4100000   
2        3                  3       Graduate             No        9100000   
3        4                  3       Graduate             No        8200000   
4        5                  5   Not Graduate            Yes        9800000   

    loan_amount   loan_term   cibil_score   residential_assets_value  \
0      29900000          12           778                    2400000   
1      12200000           8           417                    2700000   
2      29700000          20           506                    7100000   
3      30700000           8           467                   18200000   
4      24200000          20           382                   12400000   

    commercial_assets_value   luxury_assets_value   bank_asset_value  \
0                  17600000              22700000            8000000   
1                   2200000               8800000            3300000   
2                   4500000              33300000           12800000   
3                   3300000              23300000            7900000   
4                   8200000              29400000            5000000   

   loan_status  
0     Approved  
1     Rejected  
2     Rejected  
3     Rejected  
4     Rejected

STAT 451 Project Proposal¶

Predicting Loan Approval Based on Applicant Information¶

Benjamin Broide, Dominic Unterriker, Hae Seung Pyun, Kang Wei Fong, Youngwoo Kim¶

Research question¶

Variable Description¶

Methods¶