인구 소멸은 농촌 지역의 소멸을 넘어 도시지역의 쇠퇴와 함께 사회문제로 확산되고 있다. 특히, 지역 소멸로 발생하고 있는 빈집 문제는 인구·사회학적, 경제적, 물리적 요인을 종합적으로 고려한 분석이 필요하다. 본 연구는 광역시 소멸위험 자치구인 인천, 대전, 부산, 대구를 대상으로, SHAP (Shapley Additive Explanations) 기반 해석을 포함한 기계학습 기법을 통해 예측모델 개발과 빈집 발생 영향요인을 분석하는 것을 목적으로 한다. 문헌연구를 통해 도출한 84개 지표를 인구·사회학적, 경제적, 물리적 요인으로 분류한 후 중복성과 설명력을 고려하여 빈집 비율을 포함한 최종 13개 지표를 선정하였다. 이후 의사결정나무(Decision Tree), 랜덤포레스트(Random Forest), XGBoost 세 가지 모델을 비교한 결과, XGBoost가 0.95의 예측 정확도를 보여 최종 예측 모델로 채택되었다. 분석결과, 주택거래량, 사업체 수, 가임여성 수가 적을수록 빈집 발생확률을 증가시켰다. 또한, 소형주택비율, 노후주택 비율, 65세 이상 비율, 범죄율이 높을수록 빈집 비율이 높게 나타났다. 정책결정자 및 지역개발 활동가들은 향후 빈집 관리 및 지역 정책 수립 시 이러한 요인에 대한 고려가 필요할 것이다.