SCS; feature engineering
0x20. feature engineering
data source
- 국토교통부: 유효토심, 자갈함량, 수문 지질단위, 지질 구조 밀도, 배수 등급
- 서울 열린 데이터 광장: 포트홀 보수 위치, 도시계획시설(도로), 하수관거 통계
- 건축물 대장 정보(서울 열린 데이터 광장), 지하 안전 정보(국토교통부)
0x21. feature selection1. Natural Factors (자연적 요인)
*자연적 요인의 feature extraction 원리
| Feature | 소스 테이블/뷰 | 과학적 근거 | 출처 |
|---|---|---|---|
risk_soil_depth | risk_soil_depth | 얕은 토양층은 지반 침하에 더 취약함 | 국토교통부_유효토심 |
risk_stone_content | risk_stone_content | 자갈 함량은 지반 안정성과 투수성에 영향 | 국토교통부_자갈함량 |
risk_fault | risk_fault | 단층대는 지반 불안정성의 주요 원인 | 국토교통부_단층 |
risk_hydro | risk_hydro | 수문지질학적 특성은 지하수 흐름과 침식에 영향 | 국토교통부_수문지질단위 |
risk_fracture_density | risk_fracture_density | 지질 균열 밀도가 높을수록 지반 취약성 증가 | 국토교통부_지질구조밀도 |
risk_drainage | risk_drainage | 배수 불량 지역은 물의 정체 및 침투로 인한 위험 증가 | 국토교통부_배수등급 |
0x22. feature selection2. Anthropogenic Factors (인공적 요인)
인공 요인의 feature extraction 원리
- 보안 제한 인프라 데이터의 통계적 대체: 공공 건축 기반 프록시 설계
- 이 재질의 관이 얼마나 오래 있었는지, 이 재질의 고장률이 평균적으로 얼마나 되는지, 전체 관 중 얼마나 최근에 보강되었는지를 통합하여, 해당 격자의 현재 기준 고장확률(위험도 점수)를 구함.
| Feature | 소스 테이블/뷰 | 과학적 근거 | 출처 |
|---|---|---|---|
infrastructure_vulnerability | grid_pipe_risk 시리즈 | Weibull 모델 기반 하수관 노후화 및 취약성 지수 | 서울특별시_건축물대장 정보 |
dynamic_signal | dynamic_signal_* 시리즈 | 포트홀 제보 기반 지표면 손상 신호 (제보율별) | 서울 열린데이터 광장_서울시 포트홀 보수 위치 |
0x23. feature selection3. domain based interaction feature
지질-인프라 상호작용 (Geology-Infrastructure Interactions)
| Feature | 계산식 | 소스 테이블 | 과학적 근거 |
|---|---|---|---|
soil_pipe_risk | risk_soil_depth × grid_pipe_risk_X.risk_pipe | risk_soil_depth, grid_pipe_risk_X | 얕은 토양층과 노후 파이프의 결합은 지반 침하 위험 가중 |
fault_pipe_risk | risk_fault × grid_pipe_risk_X.risk_pipe | risk_fault, grid_pipe_risk_X | 단층대의 하수관은 지반 운동으로 인한 손상 위험 증가 |
hydro_pipe_risk | risk_hydro × grid_pipe_risk_X.risk_pipe | risk_hydro, grid_pipe_risk_X | 수문지질학적 취약 지역의 노후 하수관은 지하수 영향으로 위험 증가 |
수문-인프라 상호작용 (Hydro-Infrastructure Interactions)
| Feature | 계산식 | 소스 테이블 | 과학적 근거 |
|---|---|---|---|
drainage_pipe_risk | risk_drainage × grid_pipe_risk_X.risk_pipe | risk_drainage, grid_pipe_risk_X | 배수 불량 지역의 노후 하수관은 침식 위험 증가 |
pothole_pipe_risk | dynamic_signal_X.tilde_R_g × grid_pipe_risk_X.risk_pipe | dynamic_signal_X, grid_pipe_risk_X | 포트홀 제보와 파이프 위험도의 복합 작용 |
지질-도로 상호작용 (Geology-Road Interactions)
| Feature | 계산식 | 소스 테이블 | 과학적 근거 |
|---|---|---|---|
soil_road_stress | risk_soil_depth × risk_road_load | risk_soil_depth, risk_road_load | 얕은 토양층 위의 도로 하중은 지반 압력 증가 |
fault_road_stress | risk_fault × risk_road_features.major_road_presence | risk_fault, risk_road_features | 단층대 위의 주요 도로는 지반 변동 위험 증가 |
수문-도로 상호작용 (Hydro-Road Interactions)
| Feature | 계산식 | 소스 테이블 | 과학적 근거 |
|---|---|---|---|
drainage_road_risk | risk_drainage × risk_road_features.road_area_ratio | risk_drainage, risk_road_features | 배수 불량 지역의 도로 면적 비율이 높으면 물의 우회 침투 위험 증가 |
pothole_drainage_risk | dynamic_signal_X.tilde_R_g × risk_drainage | dynamic_signal_X, risk_drainage | 배수 불량 지역의 포트홀은 물의 침투 경로 형성으로 위험 증가 |
0x24. feature selection4. Spatial Context Features
인접 그리드 특성 (Neighboring Grid Characteristics)
| Feature | 계산 방법 | 소스 테이블 | 과학적 근거 |
|---|---|---|---|
neighboring_pipe_risk | ST_DWithin 기반 인접 그리드의 pipe_risk 평균 | grid_pipe_risk_X, grid_100m | 지하 인프라 취약성은 공간적으로 연속적인 경향 |
neighboring_drainage_risk | ST_DWithin 기반 인접 그리드의 drainage_risk 평균 | risk_drainage, grid_100m | 배수 문제는 지역적 특성을 가짐 |
과거 침하 관련 특성 (Historical Subsidence Characteristics)
| Feature | 계산 방법 | 소스 테이블 | 과학적 근거 |
|---|---|---|---|
min_distance_to_sinkhole | ST_Distance 기반 최소 거리 | grid_100m, subsidence_accident_* | 과거 침하 지점 근처는 유사한 지질/인프라 조건 공유 |
subsidence_density | 반경 300m 내 침하 발생 건수 | grid_100m, subsidence_accident_* | 싱크홀은 공간적 군집성을 보이는 경향 |
0x25. feature engineering: 제보 기반 feature 제작
| pothole_kde_density | 각 포트홀 제보가 중심으로부터 퍼지는 영향력(가우시안 분포 형태)을 갖는다고 보고,이 영향력이 현재 위치에 얼마나 겹쳐지는지를 누적해서 계산한 값으로, 포트홀 제보가 많고 제보 위치가 현재 위치에 가까울 수록 이 값이 높아짐$\sum_{i=1}^n \frac{1}{h^2}K(\frac{||c_j-x_i||}{h})$ |
| pothole_pipe_interaction | pothole_kde_density × pipe_risk |
| pothole_drainage_interaction | pothole_kde_density × risk_drainage |