S16 W07 | 35주 차
2024-08-26 (월) ~ 2024-09-01 (일)
01. 새로운 관심사
회사에서 맡고 있는 여러가지 일들 중 하나로 경쟁사 조사가 있다. 예약 페이지에 들어가면 예약 가능한 날짜를 토대로 숙소의 가동률을 확인할 수 있고, 각 날짜에 해당하는 객단가를 곱하고 더하면 각 숙소의 예상 매출을 구할 수 있다. 지금까지 이 숙소들을 매출 순으로 쭉 줄세워놓고, 잘 되는 숙소들에서 공통적으로 보이는 요소들을 추출해 우리의 프로덕트에 접목시킨다거나, 의사결정의 근거로 활용했다. 약간의 스토리텔링을 가미하면 이 적당히 귀납적이고 연역적인 절차는 꽤 설득력이 있는 자료가 되곤 했다. 하지만 동시에 나는 이게 얼마나 통계적으로 오류를 범하기 좋은 프레임이고, 낮은 차원의 접근 방식인지를 알고 있었다. 그래서 이번엔 기준 인원이나 객실 면적을 비롯해 디자인 양식, 경험 콘텐츠 등 조작적 정의를 곁들인 다양한 변수를 추가해 더 고도화된 테이블을 만들었다. 그리고 GPT에게 자문을 구해 다양한 통계 기법이나 머신러닝 모델을 확인했고, GPTs 중 하나인 Data Analyst의 도움을 받아 여러 모델을 돌려보았다. 각 모델별로 조금씩 상이한 결과값들이 나왔고, 이 모델들을 하나하나 이해하고 잘 활용할 수 있게 된다면 일보 진전을 할 수 있겠다는 생각이 들었다.
그 일환으로 유튜브로 여러 통계 모델들에 관한 101 영상들을 찾아보고, <데이터과학자의 사고법>이라는 책을 읽기 시작했다. 덕분에 선형회귀밖에 모르던 나의 세계가 조금씩 넓어지고, 통계적인 오류나 함정에 빠지지 않는 정교한 사고관을 점점 갖추어가게 되는 것 같다. 확실히 탐구했을 때 일에서 임팩트를 만들어낼 수 있겠다는 생각이 든다.