후기

유비온 프로젝트_두번째 후기 글_

히니1008 2023. 4. 15. 12:58

 

안녕하세요! 지난 글에 이어 두 번째 후기 글을 작성하려고 합니다. 저는 총 4개의 프로젝트 중 프로젝트2(여신심사 빅데이터 활용)를 중심으로 수강 후 변화된 점과 프로젝트에 대한 소소한 팁에 대해 써 보려고 합니다.

글을 읽기 전 우선 제 소개를 하자면 저는 대학교 때 비 금융 계열의 전공이었고, 금융권 인턴 경험 후 금융권에 대한 관심이 생겼습니다. 금융권 채용 시장에 부는 IT 바람을 인식하고 관심을 가지고 있었으나, 부족한 금융 지식을 메우기 위한 공부에 더 집중하고 있었습니다.

강의를 찾던 중 금융 빅데이터에 대한 강의는 유일무이했기에 관심을 가지게 되었습니다. 강의 계획서를 보며 평소 관심 있었던 여신 심사 부문에 활용되는 빅데이터 과정을 배울 수 있 다는 점과 좋은 수강 후기를 고려해 수강을 결정하게 되었습니다. 저와 같이 비금융 전공이 지만 금융권에 대한 흥미가 많은 사람, 통계,데이터에 대한 지식은 부족하지만 관심이 많으셨던 분들이 제 글을 읽고 도움이 되셨으면 좋겠습니다.

대표사진 삭제

사진 설명을 입력하세요.

 

 

Q. 수강 후 가장 크게 변화된 점?

앞서 취업 준비를 하며 금융권 여신 심사 부문에 빅데이터가 활용되고 있다는 것은 알고 있 었다고 말씀드렸고, 인턴 경험도 있었지만 구체적인 직무와 업무 프로세스에 대한 이해도는 부족했습니다. 하지만 수강 후에는 각 회사에서 관련 데이터들이 어떻게 활용되고 있는지, 금융권 내의 업종 별로 어떤 프로세스를 거쳐 심사가 이뤄지는지 등 해당 프로세스에 대한 이해도가 높아진 점이 가장 크게 변화된 점이라고 생각합니다. 그 예로 기업 여신 실행 시 필요한 서류와 자금 대출의 종류 및 필요한 재무 데이터가 무엇 인지 상세하게 알 수 있었습니다. 이 과정에서 여러 금융기관들이 어떤 서비스를 제공하는 지, 어떤 평가 지표들을 활용하고 있는 지를 통해 직무에 대한 이해도와 더불어 데이터의 중 요성에 대해 한번 더 깨달을 수 있었습니다. 혼자서 취업 준비를 했다면 금융권 직무에 대해 깊이 있게 알 수 없었을 것 같은데, 강의 때 교수님 께서 제공해 주신 자료들과 말씀이 많은 도움이 되었다고 생각합니다.

 

또한 직무에 대한 이해도와 더불어 직무에 필요한 역량 들을 간접적으로 배울 수 있게 된 것 같습니다. 3번의 PT 발표 후 받는 피드백 , 매 프로젝트마다 다양한 팀원들과의 협업 등 프 로젝트 진행 과정에서 회사에서 필요한 역량 들을 다질 수 있는 기회였다고 생각합니다. 매 프로젝트마다 어떻게 하면 좋은 결과를 만들 수 있을지 고민했던 것이 앞으로 입사 후에도 도움이 될 것이라고 생각합니다.

 

다음으로 데이터에 대한 이해도가 높아졌다고 생각합니다. 여기서 데이터란 통계학적 지식부터 머신러닝 모형까지를 포괄하는 의미입니다. 머신러닝 모형을 배우기 전 학습했던 통계적 지식을 바탕으로 논문과 부실 예측에 필요한 모형들을 이해할 수 있었습니다. 대학교 때 배웠던 통계 원론 지식을 복습하고 회귀분석, 분산 분석, 유의수준, 임계치를 고려한 분석 방법을 구체적으로 이해한 후 프로젝트2를 실습할 수 있어 좋았습니다. 부족했던 통계 개념들 을 다시 한번 정리할 수 있고 이 부분은 학원 수업만 잘 따라간다면 어렵지 않게 배울 수 있게 되는 것 같습니다.

 

데이터의 중요도와 더불어 한계도 동시에 인식하게 되었습니다. 아직까지 여신 심사 시 외감 기업이나 비상장기업은 데이터의 양이 부족해 여신 심사에 활용되기에는 부족하다는 점을 알게 되었습니다. 또 개인정보 보호법으로 인해 관련 시장에서 데이터를 활용하기 위해서는 법률적,제도적 측면도 보완되어야 한다는 점도 있었습니다. 이러한 점을 고려할 때 아직까지 데이터가 업무의 전반적인 측면을 개선할 수는 없지만 보조적 도구로써 유용하게 활용 될 수 있다는 점을 인식할 수 있게 되었고 추후 어떻게 활용할 수 있을지 고민해 볼 수 있는 계기가 되었습니다. 따라서 양질의 데이터를 확보하기 위해서는 데이터 분석가 개인의 금융 역량도 매우 중요하다는 생각이 들었습니다. 금융 데이터 분석가는 데이터의 이해도와 더불어 인사이트도 있어야 하는 일임을 배울 수 있었습니다. 수강 이후에는 데이터 분석가에 대한 시야가 넓어져 데이터에 대한 접근성이 쉬운 금융 시장에서 데이터 역량을 쌓는 것도 커리어를 쌓는 좋은 방법이 될 수 있겠다는 생각도 들었습니다.


Q. 기획서 발표 아이디어를 선정하게 된 계기 및 팁은?

 

A. 프로젝트 2는 ‘부실 예측 모형 판별’이라는 큰 주제 하에 자율적인 프로젝트 주제를 선정 하게 됩니다. 부실 징후 기업 판별 모형에 대해 학습한 후 자율적으로 세부 주제를 선정합니 다. 저희 기수도 관련 논문을 기반으로 다양한 아이디어를 발표했는데요. 약 2주 간의 시간 동안 프로젝트 주제를 고심하는 만큼 주제 선정은 프로젝트 진행 과정에 있어서도 매우 중요 한 부분이라는 생각이 듭니다.

개인적으로 프로젝트를 준비하시기 전에 평소 해당 분야에 대해서 고민하고 있는 부분이 있거나, 관심이 있는 주제를 선정하면 좋을 것 같습니다. 데이터를 가지고 이미 주어진 지표 를 활용해서 부실 기업을 판별할 수도 있지만, 더 좋은 모형을 찾아내기 위해서는 평소 관심 있던 주제에 대한 지식을 바탕으로 관련 논문들을 찾아보는 것이 더 효율적이라고 생각하기 때문입니다.

 

저 역시 처음에는 소상공인을 주제로 활용할 수 있는 데이터들을 찾아보았습니 다. 그러나 관련 데이터 부족 문제와 ‘데이터 마이닝’ 기법이 더 적합하다는 피드백을 받은 후 다른 주제를 고려했습니다. 프로젝트 2가 진행되기 전까지 많은 시간이 있기 때문에 수업을 들으면서 미리 고민해 보는 것도 좋을 것 같습니다. 그러나 관련 아이디어가 없다 해도 교수님 께서 제공해주시는 자료들을 바탕으로 이미 현 업에서 고민하고 있는 문제들을 해결 하는 것도 좋을 것 같습니다. 제공해 주는 자료에 대한 한계점과 문제점이 무엇인지 파악한 후 이를 보완할 수 있는 방법을 고민하는 것도 좋은 방법이라고 생각합니다.

 

그 예로, 저희 팀은 현재 가지고 있는 부실 기업 여부 판별 지표가 가지고 있는 문제점에 대 해 깊이 고민했습니다. 또 앞으로 있을 산업 변화와 경기 흐름을 생각했을 때 참고할만한 다른 지표가 무엇이 있을지 고민했습니다. 지금 당장은 부실 기업으로 판별 될 수 있지만 앞으로 성장 가능성이 유망한 업종(신성장 동력)과 기업들을 찾을 수 있는 지표가 무엇인지 고민 했고, 고민 끝에 찾은 지표를 통해 데이터를 분류한 결과, 현재 신성장 동력 기업과 비슷하다고 할 수 있는 데이터 지표 들을 찾을 수 있었습니다. 자료 조사를 통해 알게 된 내용이었지만 평소 해당 주제에 대해 더 관심을 가졌다면 더 다양한 데이터들을 다뤄볼 수 있지 않았을 까 하는 아쉬움이 남는 만큼, 평소 관심 있었던 산업과 업종에 대한 인사이트를 활용하셨으면 좋겠습니다!

데이터를 어떻게 활용할 수 있을지는 데이터의 이해도에 비례한다고 생각합 니다. 발표 때 아이디어에 대한 근거를 객관적인 데이터를 가지고 설득한다면 좋은 결과를 볼 수 있지 않을까 생각합니다.


Q. 데이터 확보 시 유의해야 할 점 및 팁은?

 

사실 이 부분은 수업 때 매번 강조되는 내용이지만 절차에 대한 이해가 부족하면 실수 할 수 있는 부분이라고 생각합니다. 데이터 누락과 왜곡은 팀원들과 협업시 지장을 줄 수 있는 부분이기에 유의하셨으면 좋겠다는 생각이 들어 작성하게 되었습니다.

 

우선 주제를 확정 짓기 전에 데이터의 양과 불균형을 충분히 고려해 보셨으면 좋겠습니다. 저희 팀이 선정했던 신성장 동력 기업 데이터는 데이터 추출 시 정확도는 굉장히 높았지만 관련 데이터의 양이 적어서 판별 모형의 우수성을 밝히기에는 부족한 점이 있었습니다. 미리 데이터의 불균형 정도를 고려해 보지 못해서 생긴 문제였습니다. 관련 논문들을 읽을 때에도 논문에 한계점으로 데이터 불균형이나 데이터 양의 부족을 언급하는 경우가 많습니다.

데이터 분석 프로젝트인 만큼 가장 중요한 것은 데이터의 양과 질이라는 점을 잊지 마시고, 주제 선정 시에도 데이터의 불균형 정도를 꼭 확인하셨으면 좋겠습니다. 또 데이터가 부족하더라도 이를 보완할 수 있는 다른 지표 들은 무엇이 있을지 고민해 보셨으면 좋겠습니다.

 

데이터 정제시에도 유의해야 할 점이 있습니다. 데이터를 제공받는 ‘TS2000’을 활용하면서 개인적으로 아쉬운 점이 있었는데요.

첫번째로 2000년~2011년은 K-GAAP 으로 재무제표 를 산정하지만 2011~2019년은 IFRS로 재무 비율을 산정하기 때문에 해당 년도를 구분해 야 하기 때문에 전체 년도를 가지고 할 수 없다는 한계점이 존재했습니다.

두번째로 ‘TS 2000’의 데이터들 중 연결 재무제표의 결측치들이 많은 점도 문제였는데요. 해당 문제는 개별 재무제표로 대체하거나 개별 재무제표에도 결측치가 없는 경우에는 DART에서 직접 데이터들을 가지고 와 메꾸는 작업을 거쳤습니다. 사실상 이 부분은 프로젝트 진행시에도 시간이 많이 걸려 아쉬운 점이었습니다.

세번째로 데이터 정제 시 인수 합병되거나 상장 폐지 되는 기업들도 별도로 고려해야 했습니다. 지표 산정도 크게 수익성,활동성,성장성,생산성으로 나뉘어 개별 지표 들을 고려해야 합니 다. 이 경우 수학적으로 계산은 가능하나 회계적 으로 그 의미가 불분명한 지표들은 별도로 다른 처리를 해주어야 합니다. 그 예로 성장성 지표의 경우 작년에 적자였지만 올해 흑자가 난 경우 증가율 산정 시 절댓값 처리를 통해 그 의미를 분명하게 해주어야 합니다. 안정성 지표(자기자본구성비율, 재고자산 대 순운전자본비용)의 경우 분자/분모에 모두 마이너스가 있어 TS2000이 이를 0으로 인식하는 경우도 있었습니다. 따라서 해당 문제의 경우 별도의 계산 작업을 통해 수정하였습니다.

 

TS 2000이 가지고 있는 데이터의 한계를 인식하시고 수정 해야 할 부분은 꼭 수정 작업을 거치셨으면 좋겠습니다. 또 이와 관련된 부분은 앞선 기수의 자료들을 보고 참고하셔서 시간을 단축하셨으면 좋겠습니다!


Q. 코드 작성 시 유의해야 할 점 및 팁은?

 

우선, 코드 작성 시 꼭 말씀드리고 싶은 두 가지가 있습니다. 지난번 글에서 팀원들간 데이 터 베이스 이름을 통일하거나 진행 과정에 대해 공통적으로 이해하고 있다면 효율적인 일처리가 가능하다고 말씀드렸는데요. 그 구체적인 방법으로 ‘Github’ 를 활용하실 것을 권해드리고 싶습니다.

 

저희 기수에서는 수업 때 Github에 대한 내용은 간단하게 배웠기 때문에 저 는 추후 멘토링 과정에서 Github에 대해 자세하게 배울 수 있었습니다. 혹시 이 글을 읽고 계신다면 프로젝트 시작전 Github를 활용하는 방법에 대해서 자세히 배우셨으면 좋겠습니다. 각 진행 과정 별로 개별적으로 branch를 만들어 활용할 수 있기 때문에 코드의 혼선을 줄일 수 있고 ‘커밋 메세지’를 통해 부연 설명을 해 놓으면 추후 코드 정리시에도 시간을 단축할 수 있기 때문입니다.

 

두번 째로 필요한 코드를 찾는 방법에 대해서 말씀드리고 싶습니다. 저도 그랬지만 데이터 분석 시 필요한 코드들을 어디서 가져올 수 있을지 막막했습니다. 그때 제가 활용했던 곳은 Github와 데이터분석 공모전 사이트(데이콘) 이었습니다. 이외에도 개인 블로그나 구글링 을 통해 필요한 코드를 찾을 수 있었는데 가장 추천하는 곳은 Github입니다. 전세계에서 코드를 활용하는 사람들이 코드 정리를 위해 활용하는 저장소이기 때문에 필요한 코드를 원어로 검색하면 양질의 코드 자료를 찾을 수 있었습니다.

 

이외에도 비슷한 형태의 데이터를 분 석했던 공모전 참가자들의 자료도 많은 도움이 되었습니다. 같은 코드라도 훨씬 간단한 방법 으로 작성되어 있는 구문을 활용한 사람들의 코드를 많이 찾아보는 것을 추천드립니다. 이 역시 Github에 대한 사용 방법을 잘 알고 있다면 훨씬 도움이 된다고 생각하기 때문에 Github를 사용하는 방법을 꼭 터득하셨으면 좋겠습니다.

대표사진 삭제

사진 설명을 입력하세요.

Q.수강 후 가장 크게 변화된 점?

앞서 취업 준비를 하며 금융권 여신 심사 부문에 빅데이터가 활용되고 있다는 것은 알고 있었다고 말씀드렸고, 인턴 경험도 있었지만 구체적인 직무와 업무 프로세스에 대한 이해도는 부족했습니다. 하지만 수강 후에는 각 회사에서 관련 데이터들이 어떻게 활용되고 있는지, 금융권 내의 업종 별로 어떤 프로세스를 거쳐 심사가 이뤄지는지 등 해당 프로세스에 대한 이해도가 높아진 점이 가장 크게 변화된 점이라고 생각합니다.

 

그 예로 기업 여신 실행 시 필요한 서류와 자금 대출의 종류 및 필요한 재무 데이터가 무엇 인지 상세하게 알 수 있었습니다. 이 과정에서 여러 금융기관들이 어떤 서비스를 제공하는 지, 어떤 평가 지표들을 활용하고 있는 지를 통해 직무에 대한 이해도와 더불어 데이터의 중요성에 대해 한번 더 깨달을 수 있었습니다. 혼자서 취업 준비를 했다면 금융권 직무에 대해깊이 있게 알 수 없었을 것 같은데, 강의 때 교수님 께서 제공해 주신 자료들과 말씀이 많은 도움이 되었다고 생각합니다.

 

또한 직무에 대한 이해도와 더불어 직무에 필요한 역량 들을 간접적으로 배울 수 있게 된 것 같습니다. 3번의 PT 발표 후 받는 피드백 , 매 프로젝트마다 다양한 팀원들과의 협업 등 프로젝트 진행 과정에서 회사에서 필요한 역량들을 다질 수 있는 기회였다고 생각합니다. 매 프로젝트마다 어떻게 하면 좋은 결과를 만들 수 있을지 고민했던 것이 앞으로 입사 후에도 도움이 될 것이라고 생각합니다.

 

다음으로 데이터에 대한 이해도가 높아졌다고 생각합니다. 여기서 데이터란 통계학적 지식 부터 머신러닝 모형까지를 포괄하는 의미입니다. 머신러닝 모형을 배우기 전 학습했던 통계적 지식을 바탕으로 논문과 부실 예측에 필요한 모형들을 이해할 수 있었습니다. 대학교 때 배웠던 통계 원론 지식을 복습하고 회귀분석, 분산 분석, 유의수준, 임계치를 고려한 분석 방법을 구체적으로 이해한 후 프로젝트2를 실습할 수 있어 좋았습니다. 부족했던 통계 개념들 을 다시 한번 정리할 수 있고 이 부분은학원 수업만 잘 따라간다면 어렵지 않게 배울 수 있게 되는 것 같습니다.

 

데이터의 중요도와 더불어 한계도 동시에 인식하게 되었습니다. 아직 까지 여신 심사 시 외 감 기업이나 비상장기업은 데이터의 양이 부족해 여신 심사에 활용되기에는 부족하다는 점 을 알게 되었습니다. 또 개인정보 보호법으로 인해 관련 시장에서 데이터를 활용하기 위해서 는 법률적,제도적 측면도 보완되어야 한다는 점도 있었습니다.

이러한 점을 고려할 때 아직 까지 데이터가 업무의 전반적인 측면을 개선할 수는 없지만 보조적 도구로써 유용하게 활용 될 수 있다는 점을 인식할 수 있게 되었고 추후 어떻게 활용할 수 있을지 고민해 볼 수 있는 계기가 되었습니다. 따라서 양질의 데이터를 확보하기 위해서는 데이터 분석가 개인의 금융 역량도 매우 중요하다는 생각이 들었습니다. 금융 데이터 분석가는 데이터의 이해도와 더불 어 인사이트도 있어야 하는 일임을 배울 수 있었습니다. 수강 이후에는 데이터 분석가에 대 한 시야가 넓어져 데이터에 대한 접근성이 쉬운 금융 시장에서 데이터 역량을 쌓는 것도 커 리어를 쌓는 좋은 방법이 될 수 있겠다는 생각도 들었습니다.