직업·인물

빅데이터 전문가가 되고 싶다면 주목! 데이터 사이언티스트 전인아 인터뷰 조회수 : 3552

[캠퍼스 잡앤조이=이진이 기자] 1분 동안 구글에서는 200만 건의 검색, 유튜브에서는 72시간의 비디오, 트위터에서는 27만 건의 트윗이 생성된다고 한다. 정보의 홍수 속에 데이터가 방대해지면서 빅데이터가 정보통신 분야의 화두로 떠올랐다. 


올해 하반기 채용에서 IT기업, 게임사, 금융사 등 다양한 업종의 굵직한 기업들이 빅데이터 분야의 인재 선발 계획을 밝히면서 빅데이터 직군 채용에 대한 관심이 쏠리고 있다. 


업계 1위 온라인 통합 자산관리 서비스 ‘뱅크샐러드’를 운영 중인 레이니스트의 전인아(28) 뱅크샐러드 데이터랩 실장을 만나 데이터 사이언티스트가 어떤 일을 하는지, 또 어떤 역량을 갖춰야 하는지 등에 대해 들어봤다.



프로필

출생연도 1990년생

학력 카이스트 전산학과 석사 졸업

경력 뱅크샐러드 데이터랩 실장, LG전자 CTO 인텔리전스 연구소

수상경력 카이스트 최우수 논문상, 제1회 TOPCIT경진대회 최우수상



현재 어떤 업무를 맡고 있나.

“데이터 분석가로 일하고 있다. 대기업 연구소에서 일하다가 레이니스트에 온지 3년쯤 됐다. 이곳에서 서비스에 필요한 데이터 분석과 머신 러닝 서비스를 개발하고 있다.”


데이터 사이언티스트를 직업으로 삼게 된 계기가 있었나.

“학부 때 들었던 머신 러닝 수업을 통해 자연스레 데이터 분석과 머신 러닝 쪽에 흥미를 갖게 됐다. 머신 러닝은 경험적 데이터를 기반으로 학습하고 예측을 수행하며 이를 위한 알고리즘을 연구하고 구축하는 기술이다. 쉽게 말해 사람이 학습하는 과정을 수학적으로 모델링해, 기계한테 똑같이 학습시켜 기계가 답을 내릴 수 있게 하는 과정이다. 그게 재미있어서 대학원에서는 데이터 마이닝을 전공했다.”


뱅크샐러드 데이터랩에 오기 전에는 어떤 일을 했나.

“대학원에서는 엄청나게 많은 데이터를 어떻게 계산하는지 문제를 푸는 일을 주로 했다. 하지만 접근할 수 있는 데이터가 제한적이었다. 인터넷에 공개돼 있거나 일반기업과 함께 과제를 수행하면서 기업에서 얻을 수 있는 데이터를 활용해야 했다. 연구소에서는 실제 데이터를 얻기 어려웠기 때문에 ‘재미있는 걸 하려면 기업에 가야겠다’는 생각이 들어 대기업 연구소를 선택하게 됐다. 하지만 대기업 연구소도 신입사원이 볼 수 있는 데이터가 제한적이었다.”


레이니스트의 어떤 점이 마음에 들었나.

“대기업 연구소에서 일하면서 차라리 서비스하는 기업이 낫겠다는 생각이 들더라. 레이니스트에 재미있는 데이터가 많았다. 금융데이터를 모으는데, 그 안에는 금융상품도 있고, 어떤 사람의 자산이나 카드내역 등도 있다. 금융데이터는 돈과 관련된 데이터이기 때문에 사람의 관심사가 잘 반영돼 있다. 이런 데이터들을 분석해보면 재미있고 가치 있는 것을 만들 수 있을 거라는 생각이 들었다.”


레이니스트 데이터랩에서 이룬 성과를 평가한다면.

“데이터를 분석하면서 중요하다고 생각하는 게 모으고 있는 데이터를 잘 정제하는 것이다. 뱅크샐러드는 스크래핑 방식으로 카드사, 은행, 증권사 등에서 데이터를 긁어온다. 컴퓨터가 보기에는 그냥 텍스트다. 그 텍스트가 어떤 의미인지 잘 모른다. 컴퓨터는 어떤 사람이 커피숍을 자주 가는지, 쇼핑몰을 자주 가는지 알 수가 없다. 그걸 정리하는 작업을 데이터 팀에서 한다. 예를 들어 스타벅스커피코리아는 커피전문점이니까 커피 결제내역으로 인식시키는 작업을 한다.”


하루일과가 궁금하다. 

“하루를 시작하면서 스탠드업 미팅을, 하루를 마무리 하면서 클로징 미팅을 한다. 팀원들끼리 각자 할 일을 공유하고 어떤 어려움이 있는지 체크하면서 커뮤니케이션하는 시간이다. 레이니스트 전체 구성원은 스프린트라고 해서 일주일 단위로 월요일에 계획을 세우고 금요일에 회고를 한다. 회고할 때는 ‘했다, 안했다’가 아니라 이걸 어떻게 했으면 더 잘했을지 토의한다. 서로 일하는 방식을 공유할 수 있고 이를 통해 더욱 성장하는 것 같다. 우리 데이터 팀은 현재 서비스 성장을 이끄는 성장 팀에 소속돼 실험을 많이 한다. 매주 가설을 세워 실험하고 성과에 대해 측정, 분석해 결과를 평가하는 식이다.”





데이터 사이언티스트가 되기 위해서 갖춰야할 역량은 무엇인가.

“문제해결력과 호기심이 중요한 것 같다. 데이터 관련 교육 과정을 들으면 문제 정의가 잘 돼 있고, 데이터도 잘 주어진다. 그걸 데이터 기법과 머신 러닝 알고리즘을 도입해 푸는 거다. 실제로 회사에 들어가면 문제를 정의한 뒤 그에 맞는 데이터를 수집하고, 정제하는 것부터 시작된다. 문제 정의가 가장 중요하다. 호기심도 많아야 되는데, 데이터를 보면서 이건 왜 그럴까, 저건 왜 그럴까 끊임없이 질문을 하면서 답을 찾아야 한다. 궁금하지 않으면 답이 나올 수 없다.”


일 하면서 어려운 점이 있나.

“컴퓨터 전공자다 보니 알고리즘을 구현해 데이터를 돌려보고 하는 분석은 어렵지 않았는데, 문제 정의가 어려웠다. 문제 정의는 어떤 데이터를 찾아서 가치 있게 만들지 기획하는 것이다. 기획은 문과 분들이 잘한다. 다만 기획을 할 때 코딩이나 간단한 분석 툴은 다룰 줄 알아야 한다. 요즘은 다양한 전공과 직군에서 분석 툴을 배우기 때문에 진입장벽이 높지 않다.”


기업 입사를 위해 포트폴리오는 어떻게 준비하면 좋은가.

“요즘은 데이터 엔지니어링, 데이터 분석, 머신 러닝 등 직군이 세분화 됐다. 만약 데이터 분석 직군 지원자라면 작은 데이터라도 직접 분석하고 인사이트를 도출해 봤는지, 어떤 문제를 풀기 위해 데이터를 모으고 머신 러닝을 돌려 답을 찾았는지 등 실제 경험을 가장 중요하게 본다. 어떤 식으로 접근했고 어떤 해결책을 찾았는지 문제해결력을 보여줄 수 있어야 한다. 데이터를 직접 분석해보는 것만으로도 포트폴리오가 될 수 있다.”


데이터 사이언티스트를 꿈꾸는 친구들에게 조언 한 마디.

“생각만큼 우아한 직업은 아니다. 배울 때는 잘 주어진 데이터와 문제에 기법을 멋있게 도입하면 되는데 실제 회사에서는 데이터를 심는 것부터 시작한다. 잘 심어야 좋은 데이터가 나올 수 있기 때문에 정제도 필요하다. 전처리가 80%라고 보면 된다. 그런 것도 알고 시작했으면 좋겠다. 일 자체가 재밌긴 하다.”


앞으로의 계획이 있다면.

“레이니스트는 전 직군에서 데이터를 보면서 의사결정을 하는 문화가 잘 자리 잡고 있다. 자기주관이 아니라 데이터를 보고 객관적으로 의견을 나눈다. 사내 구성원들이 코딩을 몰라도 탐색해보고 쉽게 답을 찾을 수 있는 인프라를 만드는 것이 목표다. 지금 그런 서비스를 만들기 위해 준비 중이다.”


zinysoul@hankyung.com

사진 이승재 기자

나의 생각 Good Bad

기사에 대한 의견 (1개)