기술기고 6

[기고] 누군지는 잘 모르지만, 뭘 좋아하는 지는 가장 잘 아는 비식별고객 정보

들어가며 데이터를 다루는 직업을 가진 사람들에게 가장 친숙하면서도 중요한 데이터는 고객 데이터이다. 어느 산업이건, 어떤 업무영역이건 고객 데이터 없이 굴러가는 데가 흔치 않고, 대부분 유사한 모양새로 관리되며, 심지어 핵심 데이터 항목은 거의 동일한 형태로 관리되기 때문이다. 이렇게 고만고만해 보이는 고객 데이터도 시대의 흐름에 따라, 그 중요도나 위상, 관리 측면의 주요 이슈가 조금씩 변화해 왔다. 그 옛날 2000년대 초반에 참여했던 시스템 통합 프로젝트에서는, 고객영역은 MASTER성 데이터가 많아 이행 프로그램이 단순하다며 참여 구성원 중 가장 막내인 나에게 맡겼었다. 그 당시에는 데이터 정제를 위한 과감한 의사결정도 가능했고, 관련 이해관계자도 많지 않았는데 이는 당시 해당 기업의 특징도 있겠..

[기고] 데이터 프로파일링의 이해

들어가며 데이터 품질 사업을 수행하다 보면 다양한 데이터 오류를 접하게 된다. 한번은 전 국민이 이용하는 서비스에서 생각지도 못한 데이터 오류가 발견되어 데이터를 시급하게 수정해야 하는 웃지 못 할 일도 있었다. 그럴 때마다 고객은 오류를 찾아낸 그 방법을 묻곤 한다. 지금부터 설명할 데이터 프로파일링은 그 방법 중에 하나로, 업무적인 지식이 없는 경우에도 데이터 오류를 의심해 볼 수 있으며, 관심과 노력만 있다면 어렵지 않게 누구든 자신이 관리하는 데이터 오류를 의심해 보는 방법이다. 본문에서는 진단 SQL과 같은 기술적인 부분은 다루지 않고 데이터 프로파일링의 이해를 돕기 위한 간략한 설명만을 담고자 한다. 1.데이터 프로파일링이란 1-1. 정의범죄 수사기법인 프로파일링의 사전적 의미를 검색해 보면 ..

[기고] 고객 데이터 모델 사례

고객 데이터 모델 이슈 고객 데이터는 거의 모든 조직에서 관리하고 있으며, 조직의 특성에 따라 대상과 범위가 다르고 관리하는 항목이 다를 수 있으나, 가장 중요하게 관리하는 데이터임은 분명하다. 국립국어원의 표준국어대사전은 고객을 "상점 따위에 물건을 사러 오는 손님"으로, 위키백과는 "고객(顧客)은 경제에서 창출된 재화와 용역을 구매하는 개인이나 가구를 일컫는다."로 정의했다. 어떤 기업에서는 상품/서비스 등을 직접 구입/계약한 고객뿐 아니라 구매 의사가 있는 고객도 대상으로 포함하는 등 고객의 개념과 대상을 기업마다 다르게 정의하고 있다. 조직에서 관리하는 고객 데이터는 고유/특성(나이,성별), 주소/연락처, 학력/경력, 재산/신용, 고객관계, 고객접촉 신용/마케팅정보활용 등 다양하다[그림1]. [그..

[기고] EDW Keynote Speech

"The Transformation To Data-Driven Business Starts Here."비즈니스 데이터 기반을 위한 전환이 여기에서 시작됩니다. Enterprise Data World(이하 EDW)는 Dataversity(www.dataversity.net)에서 주최하는 데이터 관리 교육 컨퍼런스이다. 매년 다른 도시에서 개최되며 올 해는 2017년 4월, 미국 아틀란타에서 6일동안 진행되었다. EDW 2017은 데이터와 관련된 다양한 20여가지의 기술을 주제로 매일 10~20여개의 세션이 진행되었다. 특히 이번 2017 EDW는 NoSQL, Governance and Stewardship, Data and Information Quality 등을 주제로 한 세션의 비중이 많았다. [그림1..

[기고] 빅데이터 활용을 위한 비식별화 전략

비식별화 왜 필요한가? 기업들은 데이터가 중요하다는 것을 아주 오래 전부터 알고 그것을 관리하고 보관해 왔습니다. 이렇게 소유한 비즈니스에서 발생하는 정형 데이터 뿐 아니라 로그, 센서 등 비정형 데이터까지 관심을 갖게 되기까지 얼마 걸리지 않았습니다. 또 어떤 기업들은 비정형 데이터에 더 관심을 갖고 아무도 모르게 수집해 온 것도 사실입니다. 이제는 더 이상 기업 내 데이터만을 분석하였던 과거와는 달리 서로 앞다퉈 다른 기업들과 데이터를 주고 받아 영역을 확장하는 것만이 경쟁력이 있다고 믿는 시대에 와 있습니다. 하지만 데이터를 공유하려고 기를 쓰는 기업들 앞에 “개인정보보호법”이라는 커다란 장벽이 존재했습니다. 개인정보에 대해 개인의 동의 없이 제3자에게 제공할 경우 법적인 문제가 발생할 수 밖에 없..

[기고] 제4차 산업혁명 시대의 데이터 기반 의사결정 체계 - 하편

배경열 (비투엔 기술이사/전문위원)차 례 1. 서론 2. 4차 산업 혁명의 도래 3. 기업의 정보환경 구조 – 정보의 사각 지대 4. 데이터 기반 의사결정 체계 5. 결론 제4차 산업혁명 시대의 데이터 기반 의사결정 체계 상편 보기 4. 데이터 기반 의사결정 체계그렇다면 기업은 어떻게 효율적인 데이터 기반 의사결정 체계를 갖출 수 있을까? 첫 번째, 지피지기면 백전백승이다. 적을 알기 전에 먼저 나를 “사실(Data)” 기반으로 이해하는 것이 중요하다. 기업은 영위하는 사업에 따라 다양한 정보 자원을 운영한다. 기업을 운영하는데 필수적인 회계 관리, ERP 시스템을 비롯하여 영업, 마케팅, VOC 등 수없이 다양한 시스템을 운영하고 있으나 각각의 시스템에서 생산된 데이터는 해당 시스템 내에서만 고립되어 ..