비투엔 기술기고 87

[기고] 정보시스템 성능 관리 이야기

1. 정보시스템 성능 관리의 필요성정보시스템은 다양한 정보의 제공, 비즈니스 업무 처리 등의 기능을 온라인 상에 제공하여 사용자들이 언제, 어디서든 손쉽게 사용할 수 있는 역할을 담당해왔습니다. 정보시스템을 통한 정보 습득, 업무 처리가 일상화되면서 정보시스템의 예상치 못한 기능 오류나 성능 저하가 발생할 경우 내부적으로는 업무의 진행 지연 및 업무 효율성이 저하되는 결과를 나타낼 수 있고, 외부적으로는 기업 신뢰도 하락, 기업의 매출 감소 등 심각한 영향을 끼칠 수 있습니다. 정보시스템의 성능의 관리는 단순 시스템의 성능 향상뿐 아니라, 비즈니스 성능, 비즈니스 경쟁력 향상은 물론, 고객에게 최상의 서비스 경험을 체험하게 하여 기업의 이미지를 형성시키는 활동으로써 성능 관리를 통해 1. 미래에 발생할 ..

[기고] 퇴직연금 운용에 관하여

몇 년 전에 보험회사의 퇴직연금 프로젝트에서 데이터구조를 설계한 적이 있습니다. 퇴직연금을 다루는 다른 금융기관도 마찬가지지만 데이터 주제영역으로 표현하면 이런 데이터들이 있었던 것 같습니다. 제가 말하려고 하는 주제는 IT와 관련된 내용도 데이터에 관한 내용도 아닙니다. 우리가 가입한 퇴직연금을 어떻게 하면 좀 더 잘 운용할 수 있는지에 대해 같이 고민하는 것도 좋을것 같아 정리해 봤습니다. 우리 회사는 비교적 빠른 시기에 퇴직연금 제도(확정기여형, DC형)를 도입했는데요. 그 동안 회사의 퇴직연금 제도에 대해 깊이 생각한 적도, 어떻게 운용해야 하는지도 관심이 없었습니다. 프로젝트를 통해 퇴직연금 업무에 대한 전반적인 사항을 알게되었고, 무억보다 수익률(적립금)에 대해 관심을 가지게 되었습니다. DC..

[기고] 데이터 품질 보장과 애플리케이션 성능 확보 사이에서

▶ 데이터 중복 메커니즘과 활용 (上) 데이터 중복 특성과 적용전 회에서는 데이터 중복의 필요성과 대응 방안을 논하였다. 데이터 중복이 완전히 제거된 상태로 정보시스템을 구축하는 것이 가장 이상적이지만, 성능 확보를 위해 피할 수 없는 선택이라면 그 특성을 이해하고 적용할 필요가 있다. 이번 회에서는 데이터 중복 방식, 중복 방향, 컬럼 유형별 중복 제약사항 등을 살펴보고자 한다. 참고로, 본 기고에서 언급하는 데이터 중복의 범위는 동일한 데이터베이스 내에서의 중복에 한정함을 밝혀둔다. Data Warehouse 구축 등을 위해 타 데이터베이스로의 복제 등도 넓게 해석하면 데이터 중복이라고 할 수 있으나 본 기고에서는 다루지 않는다. 1. 데이터 중복 방식 데이터는 값에 대한 변형 없이 다른 위치에 복제..

[솔루션 리뷰] 데이터 품질관리 솔루션 SDQ

최근 들어, 빅데이터에 대한 관심으로 데이터의 중요성에 대한 인식이 점차 높아지고, 이를 효과적으로 분석하고 활용하기 위해서는 데이터 품질이 선결요건으로 이해되기 시작했습니다. 특히 공공기관의 경우는 국가 차원의 공공정보 공개, 개방에 대한 정책 추진과 맞물려 품질관리에 대한 관심과 투자가 점차 높아지고 있는 추세입니다. 고품질 데이터 활용에 대한 공감대가 형성되는 상황에서 전사 차원의 산재되어 있는 데이터를 효율적으로 관리하는데 도움을 주는 ‘SDQ’에 대해 설명합니다. 1. SDQ는SDQ는 데이터 품질관리 솔루션으로 스케줄러와 프로파일링 프로세스를 이용하여 진단 룰을 간편하게 적용하고 실행할 수 있습니다. 또한, ‘DQ’ 기능과 ‘META’ 기능의 통합으로 데이터 값 진단 이외에 데이터표준, 데이터구..

[기고] 데이터 중복 메커니즘과 활용

1. 들어가며 얼마 전 오픈한 바 있는 모 차세대 정보시스템 구축 사업의 후반부에 데이터 베이스 성능 문제 해소 방안으로서 '데이터 중복'이 이슈화 된 적이 있었다. 성능 문제들 중에서 데이터 중복 외에는 해소 방법이 없는 경우가 있다. 데이터 중복을 허용하자니 해당 테이블을 대상으로 데이터를 처리하는 응용 프로그램 수정과 데이터를 다시 전환해야 하는 부담이 따랐으므로 관련 담당자들 간 갈등으로 비화되는 상황을 맞이하기도 했다. 앞으로 두 차례에 걸쳐 데이터 중복이 왜 필요하고 데이터 모델러들이 어떻게 대응해야 하는지 살펴보고자 한다. 더불어 데이터의 구조적 의미 또는 업무적 의미에 의해 데이터 중복이 제한되는 특성을 제시하고자 한다. 2. 데이터 중복의 필요성과 대응 최근에 필자는 한 정보시스템 구축 ..

[기고] 빅데이터와 차세대 데이터 웨어하우스 하편

▶ 빅데이터와 차세대 데이터 웨어하우스(상) - 비즈니스 환경 변화와 DW의 적응 몸부림 ▶ 빅데이터와 차세대 데이터 웨어하우스 (하) - 하둡 기반의 DW 참조 아키텍처와 활용 사례 지난 회에서 전통적인 데이터 웨어하우스의 모습과 국내외 환경 간의 차이점, 한계점에 대해 살펴 보았다. 이번 회에서는 다른 측면에서 변화하고 있는 오픈소스 진영의 기술과 이를 어떻게 활용할 수 있는지 한번 살펴 보자. 하둡은 구글의 검색 서비스와 관련되어 등장했다. 검색 서비스에서 발생된 데이터를 손쉽게 값싼 저장 매체에 분산/관리하기 위한 용도로 GFS(Google File System)라든가 맵리듀스 같은 이론이 발표됐고, 2004년에 더그 커팅이 Nutch(너치)에 DFS와 맵리듀스를 실제 적용하면서 하둡이 탄생했다고..

[기고] 빅데이터 활용을 위한 비식별화 전략

비식별화 왜 필요한가? 기업들은 데이터가 중요하다는 것을 아주 오래 전부터 알고 그것을 관리하고 보관해 왔습니다. 이렇게 소유한 비즈니스에서 발생하는 정형 데이터 뿐 아니라 로그, 센서 등 비정형 데이터까지 관심을 갖게 되기까지 얼마 걸리지 않았습니다. 또 어떤 기업들은 비정형 데이터에 더 관심을 갖고 아무도 모르게 수집해 온 것도 사실입니다. 이제는 더 이상 기업 내 데이터만을 분석하였던 과거와는 달리 서로 앞다퉈 다른 기업들과 데이터를 주고 받아 영역을 확장하는 것만이 경쟁력이 있다고 믿는 시대에 와 있습니다. 하지만 데이터를 공유하려고 기를 쓰는 기업들 앞에 “개인정보보호법”이라는 커다란 장벽이 존재했습니다. 개인정보에 대해 개인의 동의 없이 제3자에게 제공할 경우 법적인 문제가 발생할 수 밖에 없..

[기고] 제4차 산업혁명 시대의 데이터 기반 의사결정 체계 - 상편

배경열 (비투엔 기술이사/전문위원)차 례 1. 서론 2. 4차 산업 혁명의 도래 3. 기업의 정보환경 구조 – 정보의 사각 지대 4. 데이터 기반 의사결정 체계 5. 결론 1. 서 론 21세기 ICT기술의 급속한 발전으로 전 세계에서 생산되는 데이터는 기하급수적으로 폭증하고 있다. 네트워크를 통한 데이터 전송 비용, 저장 비용, 처리 비용이 거의 무료에 가까워지면서 공유 경제라는 새로운 개념을 낳았으며 이는 기존 시장의 경계를 무섭게 허물고 있다. 머신 러닝(Machine Learning)에 기초한 구글의 알파고는 방대하게 축적된 데이터를 수백, 수천대의 클라우드 서버를 통해 실시간 시뮬레이션하면서 이세돌 9단을 4:1이라는 압도적인 스코어로 승리했다. 바둑에서 조차 인간의 감과 경험에 의한 의사결정보다..

[기고] 제4차 산업혁명 시대의 데이터 기반 의사결정 체계 - 하편

배경열 (비투엔 기술이사/전문위원)차 례 1. 서론 2. 4차 산업 혁명의 도래 3. 기업의 정보환경 구조 – 정보의 사각 지대 4. 데이터 기반 의사결정 체계 5. 결론 제4차 산업혁명 시대의 데이터 기반 의사결정 체계 상편 보기 4. 데이터 기반 의사결정 체계그렇다면 기업은 어떻게 효율적인 데이터 기반 의사결정 체계를 갖출 수 있을까? 첫 번째, 지피지기면 백전백승이다. 적을 알기 전에 먼저 나를 “사실(Data)” 기반으로 이해하는 것이 중요하다. 기업은 영위하는 사업에 따라 다양한 정보 자원을 운영한다. 기업을 운영하는데 필수적인 회계 관리, ERP 시스템을 비롯하여 영업, 마케팅, VOC 등 수없이 다양한 시스템을 운영하고 있으나 각각의 시스템에서 생산된 데이터는 해당 시스템 내에서만 고립되어 ..

[기고] 빅데이터와 차세대 데이터 웨어하우스 상편

▶ 빅데이터와 차세대 데이터 웨어하우스(상) - 비즈니스 환경 변화와 DW의 적응 몸부림 ▶ 빅데이터와 차세대 데이터 웨어하우스 (하) - 하둡 기반의 DW 참조 아키텍처와 활용 사례 빅데이터가 DW를 대체한다? 최근에 있었던 빅데이터와 데이터 웨어하우스와 관련된 역사를 잠깐 살펴 보자. 데이터 웨어하우스의 아버지라고 불리는 빌 인먼(Bill Inmon) 박사는 “데이터 웨어하우스는 주제 중심적이고, 통합적이고, 시계열적이고, 비휘발적인 데이터 집합으로 의사결정 프로세스를 지원하는 것”이라고 정의했다. 빅데이터가 데이터 웨어하우스를 대체할 수 있다는 의견이 나오자 인먼 박사는 “빅데이터와 데이터 웨어하우스는 전혀 다른 개념이다. 빅데이터는 기술적인 용어이고 데이터 웨어하우스는 아키텍처 용어이므로 빅데이터..