
좋은땅 가이드
우리는 당신과 함께
좋은 책을 만드는
좋은땅 출판사입니다
좋은땅 고객센터
상담 가능 시간
평일 오전 9시 ~ 오후 6시 (점심 시간 12 ~ 1시 제외)
주말, 공휴일은 이메일로 문의부탁드립니다
상세 이미지

책 소개
기업의 비즈니스 방향을 고려한 빅데이터 서비스 플랫폼을 설계하자!
글로벌 대형 기업들은 ‘디지털 전환(Digital Transformation)’을 핵심 현안으로 추진하고 있습니다. 이 과정에서 Data Lake 구축은 가장 중요한 과제 중 하나일 것입니다. 다른 기업들처럼 ‘람다 아키텍처’를 기반으로 하여 하둡 에코시스템을 활용해서 구축하면 되는 것일까요? 아니면 AWS 혹은 Azure의 Public Cloud 서비스를 활용하여 구축하면 되는 것일까요? 우리 기업의 비즈니스에 적합한 Data Lake 아키텍처는 무엇일까요? 이러한 ‘중요한 질문들’에 대한 해답을 얻고자 한다면 이 책을 반드시 읽어야 할 것입니다.
? 빅데이터 참조 아키텍처 (람다 vs. 카파)
? 빅데이터 솔루션 아키텍처 (Cloudera vs. AWS vs. Azure)
? Data Lake 아키텍처 설계 기본원칙
? 단기와 장기 개념 아키텍처의 설계
? 아키텍처 설계 시 주요 의사결정 사항
? 구성요소별 상세 아키텍처 설계
목차
머리말 4
제1장 Data Lake 개요
1. Data Lake의 등장 배경15
2. Data Lake의 중요성22
3. Data Lake의 개념27
4. Data Lake 구성요소29
제2장 Data Lake 참조 아키텍처
1. 빅데이터 참조 아키텍처39
1-1. 람다 아키텍처39
1-2. 카파 아키텍처43
1-3. 참조 아키텍처 간 비교47
2. 빅데이터 솔루션 아키텍처51
2-1. Cloudera Hadoop52
2-2. Cloudera Data Platform59
2-3. AWS Data Lake65
2-4. Azure Data Lake73
2-5. 솔루션 아키텍처 간 비교81
제3장 Data Lake 아키텍처 설계
1. 아키텍처 설계 기본 원칙94
2. 아키텍처 설계 방향99
2-1. 단기 아키텍처100
2-2. 장기 아키텍처107
2-3. 설계 시 주요 의사결정 사항113
3. 구성요소별 아키텍처 설계139
3-1. 데이터 수집 Layer140
3-2. 데이터 적재 Layer149
3-3. 데이터 처리 Layer158
3-4. 데이터 제공 Layer195
3-5. 사용자 Self-Service Layer203
3-6. 데이터 거버넌스 Layer221
맺음말 230
참고자료 239
색인 241