빅분기 출제예상문제 오답노트
01. 페타바이트(Peta Byte)에 1byte의 아스키 코드를 얼마 만큼 넣을 수 있는가?
① 2의 40승
② 2의 50승
③ 2의 60승
④ 2의 70승
컴퓨터에서 처리하는 데이터의 단위
단위 | 10진수 | 2진수 | 같은 값 |
비트(bit) | – | – | 0 또는 1 |
바이트(byte) | – | – | 8bit |
킬로바이트(KB) | 103 | 210 | 1,024byte |
메가바이트(MB) | 106 | 220 | 1.024KB |
기가바이트(GB) | 109 | 230 | 1,024MB |
테라바이트(TB) | 1012 | 240 | 1,024GB |
페타바이트(PB) | 1015 | 250 | 1,024TB |
엑사바이트(EB) | 1018 | 260 | 1,024PB |
제타바이트(ZB) | 1021 | 270 | 1,024EB |
요타바이트(YB) | 1024 | 280 | 1,024ZB |
정답 : ②
02. 데이터에 관한 설명 중 맞는 것을 고르시오.
① 정보는 의미를 가지고 있지 않은 순수한 수치나 기호에 해당한다.
② 지혜는 근본 원리를 이해하고 도출시키는 창의적인 아이디어를 말한다.
③ 지식은 데이터 처리기를 통해 가공하고 의미를 부여하여 얻어진 결과이다.
④ 정보 패턴을 이해하여 상호 연결하고 결과를 예측한 것이 지혜이다.
DIKW 피라미드
Wisdom(지혜) | 근본 원리에 대한 깊은 이해를 바탕으로 도출되는 창의적 아이디어
예) 다른 커피도 A카페보다 B카페의 가격이 저렴할 것이라 판단 |
Knowledge(지식) | 상호 연결된 정보 패턴을 이해하고 이를 토대로 예측한 결과물
예) B카페에서 라떼를 산다. |
Information(정보) | 데이터의 가공 및 상관관계 간 이해를 통해 패턴을 인식하고 그 의미를 부여한 데이터
예) 오늘 기준 카페별 라떼 가격 : A카페 > B카페 |
Data(데이터) | 존재 형식을 불문하고 타 데이터와의 상관관계가 없는 가공하기 전의 순수한 수치가 기호
예) 라떼 가격 비교 : A카페 3,500원, B카페 2,500원 |
① 데이터
② 지혜
③ 정보
④ 지식
정답 : ②
03. 빅데이터가 갖는 가치 중 혁신 추구에 해당하는 것을 모두 고르시오.
가. 데이터 중심 혁명
나. 새로운 산업 창출
다. 플랫폼 매개체
라. 산업 생산성 향상
마. 소비자 맞춤형 서비스
바. 의사결정 지원
① 가, 나
② 나, 다, 라
③ 가, 나, 다
④ 가, 나, 라, 마, 바
빅데이터의 가치
구분 | 빅데이터의 가치 |
혁신 추구 | 데이터 중심 혁신, 새로운 산업 창출, 플랫폼 매개체 |
생산성 향상 | 산업 생산성 향상 |
경쟁력 확보 | 소비자 맞춤형 서비스, 의사결정 지원, 비즈니스 모델의 혁신 |
미래 대응 | 상황 분석, 환경 탐색 |
정답 : ③
04. 기업은 데이터 거버넌스 구축으로 데이터의 가용성, 유용성, 통합성, 보안성 등의 확보가 가능하다. 다음에서 설명하는 데이터 거버넌스 체계로 알맞은 것은?
데이터 표준 용어 설정, 명명규칙 수립, 메타 데이터 구축, 데이터 사전 구축, 데이터 생명주기 관리 등의 업무로 구성되며, 데이터 표준 용어는 표준 단어 사전, 표준 도메인 사전, 표준 코드 등으로 구성되어 사전 간 상호 검증이 가능한 점검 프로세스를 포함한다.
① 데이터 표준화
② 데이터 관리 체계
③ 저장소 관리
④ 표준화 활동
데이터 거버넌스 개요
구분 | 항목 |
중요 관리 대상 | 마스터 데이터, 메타 데이터, 데이터 사전, 빅브라더 |
구성 요소 | 원칙, 조직, 프로세스 |
데이터 거버넌스 체계 | 데이터 표준화, 데이터 관리 체계, 저장소 관리, 표준화 활동 |
정답 : ①
05. 다음 중 데이터베이스의 특징으로 가장 부적절한 것은?
① 데이터베이스는 동일한 내용의 데이터가 중복되어 있지 않다.
② 데이터베이스는 여러 사용자가 서로 다른 목적으로 데이터를 공동으로 이용할 수 있도록 구성되어 있다.
③ 데이터베이스는 대용량이고 구조가 간단하여 사용하지 용이하다.
④ 데이터베이스는 변화하는 데이터로 데이터 삽입, 삭제, 갱신을 하여도 항상 현재의 정확한 데이터를 유지해야 한다.
데이터베이스의 특징 중 하나인 공용 데이터는 여러 사용자가 서로 다른 목적으로 데이터를 공동으로 이용한다는 것을 의미하며 대용량화도고 구조가 복잡한 것이 보통이다.
정답 : ③
06. 다음 중 빅데이터 가치 산정이 어려운 이유로 적절하지 않은 것은?
① 데이터 재사용의 일반화로 특정 데이터를 언제 누가 사용했는지 알기 힘들기 때문이다.
② 빅데이터는 기존에 없던 가치를 창출하기 때문이다.
③ 분석 기술의 발전으로 현재는 가치가 없는 데이터라도 추후 거대한 가치를 지닌 데이터가 될 수 있기 때문이다.
④ 빅데이터 전문인력의 증가로 다양한 분야에서 활용되기 때문이다.
빅데이터 전문인력의 증가와 가치 산정과는 관련이 없다.
정답 : ④
07. 세계 산업 구조는 데이터를 핵심 동력으로 하여 진화하고 있다. 데이터 산업의 진화 순서로 옳은 것은?
① 데이터 처리 → 데이터 통합 → 데이터 연결 → 데이터 분석 → 데이터 권리
② 데이터 처리 → 데이터 통합 → 데이터 분석 → 데이터 연결 → 데이터 권리
③ 데이터 처리 → 데이터 연결 → 데이터 통합 → 데이터 분석 → 데이터 권리
④ 데이터 처리 → 데이터 연결 → 데이터 분석 → 데이터 통합 → 데이터 권리
데이터 산업의 진화
진화 과정 | 데이터 산업 설명 |
데이터 처리 시대 | 컴퓨터 프로그래밍 언어를 이용하여 대규모 데이터를 빠르고 정확하게 처리하는 시대. 프로그래머들의 주된 역할 |
데이터 통합 시대 | 데이터 일관성을 확보하고 무결성을 유지하여 데이터를 저장, 공유, 통합하는 시대. 데이터 통합 성능 향상을 위해 DBMS 활용. 데이터 웨어하우스(Data Warehouse) 도입 |
데이터 분석 시대 | 데이터의 폭발적 증가로 대규모 데이터를 저장, 처리할 수 있는 분산시스템을 활용하는 시대. 데이터 마켓플레이스(Data Marketplace)와 데이터 레이크(Data Lake) 활용 |
데이터 연결 시대 | 기업 또는 기관, 사람, 사물 등 모든 것이 서로 연결되어 상호 작용하면서 데이터를 주고받는 시대. 오픈 API(Open Application Programming Interface)로 서비스와 데이터를 개방 |
데이터 권리 시대 | 데이터의 원래 소유자인 개인이 자신의 데이터에 대한 권리를 보유하고 있으며 스스로 행사할 수 있어야 한다는 생각이 사회적으로 공감대가 부각되어는 시대 |
정답 : ②
08. 분석성숙도 평가에서 항목에 속하지 않는 것은?
① 비즈니스
② 조직, 역량
③ 법/제도
④ IT 자원
분석성숙도 평가의 3가지 기준은 비즈니스, 조직/역량, IT 자원이다.
정답 : ③
09. 데이터 과학자의 3가지 역량으로 틀린 것을 고르시오.
① IT전문성
② 프로젝트 관리
③ 분석 역량
④ 비즈니스 분석 역량(컨설팅 역량)
프로젝트 관리 역량은 프로젝트 관리자의 직무이다.
정답 : ②