빅데이터 분석기사

[빅데이터 분석기사] 빅분기 실기 단답형 연습문제 (4)

jooona 2022. 11. 3. 20:55
반응형

각 문제의 정답은 바로 문제 별로 하단에 존재하는 [더보기]를 누르시면 확인할 수 있습니다.


1. SAS사 주도로 만들어진 데이터 분석 방법론 중 하나로, 기술과 통계를 중심으로 제작되었으며, 5단계의 프로세스로 이루어진 방법론의 이름은?

 

더보기

SEMMA

 

@참고

- KDD: 데이터를 중심으로 insight 발굴을 위한 절차와 단계를 정의

- CRISP-DM: 비즈니스 이해를 바탕으로 데이터 분석 목적의 6단계로 진행  

 

 

2. 초기의 데이터셋을 랜덤 하게 훈련 데이터셋과 테스트 데이터셋으로 나누어, 훈련 데이터셋을 이용해 분석 모형을 구축하고 테스트 데이터셋을 이용하여 분석 모형의 성능을 평가하는 기법은?

 

더보기

홀드 아웃 교차검증

 

@참고

- K-Fold 교차검증: 교차 검증 방법 중 하나로, 데이터를 k개로 분할한 뒤, k-1개를 학습용 데이터로, 1개를 평가용 데이터로 사용하며, 이를 k번 반복하여 k개의 성능 지표를 얻어내는 방법

 

 

3. 전통적인 관계형 데이터베이스에서 벗어나 트리, 그래프 등의 다양한 방법으로 데이터를 저장하며, 고정된 스키마를 갖지 않는 데이터베이스는?
 

더보기

NoSQL

 

 

4. 비지도 학습의 알고리즘 중 하나로, 군집의 중심을 지속적으로 업데이트해주고 군집을 새로 설정하는 사이클을 반복하면서 가장 최적의 군집을 찾아나가는, 데이터를 K 개의 군집으로 묶기 위해 사용되는 알고리즘은?

 

더보기

K-평균 알고리즘(K-means Clustering Alorithm)

 

 

5. 수집한 데이터를 다양한 각도에서 관찰하고 이해하는 과정으로,  문제 정의 단계에서 미처 발견하지 못한 다양한 패턴을 발견하고 이를 바탕으로 기존의 가설을 수정하거나 새로운 가설을 추가할 수 있도록 하여주는 과정은?

 

더보기

EDA(탐색적 데이터 분석)

 

 

6. 머신러닝 모델에서 과대 적합을 방지하기 위하여 0부터 1 사이의 확률로 뉴런을 제거하고 학습을 진행하는 방법을 뜻하는 용어는?

 

더보기

드롭아웃

 

 

7. 모든 개체에 대한 거리 평균을 구하면서 군집 간의 거리를 계산하는 방법으로, 계산량이 불필요하게 많아질 가능성이 존재하는 이 군집 간 거리 측정 방법의 이름은?

 

더보기

평균 연결법

 

@참고

- 최단 연결법: 두 군집 간 거리의 최솟값을 이용

- 최장 연결법: 두 군집 간 거리의 최댓값을 이용

- 중심 연결법: 두 군집 간 중심 사이 거리를 이용

- 와드 연결법: 군집 내 오차 제곱합을 이용    

 

 

8. 지도 학습 시 알고리즘이 예측한 값과 실제 정답의 차이를 비교하기 위한 함수를 뜻하는 용어는? 

 

더보기

손실 함수(Loss Function)

 

 

9. 자신에 관한 정보가 언제 누구에게 어느 범위까지 알려지고 또 이용되도록 할 것인지를 정보 주체가 스스로 결정할 수 있는 권리를 뜻하는 용어는? 

 

더보기

개인정보 자기 결정권

 

 

10. 문자 기반의 마크업 언어로써, 데이터를 저장하고 전달할 목적으로 만들어졌으며, HTML과 달리 태그를 직접 정의할 수 있는 언어는? 

 

 

 

 

* 연습문제 더보기

빅분기 실기 단답형 연습문제 (1) : https://jooona.tistory.com/222
빅분기 실기 단답형 연습문제 (2) : https://jooona.tistory.com/223
빅분기 실기 단답형 연습문제 (3) : https://jooona.tistory.com/224
빅분기 실기 단답형 연습문제 (5) : https://jooona.tistory.com/226
빅분기 실기 단답형 연습문제 (6):  https://jooona.tistory.com/227
빅분기 실기 단답형 연습문제 (7):  https://jooona.tistory.com/228

 

혹시 문제 또는 정답에 수정이 필요한 내용이 있다면 댓글로 남겨주시면 감사하겠습니다!

반응형