빅데이터 분석기사

[빅데이터 분석기사] 빅분기 실기 단답형 연습문제 (7)

jooona 2022. 11. 4. 20:34
반응형

각 문제의 정답은 바로 문제 별로 하단에 존재하는 [더보기]를 누르시면 확인할 수 있습니다.


1. 다차원 통계 데이터를 사람의 얼굴 이미지를 이용하여 시각적으로 표현하는 방법은?

 

더보기

체르노프 페이스

 

 

2. 지도 학습 방법 중 하나로, 서로 다른 분류에 속한 데이터 간의 간격을 최대로 하는 초평면을 찾아 데이터를 분류하는 모델은?

 

 

 

3. 표본 추출 방법 중 모집단을 여러 소군집으로 나누고, 일정 수의 소군집을 무작위로 표본 추출한 다음, 추출된 소집단 내의 구성원들을 모두 조사하는 방법은?

 

더보기

군집 추출법

 

@참고

- 층화 추출법: 모집단에서 각 계층을 고루 대표할 수 있도록 유사한 원소끼리 층을 나누어 각 층에서 무작위로 추출하는 방법.

 

 

4. 비정상 시계열을 정상 시계열로 바꾸기 위해 연속하는 두 항의 차를 구하는 방법을 뜻하는 용어는?

 

더보기

차분(Difference)

 

@참고 

- 시계열(Time Series): 시간 순서대로 발생한 데이터의 수열

- 정상성: 데이터가 정규 분포 등의 특정 분포를 따르는 것을 의미

- 2차 차분: 차분을 구한 데이터 역시 정상성이 없는 경우, 한 번 더 차분을 구하는 작업

 

 

5. 데이터 값에 따라 지도의 면적을 왜곡하여 데이터를 시각화하는 방법은?

  

더보기

카토그램

 

 

6. 텍스트 마이닝의 전처리 과정에서 어형이 변형된 단어로부터 접사 등을 제거하고 그 단어의 어간을 분리해내는 것을 의미하는 용어는?

 

더보기

어간 추출(Stemming, 스테밍)

 

 

7. 모델의 성능을 평가할 때 사용하는 지표 중 하나로, 예측 값이 실제 관측 값을 얼마나 정확히 예측했는지를 행렬의 형태로 표현한 것을 뜻하는 용어는?

 

더보기

혼동 행렬(Confusion Matrix)

 

 

8. 함수의 기울기를 구한 뒤, 경사의 반대 방향으로 계속 이동시켜 극값에 이를 때까지 반복시킴으로써 최종적으로 최소 함숫값을 갖도록 하는 독립 변수의 값을 찾는 방법을 뜻하는 용어는?

 

더보기

경사 하강법(Gradient Descent)

 

 

9. 이상 값을 판단하기 위한 척도 중 하나로, 데이터의 4 등분한 사분위수 중 75% 지점의 값과 25% 지점의 값의 차이를 일컫는 말은?

 

더보기

IQR(Inter Quantile Range)

 

 

10. 앙상블 기법을 사용한 머신 러닝 방법 중 하나로 이전 모델의 오차를 보완하는 방향으로 다음 모델에 가중치를 적용하는 방법으로 약한 학습기들을 순차적으로 결합하여 예측 혹은 분류 성능을 높이는 방법은?

 

더보기

부스팅 

 

@참고

- 배깅: 훈련 세트의 서브셋을 중복을 허용하여 무작위로 구성하여 하나의 분류기를 여러 번 학습시키는 방법

- 페이스팅: 훈련 세트의 서브셋을 중복을 허용하지 않고 무작위로 구성하여 하나의 분류기를여러 번 학습시키는 방법

- 스태킹: 개별 알고리즘으로 예측한 데이터를 최종 데이터로 만들고, 이를 기반으로 다시 예측을 수행

 

 

 

* 연습문제 더보기

빅분기 실기 단답형 연습문제 (1) : https://jooona.tistory.com/222
빅분기 실기 단답형 연습문제 (2) : https://jooona.tistory.com/223
빅분기 실기 단답형 연습문제 (3) : https://jooona.tistory.com/224
빅분기 실기 단답형 연습문제 (4) : https://jooona.tistory.com/225
빅분기 실기 단답형 연습문제 (5):  https://jooona.tistory.com/226
빅분기 실기 단답형 연습문제 (6):  https://jooona.tistory.com/227

 

혹시 문제 또는 정답에 수정이 필요한 내용이 있다면 댓글로 남겨주시면 감사하겠습니다!

반응형