통계학

통계학이란?

미이리 2022. 10. 17. 20:36
반응형
SMALL

 박사 과정을 시작하면서 Bioinformatics라는 학문도 공부를 하게 되었다. 아무래도 bioinformatics는 컴퓨터로 작업을 하는 것이고 수치들을 통해 생물학적인 개념을 잡는 것이다보니, 통계학을 필수로 공부를 하게 되었다. 오늘은 이런 통계학에 대해 간단하게 정리하고, 나에게 가장 필요한 통계학은 어떤 것인지 알아보려한다.

 

통계학이란 무엇인가?

통계학은 자연과학 분야 뿐 아니라 사회과학 분야 등 정말 다양한 분야에서 없어서는 안되는 학문이다.

통계학은 데이터를 통해서 통계량이나 그림, 표로 정리하여 그 데이터의 특징을 파악하는 학문이다.

 

통계학의 종류

통계학에도 다양한 종류가 있다. 이미 우리의 생활에 녹아있는 통계학이 정말 많다. 어떤 것들이 있는지 알아보려한다.

 

  1. 기술통계학

기술통계학은 표본 크기가 큰 데이터를 대상으로 한 통계학이다. 데이터의 특징과 경향을 파악하는 데 사용된다.

데이터의 성질을 기술하는 것을 목표로 하고 있는 것이다. 

주로 인구주택총조사와 같이 엄청난 데이터를 이용하여 그 특징과 속성을 나타낼 수 있게 해주는 학문이다.

   

   2. 추측통계학

 

추측통계학은 모집단 내에서 표본을 택하고, 그 표본을 조사함으로써 모집단에 대해 추측하는 방법이다. 

이 추측통계학이 내가 전공하고 있는 생물학과 가장 관련이 깊다. 예를 들어, 신약개발을 위해서는 초기 세포실험부터 동물실험 그리고 임상시험에 들어가게 된다. 이때 세포실험부터 동물실험, 임상시험 모두 아주 적은  표본에 약을 투여하고 그 약의 기전과 효과를 예측하는 것이다. 아마 이 통계학 카테고리에 가장 세세하게 정리하게되는 것이 이 추측통계학이지 않을까 생각된다.

 

   3. 실험계획법

 

 실험을 성공시키기 위한 방법으로 시간과 공간을 절약하는 방법까지 있다고 한다. 실험 순서는 어떻게 할 것인지, 실험을 할 사람이나 표본의 수는 얼마가 나을지 이러한 것들을 계획하기 위한 통계이다. 

 

   4. 중회귀분석 . 다변량 분석

 

많은 변수를 한번에 처리하는 방법을 통틀어서 이야기한다. 복잡한 문제를 단순하게 만들어서 예측하고 평가하는 방법이다. 주로 검사 결과로 질환을 진단하는 것도 이 중회귀분석 다변량 분석에 포함된다. 

 

   5. 베이즈 통계학

 

지식과 경험, 새로운 데이터를 유연하게 통합할 수 있는 통계학이다. 서서히 학습시키면서 점점 정밀도를 향샹시킬 수 있다고한다. 즉, 인공지능도 이러한 베이즈 통계학에 포함된다고 볼 수 있다.

 

분명 학부시절 "생명통계학"이라는 전공을 들었고, 지금까지 실험을 하고 논문을 쓰면서 '유의하다'와 같은 이야기를 많이 적었다. p-value값과 같은 것도 구할 줄 알고, 통계학을 하기 가장 좋은 프로그램인 'R'도 다룰 줄 안다. 하지만 통계학 언어의 정확한 의미에 대해서는 잘 모르고 있고, 공식이 어떻게 되는지도 자세하게 알고 있는 것이 아니다. 지금부터 하나하나 정리해 나가면서 통계학 언어들과 내가 지금 사용하고 있는 통계 공식들이 무엇을 뜻하는지 알아보려한다.

반응형
LIST