본문 바로가기

전공/기기분석

1.2 Analytical approach (분석적 접근)

1.2 Analytical approach

 

 과학을 하기 위해서는 분석이 필요합니다. 어떤 현상이라던지 물질에 대해서 말이죠. 매우 중요하기 때문에 아무렇게나 하면 안됩니다. 여기서 통계가 필수입니다. 이번 장에서는 어떻게 분석이 진행되는지 다루도록 하겠습니다.

 

* Analysis step

분석의 절차는 다음과 같습니다.

 

(1) 문제에 대해 정의하고 분석 방법 디자인

 

(2) 분석할 것에 대해 샘플링 ex) 통계를 내기 위한 표본 집단

 

(3) sample preparation (샘플을 준비해야 합니다.)

 

(4) 측정 실행

 

(5) 데이터 평가

 

(6) 방법에 대한 유효성 검사

 

(7) 문서화

 

 잘 이해가 되지 않으실 분들을 위해 예를 들어 설명을 드리겠습니다. 만약 새로운 조성으로 합금을 만들었다고 해볼게요. 원하는 물성이 만들어졌는지 확인을 해야겠죠? 인장 강도가 100 Gpa이 나오는 것을 예측을 했다고 해보고 분석을 한다고 가정하겠습니다. (1)을 보겠습니다. 이 경우, 인장 강도가 100 Gpa이 나오는지가 문제입니다. 그리고 이것을 분석하려면 인장 강도 시험기로 분석을 하면 되겠죠? 그 다음 단계인 (2)에서 샘플링을 해야 합니다. 무슨 말이냐 하면 합금을 딱 한개만 만들고 인장 강도를 분석해봤자 의미가 없습니다. 원하는 대로 디자인이 되었을 수도 있고 아닐 수도 있는데 하나로만 물성을 판단한다면 오차가 매우 커질 수 있기 때문입니다. 그렇다면 여러개를 만들어서 테스트를 해봐야 합니다. 이것을 샘플링이라고 하죠. (3) 샘플 준비를 거쳐서 (4) 인장강도를 측정합니다. 그리고 (5) 통계적 방법을 거쳐 데이터를 평가합니다. 인장강도의 평균은 얼마인지, 표준편차는 얼마인지 등등을 말이죠. 그 다음 (6) 알맞은 방법으로 측정이 이루어졌는지 유효성을 검사하고 맞다면 (7) 기록을 남깁니다. 연구논문이라던가 특허 등등 이겠죠? 

 

 여기서 가설 검증이라는 개념을 설명 드릴게요. 과학은 가설 검증으로 발전한다고 볼 수 있습니다. 예를 들어 갈릴레이가 지동설을 주장했을 때의 상황을 생각해보겠습니다. 그 당시 주된 가설은 지구가 고정되어 있고, 하늘이 움직인다는 천동설이었습니다. 그것을 주장할 때의 근거는 해나 달, 또 다른 천체들의 움직임의 관찰을 통해서 이루어졌습니다. 그러나 갈릴레이는 수성의 움직임을 관찰하고 천동설은 틀렸다 지구가 움직이는 것이고, 태양이 고정되어 있다 라고 주장합니다. 지금은 이것이 명확한 사실로 알려져있지만 그 당시만 해도 기존 천동설이 틀렸다는 것을 증명한 새로운 가설이었습니다. 이처럼 과학은 기존 가설을 깨뜨리려는 노력을 통해 발전해 나갑니다. 

 

 가설 검증을 하면 두 가지 종류의 결과가 나타납니다. 귀무 가설을 reject 하거나, 귀무 가설을 reject 하는 것에 실패하거나 입니다. 위에 예를 든 일화에서의 귀무 가설은 천동설입니다. 즉, 태양이 움직인다는 것이 귀무 가설입니다. 갈릴레이는 귀무 가설을 reject 하는 것에 성공했습니다. 즉, 가설 검증의 목표는 귀무 가설을 reject 하는 것에 있습니다. 귀무가설을 reject 하는 것에 실패한다면 기존 가설은 더욱 확고한 위치에 올라서겠죠. 하지만 명심해야 할 것이 있습니다. 우리는 이론을 '절대' 증명해내지 못합니다. 아인슈타인의 상대성이론이 '이론' 몇십년 동안 이론이라고 불리는 이유입니다. 단지 우리는 이론이 틀렸다는 것만 증명할 수 있습니다. 언제든 이론이 틀렸다는 증명이 나타날 수 있음을 명심해야 합니다. 과학자라면 말이죠. 모든 과학이 이렇게 발전해왔다고 해도 무방합니다. 지동설이 그랬고, 만유인력의 법칙이 그랬고, 상대성이론이 그랬고, 양자역학도 이렇게 탄생했습니다.

 

 1.3. Basic statistics and data handling

 

 분석에 통계를 이용하는 이유를 여기서 설명 드리겠습니다. 모든 측정은 불확실이 존재합니다. 우리가 몸무게를 잰다면 보통 소수점 첫째자리 또는 둘째자리 까지 측정을 합니다. kg 단위로 말이죠. 하지만 사실 우리 몸무게는 그렇지 않습니다. g 단위로 측정한다면 훨씬 더 자세한 몸무게를 알 수 있겠죠. 그러나 이것도 정확한 몸무게의 측정은 아닙니다. 아무리 섬세한 기계로 측정한다고 하더라도 오차는 분명 생깁니다. 잴 때마다 계속 바뀔 수도 있겠죠. 그러나 저희 몸무게의 절대적인 값은 존재합니다. 측정할 수 없을 뿐입니다. 따라서 우리는 이러한 측정기기의 불확실성을 나타내야 합니다. 이러한 통계 방법은 우리 일상 어디에나 존재합니다. 새로운 노트북이 출시되었을 때도 물품의 세부사항을 보면 항상 뒤에 오차 값이 적혀 있습니다. 오차 0.1kg 이런 식으로 말이죠. 가장 기본적인 통계는 평균과 표준편차를 나타내는 것입니다. 그리고 신뢰구간을 표시해주면 더욱 좋겠죠. 신뢰구간은 범위로서 존재합니다. 이것도 예를 들어 설명 드리겠습니다. 핸드폰의 무게가 249~251g 범위에서 신뢰수준 99%이다. 라고 한다면 많은 핸드폰 중 하나의 무게를 측정할 때, 249~251g 안에 들어갈 확률이 99% 라는 것입니다. 이해가 가시나요? 이렇게 통계를 사용해서 기록을 한다면, 보는 사람이 이 데이터는 믿을 수 있다 라고 생각할 수 있습니다.

신뢰 구간 그래프-출처: 위키피디아(confidence interval)

 이렇게 통계를 사용하면 분석적 방법을 효율적으로 디자인할 수 있기 때문에 필수적인 사항입니다. 연구를 하는 사람들은 꼭 갖춰야 할 소양입니다. 이번 포스팅은 여기까지 쓰고 다음 노트에서는 1.3.2 부터 이어서 작성하겠습니다.