화학진화에 대한 엉터리 확률 계산에 대하여

Lies, Damned Lies, Statistics,
and Probability of Abiogenesis Calculations

Copyright © 1998 by Ian Musgrave
[Last Update: December 21, 1998]

Introduction

모든 사람들이 "우연히 어떤 효소라도 발생할 가능성은 거의 없다"는 말을 하는 사람을 자주 보게 될 것이다. 이들은 천체물리학자 프레드 호일이 한 그것에 대한 인상적인 확률계산도 인용할 것이고. 보렐의 법칙이라고 부르는 즉 생명이 확률적으로 탄생할 가능성이 없다는 말로 더 한층 강조할 것이다. 프레드 호일을 비롯한 사람들은 이것에 대해서 몇가지 오류를 범하고 있다.

 

창조과학자들이 주장하는 "이것은 정말 불가능하다"라는 계산의 문제점

1) 그들은 현재 단계의 단백질, 혹은 박테리아 전체의 단백질 전체가 우연히 발생할 가능성에 대해서 말한다. 이것은 화학진화가 전혀 아니다.

2) 그들은 이세상에는 생명체에는 한정된 갯수의 단백질이 그리고 그 단백질이 정해진 서열만으로 존재해야 하는 것으로 생각한다.

3) 그들은 확률을 계산할 때 순차적 시도만 생각하지 동시에 일어날 가능성은 고려하지 않는다.

4) 그들은 확률의 계산의 의미하는 바를 이해하지 못하고 있다.

5) 그들은 심각하게 무작위 서열의 그룹에서 보여지는 기능을 가지고 있는 효소/라이보자임의 갯수를 작게 생각한다.

나는 사람들에게 이러한 다양한 오류를 지적하고 이렇게 확률로 화학진화를 계산하는 것이 가능하지 않은 가를 보여주겠다.


A primordial protoplasmic globule

만약에 300개의 아미노산으로 이루어진 단백질(예를들어 carboxypeptidase)가 우연히 생길 가능성을 계산해보면 (1/20)300 혹은 1/(2.04x10390) 이라고 계산을 한다. 이것은 분명히 놀랄 만큼 작은 것이고 사실 일어날 것 같지 않다고 생각하게 된다. 거기다가 400개 혹은 그 이상의 단백질이 더 필요하고 그것에 대해서 확률을 계산하다 보면 머리가 돌아 버릴 지경이 될지도 모른다. 이런 계산은 아무리 작은 생명체라도 만들어지는 것은 완전히 불가능해 보인다. 그러나 이것은 완전히 잘못된 내용이다.

[Ur cell figure]

첫째로, 생물학적인 중합체(polymer)가 단량체(monomer)에서 만들어지는 과적은 화학과 생화학적 반응이지 무작위로 되는 것은 아니다.

두 번째, 시작할 때의 전제 전체가 틀렸는데 현대의 화학진화 이론은 최초의 생명체를 훨씬 간단한 것으로 생각한다. 이것은 현재의 프로토박테리아 혹은 프리프로토박테리아(오파린이 protobiont라고 하고 Woese는 progenote라고 한것)보다 더 간단하다고 생각할 뿐 아니라 간단한 단백질의 갯수도 30-40 subunit을 넘지 않을 것으로 생각한다. 이러한 단순한 분자들이 서서히 진화해서 서로 협력하게 되고 스스로 복제하는 시스템을 갖추게 되고 결국 하나의 작은 유기체가 된다. 가상적인 probiont와 현대 박테리아의 비교를 해보기 바란다.

[Ur Cell figure]

최초의 "살아있는 물체"는 한 개의 복제 가능한 분자였을 것이며 이것은 Ghadiri 그룹이 보고한 자기 복제가 가능한 펩파이드, 혹은 자기 복제가 가능한 hexanucleotide 또는, 자기 자신을 복사할 수 있는 RNA polymerase와 비슷할 것이다.

[Self-replicator figure]

다른 가능성은 처음의 자기 복제가 가능한 것은 단백질효소 혹은 RNA 효소인 촉매로 이것들이 촉매반응을 통해서 자신들을 다시 만들어 내는 것이다. 이것에 대한 예는 SunY 3개의 subunit으로 이루어진 self-replicator일 것이다. 이들의 촉매반응은 조그만 연못이나 혹은 늪, 못 등에 제한되거나 하나면 점토나 점토에흡착된 촉매반응일 것이다. 무작위로 만들어진 펩타이드 혹은 폴리펩타이드에서 많은 촉매반응을 일으키는 서열이 있으며 작은 화합물중에서 촉매반응을 일으키는 물질이 형성되지 않을 것 같지가 않다.

이 두가지 모델은 서로 배타적이지 않다. Ghadiri peptide가 돌연변이가 되서 촉매사이클을 형성할 수 있다.

최초의 자기 복제가 가능한 물질이 하나의 분자인지 아니면 여러 가지 분자의 복합체이건간에 이러한 것은 마치 프레드 호일이 주장하듯 "뒷마당에 잡다한 쓰레기를 토네이도가 747비행기로 만든었다"것과는전혀 다르다. 창조과학자들이 진화론의 잘못이라고 반박하는 내용과 실제로 화학진화의 내용을 간단히 비교해 본다.

[Two views of abiogenesis]

실제 이론은 여러 가지 작은 단계로 이루어져 있다. 그리고 나는 여기에 여러 가지 단계를 단순화시키기 위해서빼 놓았다(특히 hypercycle과 hypercycle-probiont 단계 사이) 각 단계는 조직과 복잡성이 조금씩 증가하며 화학물질은 천천히 유기체로 발전해 나가는 것이 한번에 유기체가 되는 것은 아니라는 것을 주목해야 한다.[4,10,15,28].

창조과학자들의 주장 즉 현재의 유기체의 형테가 바로 나타나게되었다는 내용이 어디서 유래했는지는 알 수가 없는데 최초의 현대적인 화학진화의 공식인, Oparin/Haldane 가설은 단순한 단백질/proteinoid가 세포로 발전해 나가는 것으로 이루어져 있다. 1850연대에 유행한 생각도 이와는 다르다. 내가 가장 비슷하게 생각하는 것은 라마르크의 기원에 대한 생각이라고 보인다.[8]

창조과학자들이 비판하는 내용은 이미 150년전의 것이가. 이것은 더 이상 현대의 진화론자들이 받아들이지 않는 것인데 왜 이것을 다루어야 하는가? 여러 가지 기본적인 통계학이니 생화학적인 문제가 창조과학자들의 잘못된 반론에 나타나기 때문이다.


"Life sequence라는 미신"

자주 듣게 되는 또다른 주장의 하나가 400개 단백질에 "life sequence"이 있으며 아미노산 서열은 생명체가 살기 위해서는 바뀔 수 없다는 것이다.

그러나 이것은 넌센스이다. 400개의 단백질은 아마도 현재까지 알려진 현대 생명체중 가장 간단한 것인 Mycobacterium genetalium의 genome에서 나온 말로 보인다. 하지만 제놈을 살펴본 사람에 의하면 이것은 256개만 있어도 된다는 것이다 [20]. 그렇지만 이것은 현대의 생명체이다. 최초의 protobiont/progenote 는 분명히 이것보다 훨씬 적은 단백질만 필요할 것이고 이것은 보다 간단한 화학 시스템에 뒤를 이은 것일 것이다[3,10,11,15].

단백질의 서열이 바뀔 수 없다는 것은 다시 말하지만 넌센스이다. 대부분의 단백질은 어떤 아미노산으로도 치환이 가능한 부분이 있고 어떤 부분은 특성이 같은 아미노산으로 (전하를 띠고 있는 아미노산은 전하를 띤 다른 아미노산과, 중성인 아미노산은 중성인 다른 아미노산으로 그리고 소수성인 아미노산은 다른 소수성의 아미노산으로 ) 치환이 가능한 부분이 있다. 기능이 동일한 분자중에는 전체의 아미노산이 30-50%가 다르게 될 수도 있다. 실제로 구조적으로 같지 않은 박테리아의 단백질을 효모의 단백질과 바꾸어 주어도, 그리고 사람의 단백질을 벌레에 바꾸어 넣어 주어도 그들은 아주 행복하게 산다.

"Life Sequence" 는 미신이다.


초보자를 위한 동전던지기와 거대분자조립

이제 창조론자들이 말하는 무작위로 아미노산을 더해서 원하는 펩타이드 만들기를 해보자 이것은 초기 지구에서 이루어진 방식은 아마도 아닐 것이다. 하지만 교육적인 가치는 있다.

Ghadiri group에서 언급한 자기 복제가능한 펩타이드의 예를 들어 보겠다. 물론 다른 예를 들 수 있다. 즉, hexanucleotide self-replicator,SunY self-replicator [24] 또는 Eckland 그룹이 제안한 RNA polymerase도 가능할 것이다. 하지만 창조과학자들이 주장하는 내용이 대부분 단백질에 대한 것이므로 이것을 최적으로 보인다. 이 펩타이드는 32개의 아미노산으로 이루어져 있고 서열은 RMKQLEEKVYELLSKVACLEYEVARLKKVGE(알파벳 하나가 아미노산 하나를 의미한다. -역주)이다. 이것은 peptide ligase라는 효소로 16개짜리 아미노산 subunit을 2개를 이용해서 자기 자신을 복제한다. 이것은 또한 비생물적인 펩타이드 합성으로부터 형성되기에 적당한 크기와 조성을 가지고 있다. 이것이 자기 자신을 복제할 수도 있기않은가?

우연히 만들어질 때 이것이 생성될 가능성은 (1/20)32 혹은 1/(4.29 x 1040) 이다. 이것은 처음의 창조과학자들이 carboxypeptidase가 만들어질 확률인 1/(2.04 x 10390) 보다 훨씬 가능성이 높다. 하지만 아직 굉장히 낮아 보인다.

그러나 이것은 확률계산의 다른 면이 있다. 그리고 우리들 대부분이 통계학에 대한 감각이 없는 사람이 잘 느끼지 못하는 부분이기도 하다. 우리는 대부분 백만분에 1이라고 하면 대개는 백만번을 시행하고 나서 한번 된다고 생각하는 경향이 있다. 하지만 이것은 잘못된 것이다.

시험을 해보자. 우선 동전을 4번 던져서 나오는 결과를 기록하고, 전부 앞이 나오는 경우가 몇 번째 시도였는지 확인해 보라.

4개가 전부 앞면이 나올 확률은 (1/2)4 혹은 1/16이다. 그러면 16번을 해야 전부 앞면이 나타나게 될까? 그렇지 않다. 연속적으로 실행할 때 나는 11,10,6,16,1,5,3번 시도를 하고 나서 전부 앞면이 나오게 되었다. 1/16이라는 확률은 16번에 한번 일어날 수 있다는 것이다. 하지만 이것이 순서대로 일어나는 것이 아니다. 당신은 첫 번 시도에 원하는 결과를 얻어 낼 수 있다. 1/4.29 x 1040확률이라고 하지만 매우 초기에 일어날 수도 있는 것이다.

1/4.29 x 1040 이라는 확률은 매우 작아 보인다. 사람들은 그래도 아직 지구에는 충분한 시간이 없는 것으로 보인다. 하지만 그렇지 않다. 위의 시도는 한번에 하나의 펩타이드만 생긴다는 것을 가정한 것이다. 하지만 실제로는 수억개의 아미노산 분자들로 수억번의 시도가 촉매반응이 일어날 수 있는 바다 혹은 해안가의 수킬로미터에서 동시에 일어나는 것이다. [2,15]

동전던지기의 예를 다시 생각해 보자. 4번 던져서 전부 앞면이 나오는데 평균 8분이 걸린다고 하자, 만약에 여러분의 친구를 16명이 동시에 동전을 던진다면 전부 앞면이 나오는 경우는 평균 1분이면 된다. 이번엔 6개의 앞면이 나올 경우를 생각한다면 (1/2)6 또는 1/64이다. 이것을 혼자서 한다면 약 32분이 걸린다. 하지만 64명이 동시에 한다면 역시 1분이 걸릴 뿐이다. 만약 수억분의 1의 확률의 동전던지기를 한다면 중국인구 모두가 한다면 가능하다.

그러므로 만약 생명체가 발생하기 전의 지구가 수십억의 peptide가 동시에 자란다면 replicator가 생기는데 걸 리는 시간은 상당히 줄어들 수 있다.

다시 생각해 보자 1/4.29 x 1040 은 매우 큰 수이다. 수십억이라는 숫자가 매우 큰 숫자이긴 하지만 이것이 한 5억년 사이에 최초의 복제가능한 물질이 나올 만큼 충분한 분자들이 있었는가?

가능하다. 1kg안에는 알지닌 (Arg)이 2.85 x 1024 분자나 있다. 1톤에는 2.85 x 1027 분자가 있다. 55개 아미노산 짜리 단백질은 1-2주에 만들수만 있다면, 만약 조그만 트레일러로 분량의 각각의 아미노산을 중간정도의 호수에 퍼붓는다면, 그안에는 우리가 원하는 특정한 자기복제가능한 펩타이드가 수십년이면 만들어질 수 있는 충분한 물질이 있다. [14,16]

So how does this shape up with the prebiotic Earth? On the early Earth it is likely that the ocean had a volume of 1 x 1024 litres. Given an amino acid concentration of 1 x 10-6 M (a moderately dilute soup, see Chyba and Sagan 1992[23]), then there is roughly 1 x 1050 potential starting chains, so that a fair number of efficent peptide ligases (about 1 x 1031) could be produced in a under a year let alone a million years, the synthesis of primitive self-replicators could happen relatively rapidly, even given a probability of 1 chance in 4.29 x 1040. (and remember, our replicator could be sythesized on the very first trial). (이부분은 번역은 할 수 있지만 개인적으로 이해가 되지 않아서 일단 원문을올립니다. )

서열이 만들어지는데 약 1주간이 걸린다고 가정한다면 [14,16] Ghadiri ligase는 일주면 만들어진다. 그리고 어떤 종류의 사이토크롬 서열도 약 수백만년이면 만들어질 수 있다. (이때 만들어지는 101개 짜리 펩타이드의 서열의 약 반정도는 어떠한 기능이라도 가지고 있을 것이다.)

비록 내가 Ghadiri ligase를 가지고 예를 들었지만 같은 계산을 SunY self replicator 혹은 Ekland RNA polymerase을 가지고 말할 수도 있다. 이것은 여러분이 한번 계산해 보기로 하겠지만 결론은 같다.


만들어진 것들 중에서 기능을 가진 단백질 찾아내기

나는 주어진 작은 효소가 만들어지는 것은 프레드 호일 같은 창조론자들이 말하는 것처럼 어렵지 않다는 것을 보여주었다. 대부분의 사람들이 잘못 이해하는 것중의 하나가 효소와 라이보자임의 형태가 독특해서 무작위적으로 아미노산(혹은 RNA)에서 원하는 효소나 라이보자임이 만들어질 가능성이 매우 적다는 것이다. (수억가지가 만들어져도 기능을 하는 것은 한가지 뿐이라는 말임- 역주)

하지만 Ekland의 계산에 의하면 220개의 핵산으로 이루어진 RNA 서열중에서 2.5 x 10^112개는 효율적인 ligase라는 것이다 [12]. 이정도면 충분하다. 다시 원시 지구를 가정해 보자. 원시지구는 10^24리터 이고 핵산의 농도를 1 x 10-7 M (23)라고 한다면 약 1 x 1049 potential nucleotide chains이 존재하게 된다. 그러므로 효율적인 RNA ligases 의 충분한 양(about 1 x 1034)이 수백만년이 아닌 1년안에 형성될 수 있고, RNA polymerases 의 가능한 양도 매우 높은데 1/1020도 RNA polymerase가 될 것이다. 같은 계산으로 acyl transferase (1/1015 sequences)와 ribozymal nucleotide synthesis [1,6,13]이 가능하다.

비슷한계산으로 1 x 10 ^130개의 100개 아미노산 단백질중에서 3.8x10^61개는 사이토크롬 C와 같다. 여기에는 더 많은 단백질/nucleotide를 찾을 수 있는 공간이된다. 그러므로 초기 지구에서 여러 효소들이 서로 모여서 어떤 기능을 할 수 있을 것이다.

그러므로, 좀더 현실적인 모습으로는 무작위적인 아미노산의 "life-supporting system"으로 되는 과정은 (혹은 효소를 기반으로하는 하이퍼 사이클이나, RNA 시스템이나, RNA 라이보자임-단백질의 공진화가) 비록 초기의 농도가 매우 낮거나 시간이 매우 짧다고 가정한다고 하더라도 충분히 생길 수 있을 것이다.


결론

창조과학자들의통계에 대한 전제는 틀린 것들이며 이것은 잘못된 이론을 만들어 냈다. 게다가 이것은 통계학적이나 혹은 생물학적으로 잘못된 생각을지지하는데 사용된다.

현재는 우리는 각단계마다 정확한 확률을 구한다는 것은 거의 불가능하지만 처음의 두단계는 거의 일어날 확률은 1.0이 된다. (단량체에서 폴리머가 형성되는 것은 확률이 1.0, 그리고 catalytic polymer가 형성될 확률은 1.0) 이 replicating polymer 가 hypercycle로 변하게 될 확률은 만약 Kaufman의 catalytic closure가 옳고, 그의 상전이 모델이 맞는다면 확률은 1.0이다. 하지만 이것은 이것을 확인하기 위해서는 현실의 화학이 필요하고 좀더 자세한 모델링이 필요하다. hypercycle에서 ->probiont의 변화의 가능성은 현재 연구가 진행중인 여러 개념에 따라서 달라질 것이며 아직은 모른다.

그러나 마지막 단계, 생명체의 가능성은 화학과 생화학에 달려있는 것이지 확률에 달린 것은 아니다.


References

[1] Unrau PJ, and Bartel DP, RNA-catalysed nucleotide synthesis. Nature, 395: 260-3, 1998

[2] Orgel LE, Polymerization on the rocks: theoretical introduction. Orig Life Evol Biosph, 28: 227-34, 1998

[3] Otsuka J and Nozawa Y. Self-reproducing system can behave as maxwell's demon: theoretical illustration under prebiotic conditions. J Theor Biol, 194, 205-221, 1998

[4] Woese, C, The universal ancestor, Proc Natl Acad Sci USA, 95: 6854-6859.

[5] Varetto L, Studying artificial life with a molecular automaton. J Theor Biol, 193: 257-85, 1998

[6] Wiegand TW, Janssen RC, and Eaton BE, Selection of RNA amide synthases. Chem Biol, 4: 675-83, 1997

[7] Severin K, Lee DH, Kennan AJ, and Ghadiri MR, A synthetic peptide ligase. Nature, 389: 706-9, 1997

[8] Ruse M, The origin of life, philosophical perspectives. J Theor Biol, 187: 473-482.

[9] Lee DH, Severin K, Yokobayashi Y, and Ghadiri MR, Emergence of symbiosis in peptide self-replication through a hypercyclic network. Nature, 390: 591-4, 1997

[10] Lee DH, Severin K, and Ghadri MR. Autocatalytic networks: the transition from molecular self-replication to molecular ecosystems. Curr Opinion Chem Biol, 1, 491-496, 1997

[11] Di Giulio M, On the RNA world: evidence in favor of an early ribonucleopeptide world. J Mol Evol, 45: 571-8, 1997

[12] Ekland EH, and Bartel DP, RNA-catalysed RNA polymerization using nucleoside triphosphates. Nature, 383: 192, 1996

[13] Lohse PA, and Szostak JW, Ribozyme-catalysed amino-acid transfer reactions. Nature, 381: 442-4, 1996

[14] Ferris JP, Hill AR Jr, Liu R, and Orgel LE, Synthesis of long prebiotic oligomers on mineral surfaces [see comments]. Nature, 381: 59-61, 1996

[15] Lazcano A, and Miller SL, The origin and early evolution of life: prebiotic chemistry, the pre- RNA world, and time. Cell, 85: 793-8, 1996

[16] Ertem G, and Ferris JP, Synthesis of RNA oligomers on heterogeneous templates. Nature, 379: 238-40, 1996

[17] Lee DH, Granja JR, Martinez JA, Severin K, and Ghadri MR, A self-replicating peptide. Nature, 382: 525-8, 1996

[18] Joyce GF, Building the RNA world. Ribozymes. Curr Biol, 6: 965-7, 1996

[19] Ishizaka M, Ohshima Y, and Tani T, Isolation of active ribozymes from an RNA pool of random sequences using an anchored substrate RNA. Biochem Biophys Res Commun, 214: 403-9, 1995

[20] Mushegian AR and Koonin, EV, A minimal gene set for cellular life derived by comparison of complete bacterial genomes. Proc. Natl. Acad. Sci. USA, 93: 102688-102773.

[21] Ekland EH, Szostak JW, and Bartel DP, Structurally complex and highly active RNA ligases derived from random RNA sequences. Science, 269: 364-70, 1995

[22] Breaker RR, and Joyce GF, Emergence of a replicating species from an in vitro RNA evolution reaction. Proc Natl Acad Sci U S A, 91: 6093-7, 1994

[23] Chyba C, and Sagan C, Endogenous production, exogenous delivery and impact-shock synthesis of organic molecules: an inventory for the origins of life. Nature, 355: -32., 1992

[24] Doudna JA, Couture S, and Szostak JW, A multisubunit ribozyme that is a catalyst of and template for complementary strand RNA synthesis. Science, 251: 1605-8, 1991

[25] Lahav N, Prebiotic co-evolution of self-replication and translation or RNA world? J Theor Biol, 151: 531-9, 1991

[26] Stadler PF, Dynamics of autocatalytic reaction networks. IV: Inhomogeneous replicator networks. Biosystems, 26: 1-19, 1991

[27] Eigen M, Gardiner W, Schuster P, and Winkler-Oswatitsch R, The origin of genetic information. Sci Am, 244: 88-92, 96, et passim, 1981

[28] Eigen M, and Schuster P, The hypercycle. A principle of natural self-organization. Springer-Verlag, isbn 3-540-09293, 1979

[29] Yockey HP, On the information content of cytochrome c. J Theor Biol, 67: 345-76, 1977


Useful books

Statistics at Square One, T.D.V. Swinscow, 8th Edition Paperback, Published by Amer College of Physicians, 1983, ISBN: 0727901753

Evolution from Space, F Hoyle and Wickramasinghe, JM Dent and sons, London, 1981

Vital Dust : Life As a Cosmic Imperative, by Christian De Duve, Basic Books 1995, ISBN: 0465090451

The Major Transitions in Evolution, Maynard Smith J & Szathmary E, 1995, WH Freeman, ISBN: 0716745259

The Origins of Order: Self Organization and Selection in Evolution. By Stuart Kauffman, S. A. (1993) Oxford University Press, NY, ISBN: 0195079515.

At Home in the Universe. By Stuart Kauffman, 1995) Oxford University Press, NY.


Links


Acknowlegements

Thanks to John Wilkins and Jthomford for helpful suggestions and discussions. Thanks to John for some nifty GIFs and JPEGS as well.