Neurobiology in Rap

Developmental Biology in Rap
에 이은 시리즈!

"Synaptic Cleft"



"Put Some ACh into it"



학부애들 가르키는것도 일이라능~

by Newbie | 2009/06/30 17:40 | 트랙백 | 덧글(0)

Blackberry


대충 한달째 쓰게 되는 셈인데, 이제 대충 적응되어 감. 사실 이 물건은 전화기라기보다는 '전화가 되는 이메일 수신기' 라고 보는 게 더 적합한 물건인 듯 하다.

이 업계에서도 이 물건을 아주 자알 쓰고 계신 훌륭한 PI분이 계신데, '새벽에 잠자리에서 실험실원이 보낸 이메일을 2시간마다 한번씩 블랙베리로 체크한다' 고 하신다. ㄷㄷㄷ

RIM에서 오바마대신 광고모델로 위촉하셔야 할듯. ㅠㅠ

(저런 걸 보면 가끔 하루 내지는 이틀에 한번씩, 그것도 대낮 일과시간에만 이메일을 보내는 PI 님하 밑에 계신 본인은 세상 부러울게 없다능~)

by Newbie | 2009/06/30 17:13 | etc | 트랙백 | 덧글(0)

Impact Factor, 믿을만한 수치인가?


흡사 수능(학력고사라는 용어가 더 익숙한 사람도 있겠지만 ㅎㅎ) 배치표처럼 나올때면 (특정 업계에서는) 화제를 모으는 IF. 과연 여기에는 문제가 없을까?

JCB 에서 생각하는 IF의 문제에 대해서 재작년 쯤에 꽤 논쟁이 일어난 적이 있고 이때의 JCB 주장을 한번 번역해 봤다. 엉터리 번역이므로 보다 정확한 번역은 링크에서 원문 읽어보시도록 하고...



-------------------------

데이터를 보여달라!


과학자라면 누구나 데이터의 Integrity 및 취득과정에서의 투명성은 과학의 필수적인 요소라는 것을 알고 있을 것이다. Thomson Scientific에 의해서 집계되고 판매되는 임팩트 팩터 (Impact Factor) 데이터는 과학계에 큰 영향력을 미친다. 가령 어떤 저널에 논문을 투고할지, 누구를 채용하거나 승진시킬지, 연구비 신청시에, 심지어는 월급, 보너스액수까지 임팩트 팩터가 영향을 미친다는 이야기가 있다. 그러나 대부분의 과학자들은 이렇게 중요시되는 임팩트 팩터가 어떻게 결정되는지에 대해서 잘 이해하지 못하고 있는 것 같고, 우리가 아는 한, 누구도 임팩트 팩터 데이터를 검증하기 위해서 데이터를 조사해 본 경우는 없는 듯하다. 


임팩트 팩터는 제대로 계산되고 있는가?


해당 년도의 특정 저널에 대한 임팩트 팩터는 지난 2년간 해당 저널에 출판된 논문이 해당 해에 평균적으로 몇 번 인용되었는지로 정의된다. 예를 들어 2006년도 임팩트 팩터는 2004년, 2005년에 출판된 논문이 2006년에 인용된 평균 횟수를 의미한다. 그러나 임팩트 팩터 계산에는 다른 곳에서도 지적되었듯  몇 가지 문제가 있다. 여기서 이러한 문제들을 다시 지적하고자 한다.


1. 임팩트 계산에서의 '분자' (numerator) 는 해당 저널에 출판된 2년간의 내용물 - 종류에 상관없이 - 들의 인용횟수가 된다. 예를 들어서 2006년의 임팩트 팩터 계산의 분자는 2004,2005년에 해당 저널에 출판된 모든 내용물들의 인용횟수의 총 합이다. 그러나 임팩트 팩터 계산의 '분모' (denominator) 는 Thomson Scientific 사에서 연구논문 (Primary research articles) 이나 리뷰논문 (Review articles) 으로 지정한 논문에 한한다. 저널의 "Front matter", 즉 네이처의 "News and Views" 에 실린 뉴스기사 등은 포함되지 않는다. 따라서 임팩트 팩터 계산에는 분모로 포함되지 않는 "Front matter" 류의 뉴스기사등의 인용도 들어간다는 문제가 생긴다.


2,  논문의 내용물이 연구논문인지, 리뷰인지, 아니면 "Front Matter" 인지는 Thomson Scientific 직원에 의해서 키워드나 인용문헌 갯수 등의 여러가지 기준에 의해서 수작업으로 결정된다.


3, 특정 출판사들은 Thomson Scientific 과 협상을 해서 자신들에 유리하도록 논문의 분류를 바꾼다. 이러한 구체적인 협상 내역은 대중에게는 공개되지 않는다. 그러나 특정 저널의 임팩트 팩터가 갑자기 증가한다면 무슨 일이 일어났는지 궁금해 하지 않을 수 없다. 예를 들어서 Current Biology 의 impact factor 는 2002년에 7.00 에서 2003년에는 11.91 로 급격히 증가하였다. impact factor 계산의 '분모' (역주 : 연구논문 및 리뷰로 분류된 논문갯수) 는 2002년의 1032 에서 2003년에는 634로 감소되었는데, 논문에 실린 전체 기사수는 오히려 증가하였다.


4. 철회된 논문에 대한 인용도 임팩트 팩터 계산에 사용된다. 가장 최악의 예를 들자면, 황우석의 2004년, 2005년 사이언스 줄기세포 논문은 모두 이후에 철회되었으나 2007년 11월 20일 현재 모두 419 번 인용되었다. 이 논문의 인용수를 하나라도 더 늘리는 것을 방지하기 위해서 우리는 여기서 해당 논문에 대한 인용은 생락한다.


5. 임팩트 팩터 계산은 평균치이기 때문에 "킹왕짱인용많이되는" 논문에 의해서 왜곡될 수 있다. 예를 들어 네이처에 게제된 최초의 휴먼 지놈 관련 논문은 2007년 11월 20일 현재 무려 5,904번이나 인용되었다. 네이처의 2005년 임팩트 팩터 자체분석에 따르면 네이처 인용의 89% 가 전체의 25% 논문에 의해 발생되었다고 한다.


Thomson Scientific 에 "임팩트 팩터 계산시에 평균값과 동시에 중간값도 같이 제공할 수 없느냐라고 문의해 본 결과 이런 답변이 왔다. "흥미있는 제안이다...중간값은 대개 평균값보다 훨씬 낮은 값이다. 논문 인용빈도 분포가 편중되어 있다는 것을 설명할 수 있는 통계치가 여러가지 있겠지만 아마 중간값은 최적의 선택은 아닐 것이다" 아마 그럴지도 모른다. 그러나 평균과 더불어 중간값을 제공해도 독자들에게 해가 될 것은 없을 거이며, 이러한 언급은 임팩트 팩터값이 (킹왕짱 인용많이되는 일부 논문을 제외한) 대부분의 논문의 평균값과는 거리가 있다는 것을 자인하는 셈이다. 


이외에도 "임팩트 팩터값 가지고 장난칠 수 있는 꽁수가 몇 가지 있는데 이들은 모든 저널 에디터라면 익히 잘 알고 있는 것들이다 (일부에서는 실제로 하는 일이다). 예를 들어서 리뷰 논문은 일반적으로 연구논문에 비해 인용이 많이 되며, 또한 지놈관련 논문등 데이터가 많은 논문들 역시 인용이 많이 된다. (역주 : 리뷰의 비중을 늘리면 임팩트 팩터 늘리는 것은 쉽다. 사실 논문 쓸때 오리지널 페이퍼 일일히 찾아서 사이테이션 하는 것보다 리뷰논문 하나 사이테이션하는 게 더 쉽다. ㅠ) 우리는  Thomson Scientific 사에 리뷰논문을 제외한 연구논문만에 대한 임팩트 팩터를 제공할 의향이 없느냐고 문의하였으나 무응답.


그럼 논문 인용 데이터 자체는 제대로인가?


저널 에디터에게 데이터의 integrity란 대중에게 제시된 데이터가 실제로 관찰된 데이터를 얼마나 정확히 반영하는가를 의미한다. 이를 확인하기 위해서 Rockefeller University Press (역주 : JCB의 출판사) 는 개제승인된 논문의 이미지 데이터를 철저히 분석하는 방침을 세웠다. 물론 이미지 데이터 이외에도 다른 종류의 데이터가 논문에 실리긴 하지만, 일단 이미지 데이터는 데이터의 정직성을 쉽게 검사할 수 있는 데이터이다. 만약 논문 데이터에 문제가 제기될 경우 저자에게 원본 데이터를 제출할 것을 요구한다. 우리는 이렇게 우리 저널에 출판되는 데이터를 보호하는 것이 우리의 의무라고 간주한다. 


Thomson Scientific 은 저널에 인용빈도 데이터를 판매한다. 어떤 주제가 많이 인용되며, 어떤 주제가 그렇지 않은지를 분석할 목적으로 우리는 3개 저널 (Journal of Experimental Medicine, Journal of Cell Biology, Journal of General Physiology) 에 대한 데이터와 몇몇 경쟁저널에 대한 데이터를 구매하였다. 우리의 본래 의도는 데이터가 제대로 되어 있는지를 검증할 목적은 아니었다. 


그러나 Thomson Scientific 의 데이터를 살펴보니 두 가지 사실이 명백해졌다. 첫번째는 기사 종류의 분류에서 수많은 오류가 발견되었다. 우리가 "front matter" 로 간주하는 기사들의 상당수가 임팩트 팩터 계산에 사용되는 "분모"로 분류된 것이 발견되었다. 이러한 오류는 우리가 조사한든 저널에서 공통적으로 발견되었다. 두번째는 숫자 계산이 맞지 않았다. 즉 각각의 논문의 전체 인용숫자는 Thomson Scientific 의 JCR 웹사이트에 나와있는 숫자에 비해서 매우 적었다. 이러한 인용빈도 숫자의 차이는 특정 저널에 따라서 19% 나 되었으며, 우리가 조사한 저널들에서 톰슨사에서 구매한 데이터를 이용해서 직접 계산하였을때 임팩트 팩터 순위가 바뀌는 일도 있었다.


데이터베이스에도 니껏 네껏이 있냐?


이러한 문제점을 우리는 Thomson 에 문의해 봤더니 하는 말 "2개의 데이터베이스가 존재한다. 니네가 구입한 것은 'Research Group' 용이고 임팩트 팩터 계산에 이용된 데이터베이스는 따로 있다." 왜 이게 두 개가 있냐 하면 논문 Citation 시에 저자 이름이나 저널 번호를 제대로 맞추지 않은 잘못된 Citation 을 해놓은 논문이 엄청 많고, 'Research Group' 용의 데이터베이스는 이런 잘못된 사이테이션은 다 제거된 것이고, 임팩트 팩터 계산에는 저널 이름만 맞으면 카운트되도록 해 놓은 데이터베이스를 쓴다고 했다. 그래서 잘못된 사이테이션을 가진 데이터, 즉 임팩트 팩터 계산에 사용된 데이터베이스를 내놔보라고 했다. 그렇게 받은 데이터베이스로 계산을 해봐도 역시 발표된 임팩트 팩터 숫자하고는 틀리게 나왔다.  이 데이터베이스는 기존에 나온 임팩트 팩터값을 그대로 나오게 하도록 임시로 짜맞추어진 것처럼 보였다. 그런데도 틀린 값이 나온다.


투명한 데이터


이로써 Thomson Scientific 은 자신들이 임팩트 팩터를 계산할 때 사용한 데이터를 우리에게 줄 능력이 없다(혹은 줄 생각이 없거나) 라는 것이 명백해졌다. 만약 우리 저널에 논문을 제출한 저자가 의심가는 데이터를 입증할 수 있는 오리지널 데이터를 내놓지 못한다면 우리는 게제승인된 논문이라도 걍 가차없이 취소시켜 버린다. 동일한 기준을 임팩트 팩터에 적용해 보자. 과연 제대로 된 근거 자료를 제공하지 못하는 임팩트 팩터를 특정한 저널 혹은 논문의 질을 설명하는 지표로 인정할 수 있겠는가? 


  과학자들이 실험데이터를 보지 않고서 과학논문의 연구결과를 인정하지 않듯이, 제대로 공개되지 않은 데이터에 근거한 Thomson 사의 임팩트 팩터를 가지고 저널 및 논문의 퀄리티를 판단해서는 안된다. PubMed나 PubMed Central, Google Scholar 와 같은 대중에게 공개된 서비스를 통해서 논문 및 인용 데이터가 공개되고 있는 상황에서 이제 누군가가 임팩트 팩터처럼 문제가 많고 비과학적인 수치보다는 제대로 된 논문의 퀄리티를 측정하는 수치를 만들기를 기대한다. 

---------------------------------------

참고로 여기에 대한 톰슨사의 반박은 여기서 읽어보시길. (더이상의 번역은 생략한다. ㅠㅠ)


끝으로 역자의 1줄 주장  : IF보다는 논문을 '실제로 읽고' 논문이든 저널이든 평가하자.

by Newbie | 2009/06/30 16:40 | Science | 트랙백 | 덧글(1)

How To Become A Mad Scientist

구글 이미지 검색


1. 가운은 필수라능



실험까운 입기 싫어하는 당신, Mad Scientist의 자격이 없다능~
개인적으로 실험가운을 입는 경우는 다음의 4가지인데

- 유기용매를 만질때
- 섭씨 4도씨 Cold Room 에서 장시간 작업할때 (이것은 방한복의 성격이 더 강하다)
- 실험실 대청소일때
- 소속기관의 Safety Office 등에서 감사나올때. ㅠㅠ

사진에 등장하는 Mad Scientist들은 가운은 기본이고 (가운을 입지 않으면 실격이라능~) 고글 착용도 대개 필수. 세계 정복을 노리는 Mad Scientist 들이 째째하게 Lab Safety 에나 신경쓰고...하긴 세계 정복을 하려면 그런 세세한 것에 트집잡히지 않는 용의주도함이 필요하다능~


2. 전공을 잘 택해야 한다능




일단 플라스크나 시험관 (가급적 색이 들어있는) 을 들고 있어야 하는 것은 기본이므로 화학, 생물쪽이 유리하다능~
따라서 이론물리나 수학 이런것은 실격~

형형색색 색이 나는 시료를 다루면 미디어 노출이 쉽다는 것을 생각해보면 GFP 및 유사 형광단백질을 가지고 실험하는 사람은 좋은 자격요건(?)을 지니고 있다능~

그렇다면 이런거 자랑하는 Roger Tsien 같은 아저씨는 좋은 자격요건을 갖추고 있다고 생각되는데...근데 노벨상 탔으니 실격.



3. 실험가운 속에는 정장을 입고 있어야 한다능

실험가운 입고 있어야 하는 것은 당근이지만 위의 사진들을 잘 보면 실험가운 아래에는 넥타이나 양복을 입고 있다는 것을 알 수 있다. 그래도 이 바닥에서 구른지 십여년이 되지만 실험복 안에 넥타이 매고 실험하는 사람들은 '일부 특정 직업 종사자' (MD) 이외에는 거의 본 기억이 없는데...뭐 그냥 주변에는 Mad Scientist 가 될 일이 없는 범생들하고만 생활했으니까 그런가부다 한다. ㅎ

그렇다면 왜 실험가운 속에는 정장을 입고 있어야 하는가? 생각할 수 있는 이유로는

1. 정체를 위장하기 위해서? 출퇴근할때는 양복을 잘 빼입고 자신의 정체를 위장해야 한다는 것인데...가령 월 스트리트 뒷골목 건물 지하실에 비밀 실험실을 차려놓고 일과시간에는 꿍작꿍작 9-5 가 끝나면 가운을 벗고 퇴근하는 비즈니스맨 틈에 슬쩍 끼어들어 퇴근 뭐 이런 시나리오?

2, 지구 정복을 위해서는 일단 많은 연구비가 필요하고, 그러기 위해서는 정부당국자와 긴밀한 협의 및 로비를 해야 할 필요가 있고 따라서 양복을 빼입고..뭐 이런건가. 그냥 영업사원 하나 쓰시지...


잠자다 깨서 오랫만에 써보는 뻘소리. ㅠㅠ

by Newbie | 2009/06/26 17:35 | Science | 트랙백 | 덧글(1)

Wolfram|Alpha

물건을 구글 킬러니 어쩌구 하는 사람들이 있지만 이것을 검색엔진의 범주에 넣는 것은 좀 말이 안되는 것 같고, 이 회사가 이전에 무엇을 만들었는지를 생각한다면 좀 더 이해가 쉬울 듯 하다.

즉, 이 물건은 '온라인 매쓰매티카 + 알파' 라고 이해해야 한다.

E=MC^2
actin
linear fit {{1,2}, {2,3}, {3,5},{4,6.5}}
Benzene
Seoul Temperature

Philadelphia to seoul


화학물질을 많이 다루는 업종의 사람이라면 화학물질 넣으면 바로 MW 이나 구조식을 표시해 주는 기능은 꽤 실용적인 듯 하다.



구글 + 울프램 알파를 생각해 보신 분은 없는가? 파폭 유저라면 이 확장기능을 설치해 보시라.

울프램 알파를 검색도구에 추가

구글 검색시에 울프램 알파 검색도 같이 수행


by Newbie | 2009/06/25 14:35 | Science | 트랙백 | 덧글(0)

◀ 이전 페이지          다음 페이지 ▶