教育

49 posts

統計軟體SPSS和R

最近,我對於SPSS越來越不滿。很想要把它給甩了,但是它卻像水蛭一樣吸著我的血卻怎麼甩也甩不掉。

SPSS是一套一般性的統計軟體,跟它類似的統計軟體有SAS、Stata、和R。SAS是一般企業界和學術界最廣泛使用的統計軟體,但是在學教育的人當中使用率卻不是那麼高。原因在於用SAS作統計分析需要做比較多的程式編碼,這對於很多學教育的人來說是一大困難。SPSS正好彌補了這方面的需要。SPSS並不是最強大的統計軟體,但是它具有最容易上手的使用者介面。因此,很多教初階統計的教授很喜歡用SPSS。因為這樣他們就不用花太多的時間教學生怎麼寫程式。就在這樣的背景之下,我從碩士班一路讀到博士畢業,SPSS是我唯一聽過和用過的統計軟體。

博士畢業之後我到Indiana University的NSSE工作,正好NSSE也是用SPSS,所以我便得心應手的繼續使用SPSS。三年在NSSE的工作經驗讓我對SPSS的熟悉度大幅的提升,我也可以非常熟練的透過SPSS syntax來執行各種統計分析而不需要用到下拉式的選單。很自然的,我對SPSS的依賴也越來越深。

也是在NSSE工作的時候我遇到了來自不同背景的研究員和分析師。我的一位具有公共行政背景的同事告訴我他以前學的統計軟體是Stata。他說Stata的功能比SPSS強大許多,但是要上手比較難。後來我又遇到很多在Institutional Research (IR)這個領域工作的人用SAS。根據SAS使用者的說法,SAS在處理大型數據資料的效率比SPSS好很多。聽到這個消息曾經讓我很想要學SAS,因為我做研究的資料檔案動輒就是幾百MB,甚至有上GB的。這些SPSS資料檔在我的電腦上光是開啟就是一筆時間。整個研究做下來有很多時間都浪費在等待電腦跑結果上。但是因為同事間沒有人用SAS,所以我遲遲沒有對SAS下手。

在NSSE工作的時候我也聽說了R這套開放源碼的統計軟體。當時的我之所以會對R有興趣是因為它是開放源碼(open source),所以是免費的。其他三套統計軟體都是天價:SPSS基本版要價美金$700,如果再加上其他常用的附加功能,$2,000恐怕是少不了的。SAS要價一年美金$8,100,不要懷疑,你沒有看錯,八千一百大洋是一套SAS一年的使用費。Stata稍微好一點,美金$1,595。

統計軟體賣的這麼貴的結果就是除非學校或是公司出錢,否則很少有人買的起這些軟體。這對當時還在NSSE上班的我來說沒有差,反正NSSE有的是錢,幾千塊美金對他們來說是不痛不癢。但是我來到UNT之後卻發現當教授跟當研究員真是不同。UNT只提供我SPSS的基本版,如果我需要其他附加功能(像是處理missing data的模組)那我就需要自己想辦法生錢來買。再者,我教的研究所課程常常需要學生做統計分析。雖然學校的電腦室都裝有SPSS,但是我的學生大部分都是上班族,住的離學校又遠(我有一個學生通勤單程就要3個小時,這還不包括塞車的時間),因此為了寫作業特別跑一趟學校的電腦室對很多學生來說是不切實際的。結果為了寫作業很多學生只好自己買一套SPSS裝在家裡的電腦上。不幸的是SPSS的學生版功能太有限,沒有辦法做到我要他們做的分析,所以我的學生只好花大錢買SPSS。這實在不是我所願意的。

最後一項我對SPSS不滿的地方是有太多高階統計的分析它做不出來。一些資料處理的方法像是multiple imputation和Heckman correction,或是高階的統計分析像是SEM、HLM…等等,SPSS都做不出來。結果是我必須另外花錢買一套軟體來做SEM,然後又是另外一套軟體專門來做HLM。這些錢都不是學校給的,是我要自己想辦法的。

就是在這樣的情況之下我開始接觸R。之前提過R是一套開放源碼的免費軟體。然而在IR領域很少有人用R,美國大學中的IR通常不是用SAS就是用SPSS,因此我在NSSE的時候雖然聽過R但是沒有接觸過。當了教授之後才發現在學術界用R的人還真不少(大概是因為很多教授都跟我有同樣的處境)。由於使用R的學術界人士非常的多,因此R的統計功能非常的強大。幾乎只要可以想的出來的統計分析R都可以做的出來。當然,這背後還有一個原因是它的開放源碼,因此任何人都可以幫R設計外加模組。R還可以做出其他統計軟體做不出來的圖形化報表(見下圖)。

既然R這麼的強大又免費,為什麼用的人大多侷限在學術界呢?原因很簡單,因為它要上手實在不是那麼容易。R不像SPSS只要用下拉式選單就可以完成大部分的分析,一切R的操控都是透過程式化的指令來進行。這意味著要學R先得學習用以操作R的S語言。我想很多學教育的人可能看到這裡就已經打退堂鼓了。我呢?我希望有一天我可以完全的用R來取代我電腦裡的SPSS、AMOS、和HLM。但是在那一天來到之前,我還是得繼續倚靠SPSS來完成我的研究。

最後是我最近在學R的時候參考的幾本書。我在Amazon.com買了好幾本R的書,也在我們學校的圖書館借了好幾本。我發現統計的教科書要嘛是寫得很好:易懂又教你實際操作,要不然就是寫的很爛:充滿各種專業術語跟符號但是又解釋的不清不楚。對於跟我一樣在學R的人,我推薦以下幾本書:

Introductory Statistics with R (Statistics and Computing)

拿一個博士學位有多難?

拿一個博士學位有多難?

如果你把這個問題拿去問那些沒有讀過博士班的人,他們會說:「不知道,但是應該很難吧!要不然大家都去讀博士了。」如果你把這個問題拿去問正在寫論文的博士班學生,他們會說:「博士學位好像一座直達雲端的高山。當你開始爬的時候,你會懷疑自己有沒有爬到頂的一天。等到爬了一半卻還是看不到山頂的時候,你覺得這輩子大概永遠也爬不到頂了。有些人在這個時候就放棄下山了,有些人咬著牙繼續往上爬,但是連續攻頂不成最後一身疲乏的下山,也有人在不斷的奮鬥之後撥雲見日,最後成功的攻頂拿到博士學位。」

如果你問我博士學位有多難拿,我會說:「這要看情況而定」。

我承認博士學位對於還沒有拿到的人來說的確是一座高山(當你拿到博士學位之後就會發現原來高山之上還有更多的高山),但是這座高山的高度對於每一個人來說是不一樣的。我要再重複一次,博士學位這座高山並不是對每一個人都是一樣高的。

為什麼這麼說呢?因為我這個禮拜參加了兩個博士班學生的論文答辯。這兩個人有著類似的遭遇,同樣坎苛的博士班過程,最後都順利的拿到了博士學位,但是他們的博士論文品質有著天壤之別。

這兩個學生在我來到UNT之前就已經讀了很多年的博士班了,兩個人也都在我來到UNT之前就已經把博士論文寫到一半了。但是不幸的事情同樣發生在這兩個人身上。其中一個人的指導教授在他論文做到一半的時候跟他說,對不起,我在別的學校另謀高就了,你的博士論文我幫不上忙,你另外找人指導吧!另外一個博士班學生則是論文快要做到最後的答辯了,結果他的指導教授跟他說,對不起,我實在不知道你的論文在搞什麼東西,我也不想再當你的指導教授了,請你另外找人指導吧!更慘的是兩個人的博士論文委員中有的退休,有的離職,結果是兩個人都變成了系上的「孤兒」。

當我剛開始在UNT上班沒有多久這兩個博士班學生就分別找上我請我當他們的博士論文委員,而他們也同樣找了系上另外一位資深的教授當他們的指導教授。

就這樣,一年半過去了。這兩個博士班學生中的第一位,我們暫且稱他做學生甲,把他的論文整個打掉重練,重新寫一份研究計畫,設計一份新的問卷,測試問卷,然後收集資料、分析,最後把他全部整合在一起。花了整整一年半的時間,終於在上個月全部完成。

學生乙看著自己本來已經快要完成的論文很不甘願就這樣前功盡棄,所以他在新的指導教授的同意之下揮棄部分的論文,重新改寫研究方法以及結果和討論。同樣花了一年半的時間,終於在上個月完成。

我們學校有一個規定就是博士班學生有十年的時間來完成他們的學位。如果花了十年你還是拿不到博士學位,很對不起,你就自動被學校開除了。聽起來很慘忍,但是這是一個強迫學生畢業的有效方法。

學生甲跟乙都在這個學期到達他們的十年大限,意思是說如果他們這個學期沒有辦法順利的答辯他們的博士論文,那他們過去十年的時間、精力、和金錢都白費了。仔細想想,這真不是鬧著玩的。如果你花了十年,3650個日子,40個不同的季節,超過一百萬台幣的學費,和無數個寒窗苦讀的夜晚,辛辛苦苦的為了這個學位,結果最後卻是什麼都沒有,我想輕則憂鬱症,重則想不開自殺都是有可能的。

還好,在大限前的幾個禮拜,他們兩個人都順利的通過了博士論文的答辯。但是,作為他們的博士論文委員,我心裡對於他們兩個人的感受真是如同赤道與北極。

學生甲,也就是論文打掉重練的那一位,作了一篇頂級水準的博士論文。雖然說頂級水準的「博士論文」不等於頂級水準的「學術論文」(像我一開始說的,爬到了博士這座山的山頂才發現原來四周多的是更高的高山。我們不可能用要求教授的學術水平來要求博士班學生。一般的博士論文都需要很多的修飾與改進才有辦法在一般等級的學術期刊上發表。但是很多大學,包括我們學校,要求教授一年要在各自的專業領域中最高等級的專業期刊中至少發表兩篇以上的學術論文。),但是他的博士論文是我看過的博士論文中非常好的一篇。我這裡指的博士論文不只是我們學校的學生寫的博士論文,我指的是全美國所有的高等教育博士班學生所做的論文。我對於學生甲的成果感到非常的驚喜,也非常樂意在他的博士論文上簽上我的名字。

學生乙的情況恰好與學生甲相反。在不斷的拼拼湊湊之後學生乙交出一篇在及格邊緣的論文。以他這樣水平的博士論文,如果我是他的指導教授,他很有可能會就這樣超過他的十年大限而失去拿到博士學位的機會。換句話說,如果我是學生乙的指導教授,我是絕對不會讓這樣水準的博士論文被拿出來答辯的。當然啦,年輕教授的殺氣通常比較強,而資深教授則是比較替學生著想。

在學生乙答辯前我跟他的指導教授密談了將近一個小時。我對於學生乙的博士論文水準表達了我的不滿,而他的指導教授也同意我的看法。但是他告訴我他之所以讓這個學生答辯是因為學生乙會走到今天這個地步有很大一部分是我們系上老師的責任。在我進來UNT之前的幾年我們系上經歷了很多人事上的波動,教授離職或是退休的比例非常的高。更甚者,有一些老教授佔著位置卻不做事,結果很多博士班學生就在這些人事變動中浮載浮沈(所以各位博士班的學生,選對指導教授真的很重要)。今天學生甲跟乙成為沒有人要的博士班孤兒其實不是他們的錯,而是系上政策與老師的錯。要不是這兩個學生之前的教授半路把他們給拋棄,他們可能早就拿到博士學位(當然也有可能他們永遠拿不到博士學位)。從另外一方面來說,如果學生乙從一開始做論文的時候(大概是六、七年前)就給我指導的話,我絕對早就讓他做完論文畢業了。我同意這位資深教授的說法,雖然我並不是那麼的同情他們(說我冷血吧!我覺得博士學位不是用同情心給的。不管你的遭遇有多坎苛,你如果沒有達到我設的標準,你就不要想在我的手上拿到你的博士學位。),但是我還是決定網開一面,下不為例。

所以我說,拿一個博士學位有多難其實是要看情況的:看你指導教授要求多少,看你的論文委員要求多少,還有其他很多不可測的因素。聰明的人不一定就拿的到博士學位,平凡的人也不是沒有機會。我想,世界上很多事情就是這樣吧!

教授的一天

Professor有些人覺得當教授是一件很爽的事情,工作時間自由又有寒暑假。這樣說雖然沒有錯,但是這些人沒有看到的是大部分的教授下班之後花了多少的時間讀專業期刊論文、思考他們的研究、和改學生的作業。我的一天跟別的教授的一天可能不同,但是相同的是我們都有作不完的事情。

8:00 am 起床

8.30 am 出門,送兒子上學

9:00 am – 10:00 am 校務會議

10:30  am 本來一個小時的校務會議開了一個半小時,開到我很想睡覺終於開完了。

10:45 am 回到我的辦公室

10:45 am – 11:00 am 處理信箱裡的20封e-mail,包括學生要求meeting,期刊出版社要求更改資料、高等教育專業社團的研討會request for proposal…等等。

11:30 am – 12:30 pm 跟一個對我們系上博士班有興趣的學生討論申請的可能性

12:30 pm – 1:30 pm 準備晚上的教課(同時花了15分鐘吃午餐)

1:30 pm – 3:30 pm 兩個小時的系務會議在砲火與激烈的爭辯中度過(說實在的這樣的會議比起早上那種死氣沈沈的校務會議開起來是有趣多了)

3:30 pm – 4:00 pm 改博士資格考的考卷(未完成)

4:00 pm – 5:00 pm 繼續準備晚上的教課

5:00 pm – 5:30 pm 與博士班學生開會討論他的功課和成績

5:30 pm – 8:30 pm 教課

9:00 pm 回到家,餵女兒喝奶(因為我老婆用奶瓶餵我們女兒不願意喝,所以只好作爸爸的餵)

9:15 pm – 9:45 pm 晚餐

9:45 pm – 10:45 pm 休息、看電視、陪老婆聊天

10:45 pm – 11:45 pm 上網付帳單(我們家是我負責管帳)、處理個人e-mail、上網隨便晃晃

11:45 pm – 12:00 am 洗澡、盥洗

12:00 am – 12:30 am (or 1:00 pm) 看書、準備就寢

12:30 am (or 1:00 am) 就寢

少了什麼?

  1. 作研究:整天忙東忙西的,哪有時間作研究?問題是不作研究也不行,沒有發表在美國大學是混不下去的。只好在開會跟教課之餘多找時間作研究。
  2. 改作業:因為我教的課都是博士班跟碩士班的課,沒有TA,所以作業都要自己改。偏偏我又很愛出那種要寫很多字的作業,結果改不完的作業只好週末改。
  3. 陪家人:還好我不是每天晚上都要教課,所以我多少還有一些時間陪家人。
  4. 運動:What? What is that?
  5. 讀聖經、禱告:有的時候在吃早餐的時候讀聖經、禱告。趕時間的時候就沒有讀經禱告了。

職業選擇

Institutional Research前幾天跟我博士班的好朋友通了一個電話。他目前的工作是在一個小的州立大學擔任 Institutional Research (IR) 的主任。(我不知道 Institutional Research 中文要怎麼翻。有些台灣的學校好像把 Institutional Research Office 翻成研究發展中心,但是在美國的大學中 Institutional Research Office 的工作份量比台灣的研發室多得多,其重要性也不是台灣的研發室可以比儗的。)我跟我的好友談完公事之後,我們便談起最近的生活。他告訴我說最近有好幾個學校想要挖角他,他們開給他的薪水大約是年薪美金15萬上下。我於是問他現在的薪水大概多少,他跟我說大約12萬美金左右。我聽了之後其實沒有很驚訝,因為我之前就研究過 IR 領域的薪水。我只是覺得不同的職業選擇真是有不同的出路。

其實以我的背景跟資歷要在一些美國的中小型大學找到 IR 主任的工作並不是太難的一件事。年薪12萬是我現在年薪的兩倍以上。我大可以脫離學術界而走上實務。高等教育行政這個領域就像商業管理、法律、或是很多其他的專業領域一樣,在實務界工作的人往往比學術界的人賺得多很多。如果從金錢的角度來考量,在學術界工作實在不是一個好的選擇。既然如此,為什麼還是有人要在學術界工作呢?

以下我列出在學術界工作的優缺點。先說優點吧!

  • 工作時間自由:沒有人管我早上幾點起床,幾點上班,幾點下班。我可以每天睡到中午,然後從下午上班到半夜12點。這對我來說是選擇當教授很重要的原因之一。
  • 可以作自己有興趣的事情:任何實務界的管理工作都有上級。你當到了一個公司的 CEO ,上面還有董事會。就算你當到了董事長,上面也還有股東。大學裡也是一樣。校長上面有學校的董事和州政府的教育局。不管你爬得多高永遠都有從上級來的壓力。跟實務界的管理工作比起來,學術界的自由度算是非常大的。雖然當教授也有不得不做的事情,至少我可以決定我想要研究的主題和方向。我想這對於很多從事學術工作的人來說是一件非常重要的事情。
  • 有寒暑假:這個大家都知道了,不必多說。
  • 可以走在時代的尖端:在學術界工作的好處之一是可以接觸到自己的領域中最先進的研究成果。也許對於一般人來說這沒什麼大不了的,但是能夠走在時代的尖端是很多人想在學術界工作的主要原因之一。
  • 在學術界工作的人可以在社會上受到尊重:不管在台灣還是美國社會,「教授」在社會大眾的心目中都享有一定程度的尊重。也許是個人的虛榮,但是我承認這樣的虛榮的確是我想當教授的原因之一。

在學術界工作的缺點有:

  • 跟實務界的工作比起來薪水較低:我這裡保守的說「較低」。在高等教育管理這個領域,「很低」是比較貼切的形容詞。
  • 雖然有寒暑假但是放假沒有薪水拿:當教授可以放寒暑假很爽是沒有錯,但是教授的寒暑假是沒有薪水拿的。美國一般的工作都有年假。以前我在 Indiana 上班的時候一年有一個月的年假。所謂的年假就是我可以去渡假但是還有薪水拿。這樣放假才放的爽。當教授沒有這種好事,放假可以,薪水,對不起,沒有。
  • 永遠要承受出版的壓力:我想很多人都聽過一句話: publish or perish 。意思是說在學術界如果你沒有不斷地發表新的學術論文,你就準備被淘汰、飯碗不保。我想很多人之所以不願意進入學術界工作,這是主要的原因之一。至於那些已經進入學術界工作的人通常都有了心裡準備,所以沒什麼好抱怨的。

這樣說來,在學術界還是在實務界工作好其實各有好壞,端看個人的選擇。我目前很喜歡學術界的工作,但是難說我會不會有一天改變主意,決定跳進實務界去體驗一下不同的生活,順便多賺一點錢。