Monthly Archives: June 2010

8 posts

Washington D.C.

Washington D.C. 不是一個讓我印象太好的都市。

我到過DC的次數不多,大概4-5次吧!奇怪的是,我每次到DC都覺得這是一個很奇怪的城市。以下是我這次到DC的一些觀察。

流浪漢

一從DC的地鐵站走出來,迎面看到的就是一個流浪漢。這讓我想到為什麼我一直覺得DC是一個奇怪的都市。我每此來到DC都看到很多流浪漢。並不是說美國其他的城市沒有流浪漢,但是我一直覺得DC的流浪漢好多。中午我到McDonald吃午餐,一走進去又是一個流浪漢在跟店長要東西吃。身為世界最進步和富有的國家之一的首都,Washington, D.C.竟然有那麼多的流浪漢,這背後的含意真是值得我們好好思考。

公寓

我相信從亞洲國家來的人應該對於大廈式的公寓非常熟悉。除非是非常有錢的人家,否則大部分亞洲國家的家庭都是住在大廈式的公寓裡面。美國完全不是這樣。在美國除了在一些大都市有大廈式的公寓,一般的美國人都是住在平房裡面,就算是公寓也很少有超過三層樓的。結果今天一走出地鐵站除了看到流浪漢,另外看到的就是一棟好高好高的公寓。雖然不是什麼大不了的事情,但是很久沒有看到公寓之後又在美國看到大廈式的公寓讓我有一種很奇怪的感覺。

麥當勞

剛剛提到我中午在McDonald吃午餐。在我印象中麥當勞是個講究服務的地方,但是不知道為什麼DC的這一家麥當勞的服務態度真是非常的差,而且每一個店員都表情嚴肅。更奇怪的是我吃飯吃到一半進來了一位黑人的女士,她穿得頗正式(可能剛從教會出來),但是他的言行舉只有點怪怪的。她坐在我的隔壁座,吃完午餐後去洗手間,出來的時候大叫說廁所的門壞掉了,然後又大叫說有一個女人倒在廁所裡面,叫店員趕快去看。奇怪的是沒有一個店員有反應,大家都好像沒有看到她一樣。於是她就悻悻然的走出店裡。當時我還很擔心女生廁所裡面是不是真的有人昏倒,為什麼沒有人去看一下呢?結果幾秒鐘之後我看到另外兩個客人從女生廁所裡有說有笑的走出來,所以到底發生什麼事?我不知道,奇怪的城市!

2010 NBA 總冠軍

昨天是2010球季NBA總冠軍賽的最後一場比賽。今年的總冠軍賽由歷史強隊LA Lakers對上死對頭Boston Celtics。兩隊在七戰四勝的比賽中血戰七場。昨天的最後這場比賽,上半場結束的時候Celtics還領先六分,第三節的時候甚至有領先到11分。然而到了第四節Celtics突然之間大家都失去了準頭。於是就這樣看著分數慢慢的被Lakers追上來,最後在比賽結束前兩分鐘兩隊狂飆三分球,Lakers反敗為勝以83:79拿到2010球季的總冠軍。

說實話,今年不管是Lakers或是Celtics拿冠軍我都不會覺得意外。我是Dallas Mavericks的球迷,所以他們兩隊誰拿冠軍對我來說既不興奮也不難過。但是整個季後賽看下來,我最大的感想就是:

現今的NBA軍備競賽真是越來越變態了!

今年的NBA球季在季後賽開打的時候大家最看好有機會拿冠軍的球隊有三個:西區的Lakers,東區的Cleveland Cavaliers和Orlando Magic。這三支球隊都有各自的當家球星,但是與很多其他的球隊不同的是他們這三隊的二當家或是三當家到了別的球隊恐怕也是當家球星。這些巨星級的球星之所以願意到別的球隊成為別人的副手,原因只有一個,就是為了拿總冠軍。Lakers的當家球星是大家耳熟能詳的Kobe Bryant,而Lakers的第二把交椅Pau Gasol則是以前在Memphis時的大當家。Bryant的其他助手像是Lamar Odom和Ron Artest也都是可以獨當一面的球員。Cavaliers有眾所矚目的籃球大帝LeBron James(不過大帝在NBA打滾了七年還沒有打進過冠軍賽),他是今年夏天大家爭搶的自由球員。James的助手有年紀雖然有點大但是名列NBA史上最偉大中鋒之一的Shaquille O’Neal,還有本來在Washington當老大但是在球季中被Cavaliers交易來當助手的Antawn Jamison。Orlando Magic有新一代的超人中鋒Dwight Howard,他的助手有已經老了的飛人Vince Carter和明星前鋒Rashard Lewis。

Lakers在2010年的西區季後賽順利的拿下了西區的冠軍,但是東區的冠軍既不是大家最看好的Cavaliers也不是年輕有為的Magic。東區的冠軍竟然是垂垂老矣的Celtics。但是你可別小看Celtics,他們的先發陣容資歷打開可是會嚇死人的:Paul Pierce – 2008年NBA總冠軍賽最有價值球員、八次入選NBA全明星隊、2010年NBA三分球大賽冠軍;Kevin Garnett – 2004年NBA最有價值球員、13次入選NBA全明星球員、2008年NBA最佳防守球員,其他豐功偉業不可盡數;Ray Allen – NBA史上最佳三分球射手之一、九次入選NBA全明星球員、2001年NBA三分球大賽冠軍。

看到這裡,我想表達兩點想法:

第一,NBA總冠軍是給有錢的球隊玩的。看看上面這些球員的薪水,傻子也可以想像一支想要拿總冠軍的球隊需要花多少錢來請這些明星級的球員。有一些球隊的老闆比較省(像是有名的LA Clippers老闆Donald Sterling),這些球隊拿冠軍的機率近乎於零。

第二,LeBron James如果真的想要成為NBA大帝,而不是像悲情的Karl Malone和Charles Barkley雖然個人能力極受肯定但是一輩子沒有拿過NBA總冠軍,那他最好的去處恐怕是Dallas Mavericks。看看今年夏天James有可能的買主,Cleveland雖然是他熟悉的地方,但是O’Neal已經垂垂老矣,除非Cavaliers可以另外找到一個巨星級的球員來當James的助手(目前看起來不太可能),否則Celtics和Lakers這兩關恐怕永遠很難過,更別提還有大幅進步空間的Magic。而Mavericks雖然有主將Dirk Nowitzki,但是過去這幾年的經驗已經證明靠著他一個人是拿不到冠軍的。如果可以加上James,一裡一外,那Mavericks將會是NBA其他球隊最害怕的對手。所以,LeBron James,來Dallas吧!

統計軟體SPSS和R

最近,我對於SPSS越來越不滿。很想要把它給甩了,但是它卻像水蛭一樣吸著我的血卻怎麼甩也甩不掉。

SPSS是一套一般性的統計軟體,跟它類似的統計軟體有SAS、Stata、和R。SAS是一般企業界和學術界最廣泛使用的統計軟體,但是在學教育的人當中使用率卻不是那麼高。原因在於用SAS作統計分析需要做比較多的程式編碼,這對於很多學教育的人來說是一大困難。SPSS正好彌補了這方面的需要。SPSS並不是最強大的統計軟體,但是它具有最容易上手的使用者介面。因此,很多教初階統計的教授很喜歡用SPSS。因為這樣他們就不用花太多的時間教學生怎麼寫程式。就在這樣的背景之下,我從碩士班一路讀到博士畢業,SPSS是我唯一聽過和用過的統計軟體。

博士畢業之後我到Indiana University的NSSE工作,正好NSSE也是用SPSS,所以我便得心應手的繼續使用SPSS。三年在NSSE的工作經驗讓我對SPSS的熟悉度大幅的提升,我也可以非常熟練的透過SPSS syntax來執行各種統計分析而不需要用到下拉式的選單。很自然的,我對SPSS的依賴也越來越深。

也是在NSSE工作的時候我遇到了來自不同背景的研究員和分析師。我的一位具有公共行政背景的同事告訴我他以前學的統計軟體是Stata。他說Stata的功能比SPSS強大許多,但是要上手比較難。後來我又遇到很多在Institutional Research (IR)這個領域工作的人用SAS。根據SAS使用者的說法,SAS在處理大型數據資料的效率比SPSS好很多。聽到這個消息曾經讓我很想要學SAS,因為我做研究的資料檔案動輒就是幾百MB,甚至有上GB的。這些SPSS資料檔在我的電腦上光是開啟就是一筆時間。整個研究做下來有很多時間都浪費在等待電腦跑結果上。但是因為同事間沒有人用SAS,所以我遲遲沒有對SAS下手。

在NSSE工作的時候我也聽說了R這套開放源碼的統計軟體。當時的我之所以會對R有興趣是因為它是開放源碼(open source),所以是免費的。其他三套統計軟體都是天價:SPSS基本版要價美金$700,如果再加上其他常用的附加功能,$2,000恐怕是少不了的。SAS要價一年美金$8,100,不要懷疑,你沒有看錯,八千一百大洋是一套SAS一年的使用費。Stata稍微好一點,美金$1,595。

統計軟體賣的這麼貴的結果就是除非學校或是公司出錢,否則很少有人買的起這些軟體。這對當時還在NSSE上班的我來說沒有差,反正NSSE有的是錢,幾千塊美金對他們來說是不痛不癢。但是我來到UNT之後卻發現當教授跟當研究員真是不同。UNT只提供我SPSS的基本版,如果我需要其他附加功能(像是處理missing data的模組)那我就需要自己想辦法生錢來買。再者,我教的研究所課程常常需要學生做統計分析。雖然學校的電腦室都裝有SPSS,但是我的學生大部分都是上班族,住的離學校又遠(我有一個學生通勤單程就要3個小時,這還不包括塞車的時間),因此為了寫作業特別跑一趟學校的電腦室對很多學生來說是不切實際的。結果為了寫作業很多學生只好自己買一套SPSS裝在家裡的電腦上。不幸的是SPSS的學生版功能太有限,沒有辦法做到我要他們做的分析,所以我的學生只好花大錢買SPSS。這實在不是我所願意的。

最後一項我對SPSS不滿的地方是有太多高階統計的分析它做不出來。一些資料處理的方法像是multiple imputation和Heckman correction,或是高階的統計分析像是SEM、HLM…等等,SPSS都做不出來。結果是我必須另外花錢買一套軟體來做SEM,然後又是另外一套軟體專門來做HLM。這些錢都不是學校給的,是我要自己想辦法的。

就是在這樣的情況之下我開始接觸R。之前提過R是一套開放源碼的免費軟體。然而在IR領域很少有人用R,美國大學中的IR通常不是用SAS就是用SPSS,因此我在NSSE的時候雖然聽過R但是沒有接觸過。當了教授之後才發現在學術界用R的人還真不少(大概是因為很多教授都跟我有同樣的處境)。由於使用R的學術界人士非常的多,因此R的統計功能非常的強大。幾乎只要可以想的出來的統計分析R都可以做的出來。當然,這背後還有一個原因是它的開放源碼,因此任何人都可以幫R設計外加模組。R還可以做出其他統計軟體做不出來的圖形化報表(見下圖)。

既然R這麼的強大又免費,為什麼用的人大多侷限在學術界呢?原因很簡單,因為它要上手實在不是那麼容易。R不像SPSS只要用下拉式選單就可以完成大部分的分析,一切R的操控都是透過程式化的指令來進行。這意味著要學R先得學習用以操作R的S語言。我想很多學教育的人可能看到這裡就已經打退堂鼓了。我呢?我希望有一天我可以完全的用R來取代我電腦裡的SPSS、AMOS、和HLM。但是在那一天來到之前,我還是得繼續倚靠SPSS來完成我的研究。

最後是我最近在學R的時候參考的幾本書。我在Amazon.com買了好幾本R的書,也在我們學校的圖書館借了好幾本。我發現統計的教科書要嘛是寫得很好:易懂又教你實際操作,要不然就是寫的很爛:充滿各種專業術語跟符號但是又解釋的不清不楚。對於跟我一樣在學R的人,我推薦以下幾本書:

Introductory Statistics with R (Statistics and Computing)