學術面訪調查的執行

2020年10月10日星期六

追蹤調查預試

預試（pretest）的主要目的是測試問卷。在問卷初步設計完成後，為了在正式調查前，確認問題是否能達到預期成效、訪問操作是否確實可行，都會進行預試。

為確保測試效果，預試一般會採用於正式相同的調查方式縮小規模。因此也算是一次小型的調查案。例如若正式調查將採用面訪進行，預試通常也會採用面訪。同時，也將採用與正式訪問相同特徵（如類似的年齡層、性別、都市化程度等）的樣本進行訪問。但為了避免預試干擾正式訪問的結果，預試樣本必須與正式樣本區隔，不得重複。

由於預試的目的是測試問卷，並非真正進行研究，因此訪問規模並沒有限制。主要視預算、人力及問卷特性而定。此處所指的問卷特性，將與樣本的選擇相配合，預試必須確保所有題目都被測試到，因此，抽樣或樣本選擇時，應儘可能包含所有的情形。若問卷中有針對較特別對象或情況設計的題目，應儘可能針對這些情形挑選樣本。如果無法在抽樣時選定特殊樣本，則應適度擴大樣本數，以提高訪問到各種類型受訪者的機會。雖然預試仍然會進行抽樣，但抽樣的隨機性並不是最重要的，各種情況的涵蓋性才是重點。

在訪員的選人方面，預試應儘可能挑選資深訪員進行訪問。資深訪員對於訪問中發生的非預期情形有較好的的應變能力。也可以透過他們的經驗，發現調查執行的操作問題，即時反饋。預試結束後，將召集所有的訪員召開訪員會議。透過訪員會議，由訪員反饋訪問中的各項問題與建議，做為後續問卷修訂的參考。訪員會議時，應與訪員確認各項執行細節是否順暢，包含題目是否容易詢問、受訪者是否了解題意、各項文件及紀錄方式是否符合所需等。此外，預試的訪問結果也將是後續問卷修訂的重要依據。利用次數分配、因素分析等方式，確認問題的有效性。

對於追蹤調查而言，由於許多題目是長期詢問以觀察變化的。這些題目已經詢問過很多次，因此沒有進行測試的必要。在預試時，可以刪減這些不需測試的題目，以節省經費。若需要測試的題目較為單純，也可以考慮採用認知訪談的方式進行。尋找少量的受試者，由題目設計者自行進行訪談，評估題目的效用。

為節省調查經費，追蹤調查的預試一般而言仍以新抽樣方式進行，不會進行追蹤。但若需測試的題目與前後期問卷相關，仍可能針對預試建立追蹤樣本。

2020年7月19日星期日

克難式網路調查

要建構一套電訪系統所費不貲，且架構複雜。除了軟體外，還需要專屬的場地、電腦設備、總機系統等等。若非經常性的執行電訪，或具有一定的規模，實在難以負擔，也沒有必要建構一整套電訪系統。
對於沒有訪問名單，需進行隨機撥號抽樣的電訪計畫而言，似乎就只有委託專業電訪機構執行一途了。但如果你有訪問名單，且撥打的規模也不會太大，則可以自己找些訪員，靠人工撥號的方式進行。
本篇文章想要分享的，就是在人工撥打電話訪問的情形下，如何利用免費的網路調查系統輔助調查的執行。此方式雖然仍必須靠人工撥打電話，但訪問是透過網路調查系統進行，可以依據需求設定跳題、填答範圍等功能。另外，管理者也可透過後台即時了解完成訪問的狀況，並直接匯出資料檔進行分析，對進度的掌控及執行進度仍將有相當程度的助益。

這次我採用的的是LimeSurvey。這是一套以PHP及MySQL開發的開放原始碼網路調查系統。在官方網站上，可以下載安裝程式自行架設（當然，你必須有支援PHP的web server及MySQL server），或者，也可以採用官方提供的網調服務。不過，官方提供的免費版調查服務每月只能進行25份問卷，只能做為測試性質，真的要執行一次調查，還是必須要付錢。

每一份LimeSurvey調查專案都會有一個專屬網址，在進入網址後，輸入token即可進入指定問卷。而token是可以自訂的。我們便利用此特性，在匯入樣本時，將token設定為問卷編號，再將問卷編號配發給訪員，進行電訪。

問卷設計時，問卷的第一題設定為顯示題，顯示受訪者姓名、電話等資訊。這些資訊都將隨樣本匯入系統。在訪問時，訪員依據分配的樣本編號清單輸入樣本編號，即可進入這份問卷的第一題。依據畫面上顯示的姓名、地址等資訊撥打電話。若成功接通，則進入下一題開始進行訪問。如果未找到受訪者，直接將視窗關閉即可。
由於LimeSurvey是網調系統，不具備紀錄撥打內容的功能。因此，若需紀錄每次撥打的結果，仍須仰賴紙本。
另外，LimeSurvey會利用cookie紀錄輸入內容，因此不論無法接通或者訪問成功，訪員都必須關閉瀏覽器再重新開啟調查網頁，才能夠輸入下一筆編號。可在桌面建立連結至調查網址的捷徑解決。

訪問時，管理者可透過後台即時了解各樣本的完訪狀況及填答結果。訪員也僅需根據系統顯示題目逐一詢問即可，降低出錯機率。完訪資料也可直接匯出。相較於紙本訪問方便不少。

2020年6月7日星期日

行業與職業

行業與職業是許多問卷中都會詢問的問題。由於這屬於問卷內容設計，並非與執行直接相關，所以原本並未在我規劃的主題中。但最近不只一次被友軍問到行職業的問題，且從問題中發現對方充滿了誤解，因此臨時決定寫這一篇。

什麼是行業？什麼是職業？
當我們想要知道一個人的工作時，很可能會問「您在什麼行業工作？」或者問「您從事的職業是什麼？」可能得到的答案是美髮業、製造業、商、業務、工程師、公務員等等。這些答案有些是指行業，有些是指職業，不知道各位看官能否分辨呢？
簡單而言，行業指的是公司的分類、職業指的是個人工作內容的分類。因此，美髮業、製造業、商、公務員其實都是屬於行業。業務、工程師則是職業。這裏可能會有人質疑，「公務員」明明講的就是人，為何是行業而不是職業？主要的原因是，從「公務員」這三個字，我們只能知道這個人在公務機關上班，但無法知道他實際的工作內容；稅務員、行政人員，甚至廣義的法官、警察都是公務員，但因為工作內容不同，所以都屬於不同的職業分類，他們唯一的共同點，只有在公家機關工作，所以只能算是行業。同樣的道理，「從商」的人，可能是老闆、業務、會計、出納...，必須透過進一步詢問他的工作內容，才能知道他實際的行業。相反的，各行各業都必須將自己的服務或產品銷售出去，所以都需要「業務」，因此，業務將存在於很多不同的行業中。

我該問行業還是職業？
由於行業與職業是完全不同的概念，因此問卷中到底該問行業或是職業，其實還是要視最後的分析目的而定。但行業跟職業雖然概念不同，但卻息息相關，因此最好的方式還是一起問。
比較常見詢問行職業的方式，是詢問下面五個問題：

公司名稱：如果受訪者願意直接告訴我們完整的公司名稱，是最好的。我們可以事後直接透過查詢公司網站或商業登記進行行業歸類。但如果對方不願意，記錄部分名稱，仍然對於行業的判斷有幫助。例如：XX會計師事務所、XX食品股份有限公司等，我們仍然可以透過部分的名稱，了解行業的歸類方向。
公司的主要服務或產品：這是行業判斷的關鍵。對於許多產品或服務十分多樣的公司而言，「主要」一般是指最賺錢或花最多時間進行的那項產品或服務。
部門：指受訪者工作的單位，對於規模較大的公司而言，透過部門可協助我們釐清受訪者的職業。
職稱：同樣可做為職業判斷的參考依據，但很多公司會為員工冠上華麗的職稱，因此使用此資訊時要十分小心，仍應以工作內容為主。
主要工作內容：指受訪者實際的工作內容。對於工作內容多樣的人而言，應該進一步紀錄「最主要」的那一項，而何謂「最主要」通常由受訪者自行認定。

完整詢問上述五個問題，有助於精確判斷行業及職業，但這些資訊也很容易洩漏受訪者的隱私，因此請務必保密。
在上述這五個問題中，「公司的主要服務或產品」及「主要工作內容」較為抽象，如何以最精簡的文字紀錄下分類所需的資訊便十分重要。因此，如果是採用面訪、電訪等由訪員進行訪問的調查，訪員訓練便十分重要。問卷設計者必須事先決定採用的分類標準，並熟悉分類邏輯，清楚的告訴訪員遇到什麼類型的工作要記錄什麼訊息，才能事半功倍。而對於由受訪者自填的調查，則可透過舉例，引導受訪者提供所需的資訊。

行職業題適合用選擇題，而不是開放題嗎？
行職業題要採用何種題型，主要還是看問卷設計者的分析需求而定。大部分的行職業分類標準都是樹狀結構設計，分類由粗到細。如果研究者僅需最初的分類，可能僅將行業或職業分為十多個類別，可採用選擇題較為省事；但若需要更細的分類，則可能採用文字紀錄事後歸類的方式，比較簡潔。
但無論採用何種題型，有鑑於很多人容易將行業與職業搞混，因此充足的訓練或適當的舉例都是十分重要的。

2020年5月3日星期日

追蹤調查問卷設計

問卷設計是一項調查的核心，一般由研究人員根據研究主題設計想要詢問的內容。由於並非每位研究人員都有豐富的調查經驗，因此研究執行者在問卷設計階段主要的任務就是協助研究者修正編排問卷。例如：是否缺少了一些基本資訊？題目該如何排列訪問較為順暢？問題措辭是否容易理解？
追蹤調查（panel survey）顧名思義，是針對同一群受訪者長期的追蹤訪問。由於是長期、多次的訪問同一位受訪者，因此在受訪者體驗與訪員互動上都與一次性調查有很大的不同。這也將影響問卷的設計方式。傳統的紙本問卷調查由於很難根據每位受訪者不同的情形設計問卷，因此一次性調查與追蹤調查的問卷設計差異不大。但在現今電腦輔助調查逐漸成為主流的趨勢下，將有很大的轉變。
由於追蹤調查具有可觀察長期變遷趨勢的特性，因此雖然成本相當高，但世界各地仍有許多的追蹤調查資料庫持續不斷的建構著。綜觀所有的追蹤調查資料庫的問卷，雖然因為訪問的主題不同，而有不同的問卷設計，但共通的特性是問卷都很長。此外，為了了解受訪者的生活或想法是否有變動，有些題目也是固定每隔一段時間就會重新詢問的。
從研究者的角度而言，隨著研究與時間的推演，將從原始的主題中延伸出更多的問題，希望能夠更了解事情的全貌，希望能讓資料庫更為完成。而對受訪者而言，訪問時間越來越長、問題又不斷的重複，往往逐漸失去耐心。因此，如何兼顧資料庫的完整性，又能讓受訪者願意長期配合，成了問卷設計中很重要的問題。
對於追蹤調查問卷設計的思考，首先必須從整體「資料庫」的角度切入。應從歷年所有問卷的角度，思考那些資訊已經問過了、那些資訊需要重複詢問、那些資訊需要補充？除了整體問卷的思考，隨著調查波次的增加每位受訪者所搜集到的資訊也會產生差異。受訪者可能缺席了某幾年的問卷或者因為人生經歷的不同，而少問了某些問題。
因此，問卷設計必須越來越客製化，才能更有效率地問問題。許多不會變動的資訊可以透過事後的資料串連補充，不必重複詢問。部分問題也可以透過帶入前期資訊確認的方式予以簡化。而對於之前遺漏的訊息，則可以在適當時機對特定的訪問對象補問。這些都必須於問卷設計階段充分的考量，並配合高效彈性的訪問系統才能辦到。

2020年4月25日星期六

面訪調查前置作業

在一項學術調查開始前必須經過擬定預算、決定調查方法、設計問卷、預試、問卷修訂、抽樣、訪員招募、訪員訓練等程序。面訪調查是所有調查中預算花費最高，程序最繁複的。

預算的擬定是最重要的，但也與調查的每個過程環環相扣。預算直接影響樣本數、抽樣方法、問卷長度、品質控管等個階段。確定有多少預算，及每個程序需要花多少經費，才能精準的掌握調查經費。而在執行的過程中，會遇到許多突發狀況，因此也需時時檢討，配合不同的狀況調整。

在面訪調查中，仍需考慮採用紙本調查或導入調查系統。紙本調查適用於結構簡單的短問卷，由於初期投入成本低，所以也適合非經常性執行的調查計畫。不過在問卷編輯時，也必須同時考慮後續資料處理的方式，才能使的調查更有效率。電腦輔助調查則是今年越來越流行的面訪調查執行方式。電腦輔助調查具有資料即時回傳、問卷彈性、品質佳等優勢。但初期需建置系統、購買電腦及人員訓練，投入成本較紙本調查高不少，因此比較適合經常性執行調查的單位採用。

問卷設計則設計研究專業，通常由研究人員負責。但從執行的角度，仍需注意題目安排的順暢度、語意、問卷結構等問題。問卷結構與訪問的操作直接相關，必須確認有足夠的資訊指引訪員應如何詢問，或系統能否設定。語意也是十分重要的，很多研究用語一般民眾並不容易理解，需要提醒研究人員轉換為口語的說法。另外，若受訪對象可能慣用其他語言（台語、客語、原住民語、英語...），也需同時考慮題目要如何表達。若受訪者對於問題中的定義或專有名詞不了解時，訪員該如何說明，也需提醒研究人員注意。

預試則是在問卷設計初步完成後的小測試。預試並沒有一定的執行方式及規模，可視問卷設計的需要進行。準備充分的預試能讓正式調查更為順暢，減少題目設計不當導致受訪者無法理解，或資料缺乏鑑別度等問題。而在預試結束後，則應針對發現的問題進一步修正問卷後定稿。

抽樣是一份嚴謹的學術調查中不可缺少的環節。如何抽樣是一門專業的學問，不在我們的討論範圍內。通常是由研究人員決定抽樣方案，在執行層面僅需注意如何落實即可。

至於訪員招募與訓練則是另一個複雜的問題。面訪員需要當面拜訪受訪者，所以語言能力及社交能力十分重要。另外，在當地招募訪員，對於各地的街道分佈、人文環境較為熟悉，也比較容易找到受訪者。訪員最重要的目的是要能夠確實按照問卷的設計進行訪問，因此學歷不是重點，能夠理解並確實執行訪問的規定即可。面訪調查遭到拒訪或找不到人的機會很高，因此對於挫折的耐受度也是評估的重點之一。
問卷講解是訪員訓練的重頭戲，必須清楚地讓訪員了解問卷的重點及定義。此外，訪問工具的使用、訪問技巧傳授及練習，也是訪員訓練中不可或缺的。

2020年4月18日星期六

大數據時代下的學術調查

拜網路與資訊科技之賜，人們的食衣住行都在有形或無形中都被記錄下來，也成為一個潛在的研究資源。大數據分析也逐漸在社會科學學術界流行起來。
人們去過那裡、買了什麼、花了多少錢、生過什麼病、看過什麼網站...。各種生活點滴都逃不過資料庫的紀錄。由於這些內容都是實際生活中的真實紀錄，因此相對於傳統調查，大數據資料可以避免人們因為記憶偏差或者主觀意識而忘記或隱藏部分內容。也由於大數據是全面紀錄所有人的活動，因此也降低了傳統抽樣調查可能因抽樣技術、無法接觸而產生的偏誤或代表性問題。加上分析工具的普及，也大幅降低了大數據分析的門檻。
當然，大數據也有所限制。正由於它的全面性，而產生了隱私及研究倫理的問題，也因此有了許多規範上的限制。很多時候，研究者往往只能取得一定比例的資料（但這種實驗室中抽樣，仍比田野訪問可以控制得多）。或者當所需資訊分屬於不同資料庫的時候，也會被限制或因技術問題（缺乏共同的key值）而無法串聯。
傳統學術調查在大數據的風潮下，必要性的確受到了擠壓。但我仍為並不會沒落，而是轉型與大數據相輔相成持續擴大。大數據的優勢在於事實資料的搜集，對於人們的想法的了解則較為薄弱。雖然研究上可以透過實際行為推測人們的決策，或利用內容分析了解人們的想法。但前者的推估較為間接，內容分析也因為只能搜集到特定族群的內容（例如會在網路上發表意見的人），而可能存在偏誤。因此，在可與大數據資料串連的情形下，學術調查便沒有必要再搜集實施資訊，而著重於人們觀點、態度資訊的搜集。其次，大數據資料之間的串連限制也是學術調查可以協助的部份，可以透過問卷調查補充缺少的部分內容。

另外，學術調查也非只能作為大數據分析的輔助，仍然依據研究目的而定。畢竟取得及分析大數據資料仍需要相當的成本。在目的及成本效益的考量下，採用學術調查方式進行研究，有時仍是比較經濟的選擇。

2020年4月12日星期日

緣起

在學術單位從事調查工作已超過十個年頭。累積了不少經驗，也經歷了許多甘苦。
開始撰寫這個Blog，就是希望將自己這十多年的所見所聞記錄下來，做為人生的一個紀錄。也算是發發工作上的牢騷。

我的工作，是負責一個學術追蹤調查計畫的執行。因此，這個Blog將著重於執行層面的紀錄。雖然仍可能涉及一些抽樣、加權等較為技術或理論的部分，但並非此Blog的重點。

追蹤調查計畫顧名思義，是針對同一群受訪者不斷的追蹤，一次又一次的進行訪問。除了與常見的一次性學術調查相同，在一開始需進行問卷設計、抽樣及訪問外，後續還涉及與受訪者長期的關係維護，應是學術調查中最複雜的一種形式了。

我從事的調查工作，是以面對面訪問為主。因此，後續的很多內容也多為面訪的經驗。當然，為了能長期維持完訪率，後續我們也將調查形式擴及網路、電話、視訊訪問，不過，那又是另一個故事了 .....

訂閱：文章 (Atom)

2020年10月10日 星期六

追蹤調查預試

2020年7月19日 星期日