2020年4月18日 星期六

大數據時代下的學術調查

拜網路與資訊科技之賜,人們的食衣住行都在有形或無形中都被記錄下來,也成為一個潛在的研究資源。大數據分析也逐漸在社會科學學術界流行起來。
人們去過那裡、買了什麼、花了多少錢、生過什麼病、看過什麼網站...。各種生活點滴都逃不過資料庫的紀錄。由於這些內容都是實際生活中的真實紀錄,因此相對於傳統調查,大數據資料可以避免人們因為記憶偏差或者主觀意識而忘記或隱藏部分內容。也由於大數據是全面紀錄所有人的活動,因此也降低了傳統抽樣調查可能因抽樣技術、無法接觸而產生的偏誤或代表性問題。加上分析工具的普及,也大幅降低了大數據分析的門檻。
當然,大數據也有所限制。正由於它的全面性,而產生了隱私及研究倫理的問題,也因此有了許多規範上的限制。很多時候,研究者往往只能取得一定比例的資料(但這種實驗室中抽樣,仍比田野訪問可以控制得多)。或者當所需資訊分屬於不同資料庫的時候,也會被限制或因技術問題(缺乏共同的key值)而無法串聯。
傳統學術調查在大數據的風潮下,必要性的確受到了擠壓。但我仍為並不會沒落,而是轉型與大數據相輔相成持續擴大。大數據的優勢在於事實資料的搜集,對於人們的想法的了解則較為薄弱。雖然研究上可以透過實際行為推測人們的決策,或利用內容分析了解人們的想法。但前者的推估較為間接,內容分析也因為只能搜集到特定族群的內容(例如會在網路上發表意見的人),而可能存在偏誤。因此,在可與大數據資料串連的情形下,學術調查便沒有必要再搜集實施資訊, 而著重於人們觀點、態度資訊的搜集。其次,大數據資料之間的串連限制也是學術調查可以協助的部份,可以透過問卷調查補充缺少的部分內容。

另外,學術調查也非只能作為大數據分析的輔助,仍然依據研究目的而定。畢竟取得及分析大數據資料仍需要相當的成本。在目的及成本效益的考量下,採用學術調查方式進行研究,有時仍是比較經濟的選擇。

沒有留言:

張貼留言