2015年2月10日 星期二

[讀書] 社會性標籤用於圖書館資訊組織研究之文獻回顧(下) : 主題標目之對比、適用範圍

上一篇文章中,說明了文獻回顧的動機、範圍,並從文獻回顧中指出社會性標籤對於圖書館的價值。本文將會進一步對比主題標目與社會性標籤,以及說明社會性標籤於圖書館資訊組織的適用範圍。

主題標目(subject heading)與社會性標籤之對比

國會圖書館主題標目(簡稱LCSH)是橫跨所有學科、發展悠久、英文世界中的主流索引語言,有豐富的連結和各種控制,且在圖書館目錄中很好擷取。加上,主題標目和社會性書籤都是針對物件主題內容以幾個詞彙代表,因此成為研究在比較社會性標籤與圖書館資訊組織時會選用的工具。


至於社會性書籤的獲取,由於除了EnLibs、Penn tag、OCLC的標籤系統外,並沒有多少圖書館有發展自己的社會性書籤工具,且由Penn tag的使用狀況就可以發現圖書館使用者不太會在圖書館目錄上標籤,圖書館的標籤功能頂多協助使用者管理報告或進行合作計畫。(Thomas, 2009)因此,多數研究都是從Library thing取得書籤。

Library thing於2005年開始發展,到2013年四月時,已經有超過一百六十五萬名使用者替超過八十萬本書籍下標籤。Library thing有發展小工具LTFL(Library thing for library),方便圖書館將他們的書籤鑲嵌在自己的目錄上面,可以用標籤雲的方式呈現、也能利用標籤進行簡單的搜尋,但是並無法融入圖書館的查詢系統,讓在圖書館目錄查詢字詞時可以連結到以該字詞作為標籤的書籍。(Pirmann, 2012)有一些圖書館則會使用Aqua browser來展現書籍的標籤。(Williams, 2013)


1. 控制詞彙與非控制詞彙

社會性書籤與主題標目的對比,可以看成非控制詞彙與控制詞彙之對比,由於本質上的應對關係,多數研究都把兩者的差異直接 (Thomas et al., 2010)陳述,在此前提下進一步以研究比較主題標目與社會性標籤的差異。

控制詞彙發展已久,是由專家根據規則進行人工編製而成。最被詬病的問題是規模小、效率差、成本高,無法跟上網路素材提供的速度和多元描述條件;而且其未能因應時代調整用字、只反映少數人的觀點,編目錯誤要過很久才會被發現和矯正,彈性很低;還有如果不熟悉編制者使用的專有名詞和思考脈絡,使用時就會遇到很多阻礙。

非控制詞彙由於是由一般使用者共同參與提供,可以反映多元觀點、即時回饋,且會放大規模、提升效率、降低成本,且可能會因為完整看過資源內容而有更符合內容的標籤。

然而,非控制詞彙不向控制詞彙一樣,具有清楚的層次,控制詞彙因為有清楚的類別、類別階層,就能做成欄位方便自動化擷取。另外,控制詞彙能解決「一字多義、一義多字、同形異義、拼字錯誤、語意模糊、時態、單複數」諸多問題,可以提升查詢效率。 (Trant, 2009;Rolla, 2009;Thomas, 2009;Thomas et al., 2010;Pirmann, 2012)

再者,社會性標籤的起始動機是自己管理自己的資訊,不一定適合他人使用,且唯有在大量人參與標籤時,才會有比較可信的類別劃分,但是唯有大眾流行中的物件才會吸引多人參與,不利於過時、專業的資訊組織。事實上,即便有足夠人數挖掘資訊間的關係,這些人也可能會追隨標籤中的意見領袖,或是任由少數標籤主導多數。(Smith, 2008)

2. 主題標目與社會性標籤的字詞運用

許多研究都發現書籍的社會性標籤數量比主題標目數量多出許多。Lawson(2009)的研究中,每本書平均有63個標籤、3個主題標目;Rolla(2009)除去標示時間、任務、計畫的個人化標籤後,每本書平均有35.16個標籤、3.9個主題標目。

然而,並非所有書籍都會有標籤,老舊和不流行的資料往往就不會有人標籤,或無法累積足以產生意義的標籤量。有一些主題的書籍可能過於專業,標籤量也不足,如Lawson(2009)在其研究中選擇的「健康照護、數學、醫學(依科)、醫學(依身體系統)」學科書籍,在library thing及amazon就完全沒有任何標籤。

另外,社會性標籤通常是使用者為了管理自己的資訊而給予的標籤,因此有許多字詞會展現個人興趣、描述自我狀態(如「這本書是我看過的」),通常這些標籤只對使用者本人有意義,但有時這些標籤對於他人也會派上用場(像是他人欣賞書籤給予者的個人閱讀品味,就能從他的這個標籤找到他看過的所有書籍)。有些研究會將有錯字的標籤也算在這類方便計算。(Thomas, 2009;Lawson, 2009)

雖然社會性標籤有許多主觀詞彙,但是也產生夠多的客觀詞彙可以參考,並不會因為這些個人化主觀標籤影響其對於圖書館資訊組織的應用。Lawson(2009)的研究中,個人化標籤佔49%,Thomas (2009)研究中,個人化標籤則佔40%。Choi(2012)針對數位化一手研究資料的標籤做的研究也發現,超過一半的標籤是客觀描述物件主題的。

不過,在客觀性標籤中,有六成會使用至少一個和書籍名稱相同的字詞,主題標目則只有將近18%會使用書籍名稱。書籍名稱在目錄中會有其他欄位顯示,因此主題標目會傾向避免使用書籍名稱。使用者雖然也提供其他類型的客觀性標籤,但在下標籤時,會很頻繁的使用書籍名稱。(Lu, 2010)

最後,社會性標籤八成使用單數名詞,不同於主題標目傾向使用複數名詞。(Thomas, 2009)且社會性標籤通常都使用單一字詞,不同於主題標目使用主題,該主題可能不只是一個生字。(Rolla, 2009;Wu et al., 2013)

3. 主題標目與社會性標籤的替代關係

許多研究者都很好奇社會性標籤和主題標目的替代關係,了解替代的狀況,才能知道社會性標籤可以補足主題標目的哪些面向,而主題標目哪些是無法被社會性標籤取代的。

替代關係可以分成書籍層次和單字層次。

書籍層次,各研究的結果都不同。Rolla(2009)的研究中,55.6%書籍的主題標目是標籤未提到的;但是75.6%的書籍,標籤和主題標目會用不同的詞彙表達相同概念。Thomas(2009)的研究指出,26%標籤是主題標目所沒有的概念。Lu(2010)的研究中,85%書籍的主題標目至少會被標籤使用到一個,97.8%書籍的標籤和主題標目不同。這些研究突顯出標籤其實可以表達主題標目想傳達的意思,且會比主題標目更豐富。

然而,Rolla(2009)指出,主題標目會更仔細的專指特定事件或地方,tag則是比較一般性、抽象的。特別是地名,主題標目會比標籤更仔細。Lu(2010)的研究中,則可以發現,只有18.2%的標籤會對應主題標目的年代次類別,可能是使用者無法辨識的。

另外,Rolla(2009)的研究發現,標籤會一再被反覆使用,一個標籤平均會重複33.5次,主題標目平均重複7次。Thomas(2009)則發現標籤對應到主題標目的BT、NT、RT只占0.3%左右。都可以發現主題標目事先設計好的類別層級架構以及規則,有效的提升資訊組織的品質。

最後,雖然想要以社會性標籤來彌補主題標目,然而在主題標目較弱的類型(小說、非小說、童書、體裁小說、食譜、小說回憶錄、自傳、神學小說、自助書籍、圖畫小說)中,食譜、自傳、童書的標籤也都很少,並無法發揮彌補的作用。(Thomas, 2009)

4. 主題領域差異

不同領域,由於使用者的訓練背景不同,就會影響其產出的社會性標籤。也會由於主題性質差異,影響主題標目數量。

Lawson(2009)的研究中,「人類學、傳染病、健康照護、臨床科學」這些主題類別平均有超過5個主題標目,「化學、教育、政府文件、音樂、表演藝術、哲學宗教心理學」這些主題類別平均則只有1-2個主題標目。「政府文件、資工、健康專業與公衛、化學」這些類別的主觀標籤最少,「教育與娛樂、社會學、醫學(依科)」的主觀標籤最多,可以反應使用者對於不同主題類型的資料會有不同的標籤行為。

在圖資領域的一般使用者對於控制詞彙都有基本了解,且多半熟習網路工具,社會性標籤和控制詞彙的重疊情況就比較高。 (Wu, et al., 2013)

Choi & Syn(2012)針對NINES(Networked Infrastructure for Nineteenth-Century Electronic Scholarship)研究發現,至2012年,8297個物件只有1542個標籤,標籤最多是在描述物件的體裁、形式、載體、顏色等「類型(type)」,緊接著是「主題(topic)內容」的個人或機構、概念事件或活動、地理位置或時間。標籤最少的是物件的所在地或來源、物件的年代,且表達個人意見或使用脈絡的自我指涉標籤也很少。可見學術用一手資源標籤情況和一般書籍式不同的,然而甚少針對用來教學、研究用的一手資料標籤做研究。Anfinnsena et al.(2011)的研究也指出,使用者希望能以顏色區分標籤提供者的類型,了解是大學生、研究生、教師或館員所給的標籤,這些都反應大學圖書館的特殊需要。

5. 語言差異

當研究者強調網路環境的改變使社會性標籤成為再自然不過的事情、必須要嚴正以待(Smith, 2008)之際,應該注意這些社會性標籤或社會性標籤用於圖書館的研究主要是在使用英語的國家中進行,而並非每個國家或每種語言使用者的社會性書籤使用發展情況都相同。

Wu et al.(2013)的研究指出,同一本書的英文社會性標籤大約是中文的兩倍,可看出兩者使用社會性標籤的熱烈程度之差異,且中文使用者會參考英文使用者的標籤,將英文標籤翻譯成中文標籤,或直接應用這些英文標籤,英文使用者則不會有這種情況。研究者認為這些差異來自使用者是否熟悉另一種語言有關。

另外,英文不論是社會性標籤或主題標目,主題性詞彙(描述書籍內容主題)和非主題性詞彙(不屬於書籍內容主題的描述)的比例都是約1.85比1;中文主題標目的主題性和非主題性詞彙比為2.51比1,社會性標籤的主題和非主題性詞彙比為3比1。研究者對此未作探討,若要進一步分析,可能會連主題標目的中英文使用習慣差異都要一起討論。

再者,英文社會性標籤常常以單一生字描述,與控制詞彙使用多個生字形成的詞組有明顯差別,中文的社會性標籤和主題詞則通常只差一個字,差別的幅度就比較小。這可能來自中文和英文的字詞結構不同。這些差異都值得進一步了解背後的原因。

社會性書籤於圖書館資訊組織的適用範圍

多數研究的結論都指出,社會性書籤不能取代圖書館資訊組織,只能協助修正和補充。在主題標目涉及敏感議題、數量不足(如小說類)、無法反映當代快速變動時,適合用標籤補充。(Pirmann, 2012) 然而,雖然一些圖書館提供標籤給使用者多年,卻沒有獲得證據顯示圖書館確實提升使用者的查詢效益或滿意度。(Gerolimos , 2013)

另外,由於目前標籤用於搜尋的功能不彰,只能用標籤雲瀏覽,無法展現標籤之間的邏輯性連結,而且不太能組合多個標籤來限縮查找對象,因此社會性標籤通常只能用來瀏覽、大範圍探索,不能用來查詢特定物件。(Pirmann, 2012)

Spiteri(2009)認為可以使用層面(facet)來澄清標籤的脈絡、提供更好的瀏覽經驗。但是Thomas et al.(2010)指出,社會性書籤在開放、自行創造的環境中出現,若給予太多限制會降低意願。

一些學者則特別指出學術圖書館與一般社會性標籤網站的差異。一方面,學術圖書館的館藏書籍因為年代久遠或過於專業,較少人會標籤(Lawson, 2009;Pirmann, 2012);另一方面,學術圖書館的脈絡主要是滿足學者的資訊需求而生。學者需要連結、脈絡、關係的整體,不似一般使用者的快速資訊尋求,可以被片段資訊或事實滿足,不需要任何脈絡和關係。再者,學者需要書籍,書籍比網路資源需要花更多時間和注意力來理解其內容和關係,且書籍世界比網路世界小、資訊變動較少又可以保存較久,事實上比網路世界好掌握,也值得花時間捕捉並呈現書籍世界的關係。(Mann, 2008)

為了滿足學者的複雜需求,編目規則必然也會很複雜,需要交由受過訓練的專家使用。主題標目透過BT、RT、NT等可以展現更多連結關係,呈現資訊的整體面貌。並非像社會性標籤是為了自己的需要標籤(Smith, 2008, Thomas et al.,2010),描述較一般性且連結關係少。如果使用者不會用主題標目,館員應該要想辦法要進行資訊素養教育。(Mann, 2008;Lawson, 2009)

最後,對於一些網站(如delicious, flickr)來說,標籤是必然的過程,沒有使用者參與,這些網站就無法運作。然而,圖書館目錄已經存在多年,就算沒有大眾參予,也將繼續存在和運作,使用者的標籤行為必然不同於一般網站,圖書館在納入社會性標籤時應該多加評估,畢竟圖書館的目的是要用有組織的方式提供資訊,並非一味順從使用者而放棄專業,社會性書籤無法取代圖書館既有的資訊組織工具。(Gerolimos , 2013)

0 意見:

張貼留言