摘 要: 網絡時代提高信息服務質量的關鍵是信息篩選。網絡信息影響力評價方法主要有搜索引擎收錄情況、用戶訪問量統計和鏈接分析法,這些方法通過定量評價網絡信息,有效地彌補了同行評議法等定性評價方法的不足。結合這些方法為用戶檢索關鍵有效信息提供了一些思路。
關鍵詞: 網絡;關鍵信息;篩選;影響力;評估
如何從Internet資源庫中迅速準確地獲取所需信息成為目前一個亟待解決的問題。搜索引擎成為目前人們獲取信息的重要途徑。面對著大量的信息,如何進行有效處理?如何利用網絡篩選獲得自己所需要的信息?如何才能有效地利用這些信息?這些問題是能否高效利用現代化技術的至關重要的環節。然而,即使像Google和百度這樣技術先進的通用搜索引擎巨頭仍然面臨一些棘手問題尚未解決[1]。
(1)低查準率:查準率和查全率一直難以兩者兼得,通用搜索引擎往往以犧牲查準率來獲得較高的查全率,而這種做法對有特定信息需求的人群越來越顯得無能為力。
(2)搜索的“垂直度”問題:如何針對專業領域的行業需求,更精確地、深入地挖掘和獲取用戶所需信息既是一個難度很高也是一個亟待解決的現實問題。
1 網絡信息檢索的發展及其特點
網絡信息檢索系統的核心是搜索引擎,搜索引擎的發展史就是網絡信息檢索的發展史。網絡信息檢索呈現出以下幾方面的特點:
(1)多用戶
網絡時代的信息資源服務從一開始就是多用戶的,在此模式下,信息檢索的服務必須注重快速反應,注重對并發訪問的支持、對公共數據的共享、對臨時工作數據的清理等。
(2)海量數據
在網絡環境下,信息源眾多、數據量巨大。大數據量的后果就是垃圾數據增多,而尋找1種甄別數據有效性的高效信息檢索方法就顯得尤為重要。
(3)非專業化
網絡環境下使用信息檢索系統的用戶大多都不具備專業的信息檢索技能,這些非專業用戶不能像圖書情報專家那樣熟練地使用主題詞、分類號、邏輯組合和嚴格的查詢語言來檢索網上的信息內容。
2 篩選
提高信息質量的關鍵是由于網絡信息資源數量繁多,包羅萬象,所以對其應當有選擇、有甄別地利用。網絡信息資源的選擇應遵循以下原則:
(1)針對性原則。有針對地編制文摘、綜述、題錄等,通過各種交流途徑進行傳遞報道,及時提供給用戶。
(2)科學性原則。信息資源的選擇需要采用科學的方法,高質量的信息資源意味著它已經過質量的控制,已經得到組織加工并以1種系統而統一的方式存儲,在1個可靠的、用戶友好的檢索系統中提供對它們的存取。
(3)計劃性原則。對網絡信息的選擇要統籌計劃、歸類整合、制定目標、合理管理。
(4)對特定用戶進行跟綜服務、主動及時地提供新穎、準確、有價值、實用的專業化網絡信息資源。
2.1 篩選出真實信息,增強準確性
網絡上收集到的信息大都來源廣泛、涉及面復雜,往往混雜著一些不真實、不準確、虛假的、夸張的成份,對這一部分信息如不加以鑒別,就必然導致信息的不準確。所以在篩選信息時,要努力做到兩點:首先搞好鑒別,判斷其真實和準確程度;其次是追根溯源,一定要篩選出來重新核實,最大限度地剔除其不確定因素,確保所選的資料科學、周密、準確。
2.2 篩選出核心信息,增強服務性
在整理篩選核心資料時,一要找準位置,二要把握需求,根據要求,有目的地收集和選擇信息資料,并加以全面系統地歸納、綜合和概括;三要抓住中心,不可孤立地看待信息的“好壞”,而必須以實際需求為準繩,才能把握信息的質量。
2.3 篩選出典型資料,增強代表性
在文獻資料庫中,大部分信息是分散的、零星的、不系統的,反映的只是表層與局部,缺乏代表性。而要揭示事物本質及其發展變化規律,就必須選擇具有代表性的典型材料。把收集到的大量信息加以濃縮,這樣的信息才具有代表性。
2.4 篩選出簡潔資料,增強實用性
收集的信息資料有許多是重復多余的,只有剔除了這部分信息才便于加工整理、利用和存儲。在整理此信息資料時,一要抓住根本點;二要把握好尺度,有些信息資料雖然在內容上有一定重復,但也反映了事物的一些特點,篩選時可以剔除重復部分,綜合整理出有特點的部分。
3 網絡信息影響力評價方法
網絡信息的急劇增長,需要對其進行評價以幫助人們更好獲取與利用信息。目前對網絡信息的評價研究主要集中在內容評價方面,主要評價標準有可信度、準確度、客觀性、及時性、報道范圍、鏈接、文章的目的性及高效性等。
內容評價主要采取同行專家評審法,此方法主觀性大,耗時長,專家的代表性與公正性難以得到有效保證。而網絡信息內容是否有價值,最終都會在其對用戶行為的影響上表現出來,質量較高的網絡信息會導致更多的瀏覽次數,隨之而來的是更多的被鏈次數,但可以通過一些具體的指標進行測量,定量評價網絡信息,有效地彌補同行評議法等定性評價方法的不足。利用影響力對網絡信息進行評價是目前一個熱點課題。
目前,國內學者認為網絡信息評價主要有3種方法。第3方評價法、網絡信息服務用戶評價法、由文獻計量學引申和發展而來的網絡計量法。這3種方法的評價過程,實際上就是信息評價從定性方法到定量方法的過程。定性方法主要依靠評價者的主觀判斷,用于評價網絡新體系時難免會影響結果的客觀性,降低結果的可信度,同時也會使評價過程花費時間較多。定量方法為人們提供系統客觀、規模宏大的數量分析方法,結果更加直觀、具體。由于目前網絡發展變化快、穩定性差,通過定量方法得到的結果只能代表某一階段的狀況。所以,評價網絡信息資源時仍不能偏廢定性方法的使用,最佳方案是把定性與定量方法結合起來,這也是未來網絡資源評價的一個趨向。
網絡信息影響力評價實際涉及2個層面,一是單個網影響力評價,二是網站影響力評價。因為網絡信息是以網站為單位發布的,網絡信息影響評價多是針對網站進行的。網站影響力評價的標準與方法關系極為密切,通常是一種評價指標就是由一種具體的方法來測定的,因此,就將評價標準與方法結合在一起,對網站影響力評價的方法主要有以下幾種。
3.1 搜索引擎收錄情況
搜索引擎是網民在互聯網中獲取所需信息的基礎應用,從1998年起,中國互聯網絡信息中心(CNNIC)于每年1月和7月發布《中國互聯網絡發展狀況統計報告》。第23次調查統計數據截止日期為2008年12月31日,該次調查表明,目前搜索引擎的使用率為68.0%,在各互聯網應用中位列第4。2008年全年搜索引擎用戶增長了5 100萬人,年增長率達到33.6%[2]。印刷型文獻影響評價有1個重要指標就是被著名檢索工具(如Medine、BA、CA、Ei等)收錄情況,被其它資源收錄情況也是網絡信息影響力的1個重要指標。不被搜索引擎收錄的網站被訪問、被利用的機會是很小的。
所以根據搜索引擎收錄情況可以評價網站的影響力,另外被鏈次數、被點擊次數、被評議過的站點也能促進網站的排名。1個站點被鏈接的次數越多,證明該站點影響越大,質量也越高。
3.2 用戶訪問量統計
用戶訪問量是對網絡信息進行評價的1個客觀指標,訪問人數多是網絡信息價值高、可用性好的結果。目前,對用戶訪問量進行統計主要有2種方法:用戶行為監測法與服務器登錄日志(Server Access Log)分析法。用戶行為監測法的代表是Media Metrix的網站及數字媒體訪問量排名。Media Metrix選擇有代表性的家庭及工作單位上網用戶進行調查,在被調查用戶計算機的操作系統中安裝“Media Metrix Meter”監測裝置,對用戶瀏覽網頁的每一次行為都進行統計,以此為基礎公布網站及數字媒體的訪問量排名。服務器登錄日志分析法是對服務器的訪問日志進行分析,所有訪問者對某一網站的訪問情況都被記錄在網站服務器的“登錄日志”中,登錄日志顯示了訪問者在網站上的全部訪問行為。
3.3 鏈接分析法
鏈接分析法是利用某一站點的被鏈次數對其質量進行評價。被鏈次數是網絡信息評價重要指標。1個站點被鏈接的次數越多,證明該站點影響越大,質量也越高。某一站點被鏈次數是搜索引擎搜索結果排序的一項重要指標。
網絡關鍵信息的篩選與影響力評估所帶來的益處是顯而易見的,必將對用戶的實際需求與科學研究等方面的發展起到積極的作用。
參考文獻
[1] 赫建營,晏海華,金茂忠,等.結合本體篩選和文本挖掘的垂直搜索引擎研究[J].計算機科學,2008,35(2):188-190.
[2] 中國互聯網絡信息中心.中國互聯網絡發展狀況統計報告:第23次.http://www.cnnic.net.cn,2009.1.
[3] 楊海濤.網絡信息檢索的困境及發展趨勢[J].科技情報開發與經濟,2008,18(1):13-14.
[4] 劉雁書,方平.網絡信息影響力評價方法[J].高校圖書館工作,2002,22(88):16-19.
[5] 韋彤.論高校圖書館情報咨詢部門的新職能-網絡信息資源搜索評估與咨詢[J].高校圖書館工作,2002,22(87).