資料來源:
http://www.mica-project.eu/wp-content/uploads/2016/03/D3.3_Transforming-data-and-information-into-knowledge-within-the-MICA-project.pdf
3.3 MICA
項目調查探討了的原材料數據和資訊如何用於提供知識和支持礦產情報。本報告的主要目的是在原材料背景下定義數據、資訊和知識的術語,並描述獲取所需知識和證明數據/資訊需求的合理性所需的步驟。
原材料知識由歐洲原材料情報能力平台
(EU-RMICP) 提供,主要通過 MICA flow Sheets 、
fact Sheets和doc Sheets的形式,但也通過提供獨立於平台的知識的項目可交付成果解決相關問題礦產情報和礦產政策。
D3.3 介紹了知識管理模型的開發,即原材料的數據-資訊-知識-智慧
(DIKI) 模型。
執行摘要
本報告關注探索如何轉換數據和資訊,轉化為原材料知識。它提供了一個概念框架,解釋了轉換過程。它還對構成
MICA 項目以及歐盟原材料知識管理庫的關鍵組成部分的數據-資訊-知識-智慧等術語進行了明確定義。參考了用作開發該模型的靈感的背景文獻。
給出了原材料領域的幾個例子,特別是
MICA 項目,以證明所提出模型的適用性並解釋轉換過程。還討論了原材料智慧一詞。
一、簡介
'DIKI'(數據-資訊-知識-智慧)模型在
D.3.1原材料數據清單草案中提出,這是之前的 WP3
可交付成果,但沒有對其來源或如何用於解釋開發的廣泛解釋原材料知識的過程。
圖
1 DIKI 模型(MICA D3.1)。
MICA
項目是上述所有項目的中心,因為它提供了一個“系統”,允許對原材料感興趣的各種利益關係者識別數據、資訊、方法、工具和知識,以支持他們的需求,這可以在以後導致原材料智慧。上述術語,即數據、資訊、知識、情報目前被利益關係者誤解或互換使用,這表明這樣一個“系統”實際交付的內容的清晰度降低了,或者利益關係者的期望沒有得到滿足。開發定制的原材料
DIKI 模型有望為這些術語的含義及其在 EU-RMICP
中所起的作用提供基本解釋。它還研究了知識的基本組成部分(例如數據和資訊)如何組合在一起以生成利益關係者可以用來滿足其需求的知識圖(流程圖)。
2.
知識管理簡介
知識是個人、部門、經濟和公司的重要資源和資產(Foucault and Gordon,1980)。知識就是力量,知識的維護和增強促進創新。目前,我們的社會充斥著知識,在知識的傳播、共享、生成和使用方面已經開展了大量工作。各種系統,如數據庫、門戶、網絡、圖書館等用於支持知識的建立、使用和共享。技術進步促進了這一舉措,例如電腦、軟體工具和如今的人工智慧被用於生成新知識或在全球範圍內分享。它還有助於適應其動態性質,即我們理解的不斷變化,以及獲取知識的要求的變化。
知識管理是一門涉及了解如何生成知識並將其傳達給合適的人以滿足需求的學科。該術語的首次提及是在 1970
年代中期,包括數據、資訊和知識之間的第一個定義和區別(Henry,1974)。從
1990 年代起,知識管理就成為一門傑出的學科(Metaxiotis等,2005)。其主要目的是實現業務領域的改進,例如品質管理、業務流程建模、人力資源管理和資訊系統。然而,圍繞知識管理的概念框架與產生、使用和傳播知識的任何其他行動、學科、部門、項目或組織相關。
3.
歷史 DIKW
模型中的術語定義
“數據-資訊-知識-智慧”模型或通常稱為“DIKW
金字塔”、“DIKW
層次結構”或“知識層次結構”
(圖 2)被知識管理和資訊科學學科廣泛使用.它通常被用作定義數據、資訊、知識和智慧的術語,並解釋從數據到智慧的過程(Rowley,2007)。
一些作者提到了層次結構並給出了自己的觀點和定義,還有更多的人繼續這樣做(Henry, 1974,
Zeleny, 1987, Ackoff, 1989, Davenport and Prusak, 1998, Rowley, 2007,
Frické, 2009)。一些作者(Hey, 2004, Sharma, 2008)認為,第一次提到等級制度是在詩“岩石”
“The Rock” (Eliot, 1934))中。早在知識管理和資訊科學對這種分類表現出興趣之前,藝術家的其他引用就可以得到(Zappa,1979)。
數據、資訊和知識的定義一直是許多研究人員感興趣的主題,儘管有幾篇出版物試圖區分這些術語,但它們仍然是抽象的並在不同的上下文中使用。為本報告的目的,下面給出的定義代表了最廣泛接受的定義,它們與
MICA 項目的概念一致。
數據
根據
Davenport 和Prusak (1998),“數據是一組關於事件的離散的、客觀的事實”。英國牛津詞典指出,“數據是為參考或分析而收集在一起的事實和統計數據。該術語起源於哲學,它被定義為“已知或假定為事實的事物,構成推理或計算的基礎”。存在多種其他定義,具體取決於其使用的上下文。
數據不是結構化的,它們不傳達任何含義,並且它們之間沒有建立關係。如今,數據是由許多不同的過程生成的,它們通常被稱為“原始數據”。例如,統計局在他們進行的不同調查中收集數據。
組織都十分重要,許多行業都嚴重依賴它們。它們代表了任何決策過程的基礎,但實際上數據不提供任何判斷或解釋或行動建議。此外不知道數據是否真實(Frické,
2009)。它們可能包括將它們變成無效和錯誤數據的錯誤和錯誤。然而,錯誤數據的識別需要一定程度的解釋,這超出了數據的定義。收集數據是使數據可用的基本過程。通常遵循的原則是“數據越多越好”,但這並不總是有效的。在許多情況下,太多的數據會阻礙解釋,畢竟它們沒有內在的意義。數據存儲在某種形式的技術系統中,例如數據庫或其他數據管理系統(Davenport
和Prusak ,1998)。
資訊
資訊是置於上下文中的數據。這只能通過解釋和分析數據來增加意義來實現。數據與所識別的關聯或模式之間的關係都是解釋和分析過程的一部分,這些過程導致資訊的誕生。
資訊的作用是“告知”,即提供對感興趣主題的洞察力(Davenport
和 Prusak ,1998)。這代表著所提供的內容是否達到其目的是由接收它的人定義的。如果是,則將其視為資訊,否則可能會被判斷為噪音或不相關的“資訊”。資訊通常出現在對“誰”、“何時”、“在哪裡”、“什麼”和“有多少”問題的回答中(Ackoff
,1989)。
知識
知識既不是資訊也不是數據。知識表示已知的事物。牛津詞典將知識定義為“通過經驗或教育獲得的事實、資訊和技能;對一門學科的理論或作業理解”。其他幾個定義已經從各個學科產生,對於哪個是好的定義沒有任何共識。就本文件而言,Davenport
and Prusak給出的定義被認為是合適“知識是框架經驗、價值觀、背景資訊和專家洞察力的流動組合,為評估和整合新的經驗和資訊提供了框架。它起源並應用在知識者的頭腦中。它通常嵌入文檔或存儲庫中,但也嵌入組織例程、流程、作業和規範中。”
Prusak
的上述定義和研究將數據和資訊與知識區分開來。他們認為知識來自資訊,資訊來自數據。人類有責任通過比較資訊、評估它們的含義、探索它們的關係以及確定其他人對特定資訊的看法,將資訊轉化為知識(Davenport
和Prusak ,1998)。
文獻中經常提到兩種類型的知識,這在上面給出的定義中也很明顯:顯性知識和隱性知識。顯性知識是有形的,可以在文檔、錄音或圖像中捕捉到。然而,隱性知識更難定義,因為它通常與知道者一起存在並且不易轉移。它是專業知識或專家洞察力。顯性知識通常代表最終結果,但很少能提供有關為獲得結果而進行的實際研究過程的見解(Dalkir
,2005)。知識管理研究表明,只有
15% 到 20% 的有價值知識已被捕獲,並且可以通過有形的形式獲得。剩下的
80% 通常以隱性知識的形式保留在個人身上。因此,對於動員隱性知識來創造顯性知識的系統的需求很重要(Dalkir,2005)。
知識傳達期望、指示和規則,並且經常提供“如何做”問題的答案(Ackoff,1989,Boisot和
Canals,2004)。知識比數據和資訊更接近行動,這是它被視為有價值的主要原因。知識產生的過程是複雜而動態的。經驗、真理、判斷和指導提供是知識的關鍵組成部分,並且以複雜的方式相互關聯(Davenport
和Prusak,1998)。
數據和資訊是視覺和可量化的元素,而知識是我們所知道的,需要分析思維。
智慧
智慧位於
DIKW 模型的頂部。智慧的定義要複雜得多。它是多維的,需要不同的知識。智慧通常代表全局(
Barlas et al., 2005)。它結合知識來制定行動和實現目標。因此,智慧目的在提高有效性,這需要做出判斷的能力(Ackoff,1989)。
可交付報告主要涉及
DIKW 模型的數據、資訊和知識階段,因為這些與 MICA
項目直接相關,並根據其交付特定輸出。
4.原材料“數據-資訊-知識-智慧”模型
上一段中介紹的
DIKW 模型構成了提議的原材料 DIKI
模型的基礎。在本節中,我們將研究為歷史 DIKW
模型給出的定義,並探討它們對原材料行業的內容和意義。
原材料數據
DIKW
模型中的數據定義也與原材料數據非常吻合。原材料數據通常有兩種形式:
•
定義地球表面位置的空間數據或地理數據。空間數據通常表示點、多邊形、線或像素。它們包括位置、形狀、大小和方向,因此它們是多維的。它們用於識別地球上特徵和邊界的地理位置,例如人造建築或自然建築(例如地質沉積物或海洋)。空間數據的合成和解釋導致生成各種地圖。
•
非空間數據與特定的定義位置相關。統計數據通常屬於這一類,但文本、圖像和多媒體數據也屬於這一類。有人會爭辯說,原材料的統計數據應該屬於空間數據類別而不是非空間數據類別,因為它們受位置的影響,甚至可能代表一種空間數據解釋,例如礦產資源統計數據和儲備。然而,將統計數據與空間數據區分開來是有用的,因為後者通常用於地圖和地理門戶的開發。另一方面,統計數據通常用於描述一個過程,例如實體經濟的各個方面,或與原材料生產相關的環境影響。
原材料數據對於許多不同的組織都是必不可少的,例如公共當局、行業、非政府組織、研究機構和公眾。因此,它們是從全球各種來源並通過各種途徑收集的,包括調查、實地工作和實驗。它們通常存儲在數據庫、電子文檔或硬拷貝文檔中。
原材料資訊
資訊代表結構化數據。正如歷史上的
DIKW
模型所定義的,資訊的作用是告知某人某事並滿足資訊需求。原材料數據的生成需要對原始數據進行解釋和分析。根據資訊需求的範圍,在此過程中使用了各種不同的方法。例如,為統計數據指定的程序通常包括檢查、上下文化、分類、標準化和協調數據的階段。有趣的是歐洲原材料的空間數據案例,其收集和轉化為資訊目前由
INSPIRE
指令1定義。許多不同領域的地理空間數據,不僅是礦產資源,由所有歐洲國家生產。與礦產資源一樣,許多國家共享河流、山脈、交通基礎設施等,因此確保共享描述它們的資訊對於預防和減少影響以及促進歐洲層面的有效決策十分重要。這導致制定了涵蓋不同領域的通用標準,包括礦產資源,這些領域允許描述和共享空間數據。
INSPIRE
指令鼓勵開髮用於在歐洲公共當局之間共享此類資訊的基礎設施。資訊是由許多其他機構產生的,例如來自研究機構和工業機構,儘管這些機構非常寶貴,但它們通常是分散的、靜態的(例如與單個項目相關),並且在某些情況下是不可存取的(例如機密資訊)。
資訊存儲在數據庫、門戶網站或文檔(例如報告、科學文章)中。很多時候,數據通過模型開發轉化為資訊,這代表了資訊的另一種輸出。
原材料知識
DIKW
模型定義的知識是情境化資訊,它是通過將可用資訊與專業知識、洞察力和直覺相結合而產生的。因此,如果我們以礦產生產的統計數據為例來確定它們是如何轉化為知識的,那麼可以與
DIKW 模型建立以下關聯:
1.調查產生的數據代表我們模型“原材料數據”的第一級
2.礦物統計年鑑的製作將代表模型的第二層,即“原材料資訊”
3.
了解投資新加工廠以增加單一商品的產量是否需要獲得礦產統計數據以了解例如全球市場趨勢,還需要獲得其他資訊,例如新加工廠的成本和效率,其他地方的類似案例研究示例、商品價格以及該行業的專家知識和洞察力,這些都無法通過現成的資訊提供。
給出的例子描述了一種知識需求,為此需要礦物統計資訊。除了示例中描述的需求之外,此類資訊的可用性可以滿足多種知識需求。該示例表明,知識需要結合專家洞察力使用和判斷幾種不同的資訊類型。儘管顯性知識可以獲取並傳達給公眾,但隱性知識很難定義和傳播。然而,原材料領域正在進行的研究有助於將部分隱性知識轉化為顯性知識。此外,對廣泛資源的開放存取使隱性知識外化。這種轉變的一個例子是在關鍵原材料領域,專家的積極參與以及國家(美國、歐洲、日本)之間的合作增強了我們對關鍵原材料的各種問題的理解,這進一步促進了策略干預(例如,一些歐洲國家的礦業法發生變化,開設生產關鍵原材料的新礦山)。可以確定其他幾個例子,例如為編制國家物質流賬戶所開展的工作,或國際組織採取的行動,例如聯合國監測實現全球資源效率可持續目標的進展情況。
原材料情報
選擇智慧一詞而不是智慧來描述
DIKI
提出的原材料模型的頂級,因為它經常被礦產部門使用。情報與基於可用知識採取的行動相關聯。原材料情報經常出現在決策中,例如新政策制定、策略制定、投資決策和基礎設施開發等等。原材料情報通常需要對感興趣或關注的主題有一個全面的了解,因此需要了解構成該主題的所有單個概念的知識、資訊和數據。該示例(圖
3)試圖展示為制定國家原材料策略可能需要的不同知識要求。此示例中的知識要求列表並不詳盡。需要來自不同學科的額外知識才能進行此類行動。
圖 3原材料情報行動示例,展示了制定國家礦產策略(情報)的不同知識需求。
4.1 DIKI原料模型探討
基於前面章節中給出的定義,一個改進的
DIKI 模型描述了原材料行業的數據到智慧轉換過程(圖 4)。該模型包括與金字塔的每一層相關的潛在參與者和需求的資訊。參與者代表負責交付、數據和資訊的不同機構。
“需求”部分目的在闡明為什麼需要數據、資訊、知識和智慧。
圖
4提出的改進的原材料 DIKI 模型。金字塔的每一層都包含參與者和需求的示例。
“演員”和“需求”被視為
DIKI
模型的重要組成部分。任何資源,無論是數據、資訊還是知識,都是因為有特定的需要而開發的。如果沒有明確的需求,金字塔或金字塔中的層級是多餘的。例如,當數據由一個過程生成時,通常是“無意識的”,但沒有轉化為資訊或知識,就可能出現這種情況。此類數據不發揮任何特定作用,也不會成為“知識鏈”的一部分。能夠識別演員是誰同樣有價值。它提供了有關不同組織在知識生成過程中的能力、角色和重要性的見解,並構成了知識鏈圖的重要組成部分。
然而,原材料
DIKI 模型採用的分層表示隱藏了數據到智慧轉換過程中發生的中間步驟。這些是:
•階段之間的循環步驟,例如知識可能導致對額外數據的請求,或者在確定關注問題的趨勢之前,數據和資訊之間可能存在迭代;
•
生成數據、資訊或知識所需的知識輸入(圖5)。擬議模型中的“隱藏步驟”在某種程度上被金字塔中的“參與者”和“需求”所涵蓋。
圖
5 與數據生成相關的資訊和知識的“隱藏需求”示例。
由於知識鏈的複雜性,跟踪從金字塔底部到頂部的轉換過程並不總是直截了當的;然而,提議的模型為以下方面提供了一個有用的框架:
•
繪製知識鏈並評估其在決策中的重要性;
•
確定參與者是誰以及他們在知識鏈中扮演什麼角色;
•
確定對資源的需求是什麼;
•
提高整個知識鏈以及從基本數據和資訊到知識和情報所需的不同步驟的可見性和透明度;將不同的參與者聯繫起來,並告知他們上一層的要求,這可以促進適合用途的資源的開發;
•
通過跟踪誰擁有知識鏈中的知識,促進原材料情報的生成。 |