Blogtrottr
ETtoday 新聞雲
ETtoday.net 線上提供即時新聞,包括政治、財經、社會及國際要聞,以及生活、消費、寵物、新奇、娛樂、運動、旅遊資訊和相關新聞報導。
網路資訊/別把語意資料庫跟關聯式混為一談
Jan 29th 2013, 20:18

作/道格

語意式科技協助企業整合資料庫

別以為語意資料庫科技只能用在BBC Online消費者服務、或是Best Buy與思科追求的網路創意等。終端用戶運算的商品化過程,促成了各式各樣的創新;而語意資料庫科技也一樣,它可以為許多企業帶來好處。

整體而言,語意資料庫(Semantic Database)有5 種主要好處:這些資料庫可以與既有的相關資料庫協同合作、它們可以相容於網路科技、其底層科技可以促成各種資料庫的整合、其資料架構在設計上具備彈性。所以,它們可以協助企業應付重大的資料難題。

它們的最大賣點在於資料關係是持續演化的。在1980年代,我們用住家電話、辦公室電話、以及寄信地址來找出人的關聯。到了1990年代,我們還會拿出手機號碼與電子信箱帳號。現在,我們則透過各式各樣的網站、以及社交網路帳號產生關聯。

光是把這些識別碼連結起來還不夠,我們的系統能夠瞭解使用這些資訊的正確情境。也就是說,資料本身必須具備能夠讓機器理解的意涵。所以語意式科技的大前提,就是資訊必須能夠讓機器判讀。

資料在定義上必須提供意義與背景脈絡,讓電腦自己就可以判讀資訊,而不需要人來解讀。這不僅是要提供一個類似XML schema的資料架構,還需要資料在本質上具有意義,讓人類與機器都能判讀。

描述資料意義的語意式科技標準稱為「網路本體語言」(Web Ontology Language, OWL)。網路本體語言界定了一整套的資料關係描述,為商業詞彙、資料集、與資料屬性建立一套定義,產生出來的結果,就叫做「本體」。

一般來說,一間公司會建立、使用多種本體。在企業層級,本體會界定營運、部門、績效、與其它核心商業概念。在系統層級,本體會界定其所管理的資料類型,以及該資料的明確屬性、還有這些屬性中內涵的架構與關係。

雖然是不同的本體,但它們之間環環相扣,系統層級的內容與企業層級的概念彼此相關。從系統的角度來看,本體代表著資料的意義與關連。本體不會建立表格或定義儲存機制;它只會傳達資料中可能存在的關聯性。

在關聯式資料表中,表格中的直列會決定資料的儲存,這是很重要的一項差異。其它來源的資料,例如關聯式資料庫、重要資料儲存、以及表格等,都可以用來產生語意資料。事實上,語意式科技的核心特色就是,如果既有的關聯式資料庫架構已經夠用,那麼你就不必再重新裝載資料。

天時與人和才能突顯 語意式科技的優勢

大部分公司都已經在關聯式資料庫科技上投入大量資源,包括管理軟體、ETL工具、資料市集、資料倉儲、以及各式各樣的報告系統。所以語意式科技是否值得企業投資,建立新的基礎架構、進行訓練與資料庫重構?

如要判斷自家企業是否應該考慮語意式科技,可以考量以下3種情境,在這些情境中語意式科技會是很大的利器。

網路資訊.254.255期(新春號)

This entry passed through the Full-Text RSS service — if this is your content and you're reading it on someone else's site, please read the FAQ at fivefilters.org/content-only/faq.php#publishers. Five Filters recommends: Gaza Blitz - Turmoil And Tragicomedy At The BBC.

You are receiving this email because you subscribed to this feed at blogtrottr.com.

If you no longer wish to receive these emails, you can unsubscribe from this feed, or manage all your subscriptions
arrow
arrow
    全站熱搜
    創作者介紹
    創作者 即時文章綜合站 的頭像
    即時文章綜合站

    即時情報站

    即時文章綜合站 發表在 痞客邦 留言(0) 人氣()