商業分析工具Power BI在專利分析中的應用

文章來源: 中國知識產權報/中國知識產權資訊網
發布時間: 2019/6/28 6:50:00

  在多數情況下,專利分析是基于各種專利數據進行的,因此專利分析中的一項重要工作是分析處理專利數據。雖然多種工具(如Excel和一些專利分析系統)已被用于分析專利數據,但利用這些工具應對某些復雜分析時仍存在一些問題。例如,在使用Excel時需要靈活運用Excel函數,這無疑增加了分析人員的工具學習成本。而多數專利分析系統是通過運行分析模板實現既定的分析任務,因此其提供的分析功能有限,難以滿足分析人員的多種分析需求。因此,專利分析迫切需要操作簡便、功能全面的分析工具,以幫助分析人員全面有效地完成分析工作。


  Power BI(下稱PBI)是微軟公司推出的一套用于商業數據分析的交互式可視化數據分析工具,其兼具數據獲取、加工、建模和可視化多種數據處理和分析功能,能夠實現多數據源的數據整合、數據模型的建立、數據可視化圖表的交互式呈現,其操作簡便,降低了工具的使用門檻。此外,PBI能夠通過建立多數據表間關系形成數據模型,由此能夠利用多維度數據信息進行分析。同時,PBI中形成的圖表能夠以人機交互方式動態呈現關聯數據的信息——相比靜態圖表能夠提供更為豐富的數據信息,便于分析者就此發掘價值信息。


  雖然PBI主要應用于商業數據分析,但其仍然屬于數據分析工具,因而理論上同樣能夠適用于專利數據的分析。本文試將PBI用于專利數據分析,通過借助該工具操作簡便和功能全面的優勢,嘗試完成一些較為復雜的專利數據分析任務,以期為專利分析人員提供參考。


  數據建模


  由于專利數據間的關系復雜,進行數據間的分析往往難度很大。例如,一般情況下,一項專利文獻會對應多個發明人。如果一件專利申請為共同申請,還會對應多個申請人。在一些分析場景中,如何將上述多種數據信息相互關聯以實現相互分析仍有一定難度。


  PBI能夠通過多種數據關系表中的共有數據字段建立各關系表間的關聯,即實現數據建模,并允許分析過程中不同關系表中數據間相互篩選分析。對于前述分析場景,可以分別就“公開號-國家名稱”“公開號-申請人”和“公開號-發明人”建立獨立的關聯表格,同時由于這些表格均含有與原始數據相對應的“公開號”字段,因此能夠以“公開號”字段作為橋梁建立申請人、發明人和國家數據的聯系,由此構建數據模型。


  交互聯動


  在數據建模的基礎上,通過PBI能夠快速完成可視化圖表的繪制。在PBI中繪制圖表僅需如下三步:選擇所需的可視化圖表類型,將要分析的字段拖動到圖表數據欄中,必要時可在圖表屬性中調整圖表格式即可完成繪制。


  在不同數據表建立關系后,在PBI中還能夠通過不同數據表中的字段進行可視化圖表繪制,即分析不同數據表中字段的數據關系。對于前文提到的兩個數據分析問題,能夠分別通過可視化方案“ZoomCharts Network Chart”和“弦圖”將“申請人-發明人-專利申請量”“申請來源國-申請目標國”數據可視化。在圖表繪制后便可以通過其交互特性進行多角度分析。例如,在“申請人-發明人-專利申請量”圖中選中其中一個申請人,則會使“申請來源國-申請目標國”圖中自動篩選對應申請人的專利申請流向信息。再如,在“申請來源國-申請目標國”圖中選擇某一國家,則“申請人-發明人-專利申請量”圖則會僅顯示相應國家的申請人及其發明人情況。


  上面例子簡單展示了PBI可視化的交互特性,為了進一步說明其在專利分析中的應用價值,下面通過實際分析情景進一步說明。


  專利分析其中一個分析項目是申請人分析,具體需要就申請人的專利申請情況、專利布局分布、發明人員情況以及重點專利和技術脈絡等問題進行梳理和分析。為此,利用PBI分別繪制出“申請人申請量排名”“申請流向”“申請量趨勢”“發明人數量趨勢”以及“技術主題分布”可視化圖表,并將其布置于同一報表頁面中(注:PBI中可視化方案均可通過復制/剪切方式重復/移動可視化方案),由此便能夠利用這些圖表聯動即時分析多個申請人的相關數據情況。在具體分析操作中,在“申請人申請量排名”表中選中特定申請人,由此便會使其他圖表顯示/突出顯示該申請人的在申請流向、申請量趨勢、發明人數量趨勢以及技術主題分布的信息。在“申請人申請量排名”表中改變選中的申請人,則相應信息依申請人選擇改變而相應調整,因此可以即時顯示不同申請人的相關信息,而無需重復繪制同類圖表。


  為了進一步分析特定申請人的專利技術情況,可以創建第二個分析報表,其中保留了第一個分析報表中的技術主題分布圖,在此基礎上加入了專利文獻的引用關系圖(利用專利引用數據并采用可視化方案“Network Navigator”繪制)和申請人數據的切片器。其中,文獻引用關系圖中會以節點形式表示一個專利族,并在節點旁顯示該專利族的一個專利的公開號以作為該族代表,節點間連線表示其具有引用關系,節點大小以該專利族被引用頻次設定,由此能夠清楚發現高引用頻次專利,有利于判斷專利族的重要程度。在針對特定申請人進行分析時,可以在切片器中選擇該申請人,由此使該報表中其他可視化圖表均僅顯示該申請人相應數據,即顯示該申請人的技術主題分布、專利文獻引用關系圖。該可視化方案有助于迅速發現不同技術主題下申請人的高頻引用專利,同時文獻引用關系也能夠對于梳理該申請人該技術主題的技術脈絡提供幫助。


  通過上面的實例能夠看出,PBI中通過多種可視化圖表的組合能夠衍生出多種維度的分析,以滿足多種分析場景的要求。同時,由于各圖表間的相互聯動呈現,事實上特定字段間的可視化圖表僅需要制作一次,便可結合其他圖表展現出更多數據維度的情況,這相比靜態圖具有更高的效率。


  綜上所述,Power BI雖然并非專利分析的專用工具,但其在數據分析方面操作簡單、功能全面。Power BI數據建模支持多維度數據的協同利用,可視化圖表繪制便捷,可視化交互聯動允許分析者根據分析需要靈活創建分析場景,能夠真正用于專利數據分析中,滿足多變、深入的分析需求,并且相比靜態圖表具有更高的制圖效率。這有利于使分析者從圖表繪制的繁雜低產出工作中解放出來,而聚焦分析本身,進而促進專利分析質量的提高。(趙佳睿 左良軍 危峰)


  (編輯:曹雅暉)


  (中國知識產權報獨家稿件,未經授權不得轉載。)

主辦單位:中國知識產權報社 未經許可不得復制
ICP備案編號:京ICP備08103642號-2
浙江6十1开奖走势图推荐号码