全球專利數(shù)據怎么玩才有趣?之 共現(xiàn)圖譜(二)

王海濤
0 評論 1203 瀏覽 2 收藏 7 分鐘
🔗 B端产品经理需要更多地关注客户的商业需求、痛点、预算、决策流程等,而C端产品经理需要更多地关注用户的个人需求

?本文介紹了從全球專利數(shù)據中構建共現(xiàn)圖譜并對網絡中心度進行測算方法,為產業(yè)研究提供了一種新的視角和工具,幫助用戶更有效地識別和分析技術領域的頂尖資源。

一、說職場故事

招才引智、科研合作、科技攻關都有以下需求:

  • 找到某個技術領域的頂尖人才團隊
  • 找到某個技術領域的頂尖科研機構/企業(yè)

如何通過大數(shù)據挖掘的方式幫客戶實現(xiàn)這些需求呢?以下我們從全球專利視角給出對應答案。

二、共現(xiàn)圖譜構建、中心度的測算

接下來我們主要講解如何從全球專利中找到頂尖團隊、頂尖科研機構/企業(yè),在進入這個主題之前我們需要學習下共現(xiàn)圖譜知識。

從下圖我們可以看出,同一篇專利可能存在多個申請人、發(fā)明設計人、IPC分類號。

全球專利數(shù)據怎么玩才有趣?之 共現(xiàn)圖譜(二)

如果有100條專利,我們就可以根據這3個字段構建共現(xiàn)關系。比如,以IPC為例,就可以構建IPC共現(xiàn)圖譜:

全球專利數(shù)據怎么玩才有趣?之 共現(xiàn)圖譜(二)

在該圖中,節(jié)點的大小表示相應分類號出現(xiàn)的頻次,節(jié)點越大,說明100篇專利與該分類號相關的標準必要專利越多;節(jié)點之間的連線表示兩個分類號同時出現(xiàn)在一個標準必要專利中,連線越粗,代表兩個節(jié)點同時出現(xiàn)的次數(shù)越多,關系越密切。

社區(qū)發(fā)現(xiàn)是一種將網絡分成若干個社區(qū)的方法,根據其網絡中節(jié)點之間的聯(lián)系和相似性將節(jié)點劃分為不同的社區(qū),處于同一社區(qū)的節(jié)點之間更加相似、聯(lián)系更加緊密。

在社會網絡分析方法中,常見的衡量節(jié)點重要性的指標有點度中心度、中介中心度、接近中心度特征向量中心度,可以根據這些中心度計算綜合中心度從而確定某個節(jié)點在整個網絡的重要性,各個中心度的說明如下:

三、說應用場景

有了共現(xiàn)圖的構建方法及網絡中心度的測算方法,在產業(yè)研究領域主要應用場景有:

  • 找到某技術領域的頂尖人才團隊
  • 找到某技術領域的頂尖科研機構/企業(yè)
  • 找到某技術領域的核心技術

應用場景一 :找到某個技術領域的頂尖人才團隊

比如推薦人工智能領域5個頂尖人才團隊

實施步驟 將人工智能和IPC體系做映射(或者根據關鍵詞制定搜索策略)形成專利數(shù)據集,在數(shù)據集基礎上構建“專利發(fā)明人共現(xiàn)圖譜”,在共現(xiàn)圖譜中計算網狀人物中的綜合中心度,根據綜合中心度取TOP5作為團隊領頭人,再將領頭人到共現(xiàn)圖譜中找合作最緊密人物,最終形成以領頭人的領域團隊,流程如下圖所示:全球專利數(shù)據怎么玩才有趣?之 共現(xiàn)圖譜(二)

應用場景二:找到某個技術領域的頂尖頂尖科研機構/企業(yè)

比如推薦人工智能領域的頂尖的科研機構團隊

方法同上,只不過這次換成“申請人”構建共現(xiàn)圖譜,這里可以分為二類:一類為研究機構、一類為企業(yè),流程如下:

全球專利數(shù)據怎么玩才有趣?之 共現(xiàn)圖譜(二)

應用場景三:找某個技術領域的核心技術

比如人工智能領域的核心技術有哪些

方法同上,這次根據專利所屬“IPC分類號”構建共現(xiàn)圖譜,流程如下:

全球專利數(shù)據怎么玩才有趣?之 共現(xiàn)圖譜(二)

需要特別指出的是,如果需要對核心IPC進一步凝練成技術短語的化,可以利用大模型語義理解和抽取能力做進一步工作。

四、寫在后面的話

本文主要介紹了共現(xiàn)圖譜的構建方法、網絡中心度的測算方法,然后闡述了共現(xiàn)圖譜可以在產業(yè)研究領域的應用場景。需要注意一下幾點:

  1. 范圍可以不限于全球專利:雖然講述的是全球專利分析挖掘,但該分析研究方法可以拓展到“頂刊”“全球項目”數(shù)據的挖掘中。
  2. 在實際應用中可以保持靈活性:比如本文用的“綜合中心度”代表節(jié)點的重要性,實際可以根據情況選取任意一個中心度作為重要性指標。

本文由 @王海濤 原創(chuàng)發(fā)布于人人都是產品經理。未經作者許可,禁止轉載

題圖來自Unsplash,基于CC0協(xié)議

該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!
专题
55671人已学习20篇文章
产品上线后冷启动怎么做最有效?这是产品经理和运营必须要了解的。
专题
11750人已学习12篇文章
数据管理系统在后期能够为企业提供基础数据服务,保证企业往更好的方向运营。本专题的文章分享了如何做好数据管理。
专题
12470人已学习12篇文章
本专题的文章分享了系统首页设计指南。
专题
11956人已学习12篇文章
数字化平台搭建,适用于企业已经有稳定的业务和资源,希望通过数字化平台做资源变现实现盈利,通过数字化平台将客户、交易、需求、场景全部数据化。本专题的文章分享了如何搭建数字化平台。
专题
12903人已学习11篇文章
内容管理系统是一种位于WEB 前端(Web 服务器)和后端办公系统或流程(内容创作、编辑)之间的软件系统。本专题的文章分享了内容管理系统(CMS)的设计指南。