全球專利數(shù)據(jù)怎么玩才有趣?之 聚類算法(三)

王海濤
1 評論 1448 瀏覽 2 收藏 5 分鐘

文章通過實際應用案例,展示了聚類算法在專利數(shù)據(jù)分析中的實用性,為技術研究方向的挖掘提供了一種有效的方法。

一、說職場故事

在產業(yè)研究中,有以下研究需求:

  • 洞察行業(yè)龍頭企業(yè)所聚焦的技術領域。
  • 追蹤某位專家的研究方向及其演變。
  • 把握某一產業(yè)領域近年來的技術發(fā)展趨勢

那今天講解如何利用全球專利數(shù)據(jù)來實現(xiàn)這些研究目標,在此之前,讓我們先了解聚類算法的相關知識。

二、聚類算法

聚類算法是一種無監(jiān)督學習方法,旨在將數(shù)據(jù)集中的對象劃分為若干個類別或簇,使得同一類別內的對象相似度較高,不同類別之間的相似度較低,簡言之就是自動實現(xiàn)“物以類聚,人以群分”。

常見的聚類算法有K-means、層次聚類、DBSCAN、譜聚類、高斯混合模型、模糊C-means、K-medoids、Mean Shift、OPTICS、BIRCH等,不同的聚類算法各有優(yōu)缺點,適用于不同類型的數(shù)據(jù)和不同的應用場景。選擇合適的聚類算法通常取決于具體的需求、數(shù)據(jù)的特性和計算資源。不同的聚類算法介紹、優(yōu)缺點可參考該份資料

https://blog.csdn.net/Java_college/article/details/136173448

三、說應用場景

聚類算法在全球專利數(shù)據(jù)挖掘中發(fā)揮著重要作用,可用在以下研究場景:

  • 分析企業(yè)技術研究方向及趨勢分析
  • 分析某位專家研究方向及研究趨勢
  • 分析某個產業(yè)領域技術發(fā)展方向及趨勢

1. 應用場景一:分析企業(yè)技術研究方向及趨勢分析

以A企業(yè)為例,我們可以通過查詢其專利數(shù)據(jù)集,利用模型或第三方接口提取技術關鍵詞,再通過聚類算法整理出技術清單,這些清單將直觀展示企業(yè)的主要研究方向。若要觀察企業(yè)技術演變趨勢,我們可以根據(jù)專利的“申請日期”將數(shù)據(jù)分為不同時間段,然后通過聚類算法分析,便可揭示企業(yè)在不同時期的技術發(fā)展軌跡。流程如下:

全球專利數(shù)據(jù)怎么玩才有趣?之 聚類算法(三)

2. 應用場景二:分析某位專家主要研究方向及研究趨勢

方法同上,其核心是獲取專家的專利數(shù)據(jù)集。流程如下:

全球專利數(shù)據(jù)怎么玩才有趣?之 聚類算法(三)

3. 應用場景三:分析某個產業(yè)領域技術發(fā)展方向及趨勢

以人工智能領域為例,我們可以采用相同的方法,通過聚類算法分析近年來的技術方向,揭示該領域的技術發(fā)展趨勢。流程如下:

全球專利數(shù)據(jù)怎么玩才有趣?之 聚類算法(三)

四、寫在后面的話

本章我們探討了如何通過聚類算法從全球專利數(shù)據(jù)中挖掘技術研究方向,需要注意的是:

(1)聚類算法不僅適用于全球專利分析,同樣可以擴展到頂級期刊和全球項目數(shù)據(jù)集的分析中。

(2)聚類算法常與大型模型結合使用,以更精準地提煉技術關鍵詞。

本文由 @王海濤 原創(chuàng)發(fā)布于人人都是產品經理。未經作者許可,禁止轉載

題圖來自Unsplash,基于CC0協(xié)議

該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 文章中直觀的圖表和報告,可以幫助我們快速洞察行業(yè)趨勢、技術熱點以及競爭對手的動向。

    來自廣東 回復
专题
16507人已学习12篇文章
本专题的文章分享了支付体系的设计指南。
专题
17895人已学习13篇文章
用户等级体系是产品的底层基础之一,也是用户成长激励体系之一。本专题的文章分享了如何搭建用户等级体系。
专题
16820人已学习12篇文章
如何搞懂财务和业务之间的关系,并推进业务系统财务模块的建设呢?本专题的文章分享了财务系统的设计指南。
专题
12902人已学习11篇文章
内容管理系统是一种位于WEB 前端(Web 服务器)和后端办公系统或流程(内容创作、编辑)之间的软件系统。本专题的文章分享了内容管理系统(CMS)的设计指南。
专题
15992人已学习12篇文章
数据中台是处于业务前台和技术后台的中间层。本专题的文章分享了如何搭建数据中台。
专题
45230人已学习12篇文章
产品经理和运营都要懂一点的推荐算法基础和进阶知识