每天一個產品經理必懂的技術知識點-隨機森林
隨機森林就是通過集成學習的思想將多棵樹集成的一種算法,它的基本單元是決策樹,而它的本質屬于機器學習的一大分支——集成學習(Ensemble Learning)方法。 解讀下上面的話: 1.隨機森林屬于集成算法,屬于集成算法中的bagging,另一種就是boosting了,集成意味著著該算法是多個算法組合而成 2.隨機森林是由決策樹集成的,這個很好理解,單木為樹,多木成林。所以它叫森林,所以你想弄明白什么是隨機森林,就必須先整明白什么是決策樹。 其實從直觀角度來解釋,每棵決策樹都是一個分類器(假設現在針對的是分類問題),那么對于一個輸入樣本,N棵樹會有N個分類結果。而隨機森林集成了所有的分類投票結果,將投票次數最多的類別指定為最終的輸出,這就是一種最簡單的 Bagging 思想? 隨機森林的出現是為了解決決策樹泛化能力比較弱的特點,因為決策樹就有一棵樹,它的決策流只有一條, 泛化能力弱。而隨機森林就比較好解決了這個問題。
產品
  1. 不錯

    最近 回復
登錄后參與評論