-
1.決策樹分類器提供了一組屬性,這些屬性通過根據屬性集做出一系列決策來對資料進行分類。 這個過程類似於通過植物的特徵來識別植物。
這樣的分類器可以用來確定某人的信譽,例如,決策樹可能會得出結論,“乙個人有乙個家庭,擁有一輛價值在 10,000 美元到 10,000 美元之間的汽車,並且有兩個孩子”具有良好的信用。 決策樹生成器從“訓練集”生成決策樹。 SGI 的資料探勘工具 Mineset 提供了乙個視覺化工具,它使用樹形圖來顯示決策樹分類器的結構,其中每個決策都由樹中的乙個節點表示。
圖形表示可以幫助使用者了解分類演算法,並提供對資料的寶貴見解。 生成的分類器可用於對資料進行分類。 2.
選擇樹分類器 選擇樹分類器使用與決策樹分類器類似的技術對資料進行分類。 與決策樹不同,選擇樹包含特殊的選擇節點,這些節點具有多個分支。 例如,選擇樹中用於區分汽車原產地的選擇節點可以選擇馬力、氣缸數或車輛重量作為資訊屬性。
在決策樹中,節點一次最多可以選擇乙個屬性進行考慮。 在選擇樹中進行分類時,可以考慮各種情況。 選擇樹通常比決策樹更準確,但它們也要大得多。
選擇樹生成器使用與決策樹生成器相同的演算法從訓練集生成決策樹。 Mineset 的視覺化工具使用選擇樹圖來顯示選擇樹。 樹形圖可以幫助使用者了解分類器,並發現哪個屬性在確定標籤屬性的值時更重要。
這同樣可用於對資料進行分類。 3.證據分類器 證據分類器通過檢查特定結果基於給定屬性發生的可能性來對資料進行分類。
例如,它可能會得出結論,擁有價值 10,000 美元到 10,000 美元之間的汽車的人有 70% 的信用良好,30% 的信用非常差。 分類器使用最大概率值根據簡單的概率模型對資料進行分類**。 與決策樹分類器類似,生成器從訓練集生成證據分類器。
Mineset 的視覺化工具使用證據圖來顯示分類器,該分類器由一系列描述不同概率值的餅圖組成。 證據圖可以幫助使用者理解分類演算法,提供對資料的深入見解,並幫助使用者感覺像“假設”。 如何?
這同樣可用於對資料進行分類。
-
基於規則的分類器包括決策樹、隨機森林和先驗。
決策樹是一種決策分析方法,利用概率分析直觀地利用概率分析,根據已知的各種情況發生的概率形成決策樹,得到淨現值期望值大於等於零的概率,評估專案風險,判斷其可行性。
在機器學習中,隨機森林是包含多個決策樹的分類器,它輸出的類由單個樹輸出的類模式決定。
關聯規則挖掘領域最經典的演算法是 Apriori,它的致命缺點是需要對事務資料庫進行多次掃瞄。
-
分類器的構建和實現一般經過以下幾個步驟:選擇樣本(包括正負樣本),並將所有樣本分為訓練樣本和測試樣本兩部分。 在訓練樣本上執行分類器演算法以生成分類模型。
在測試樣本上執行分類模型以生成 ** 結果。 根據結果,計算出必要的評價指標,以評價分類模型的效能。
-
分類是資料探勘的一種非常重要的方法。 分類的概念是學習乙個分類函式或基於現有資料構建乙個分類模型(即我們通常所說的分類器)。 通過將資料庫中的資料記錄對映到給定類別,可以將此函式或模型應用於資料。
簡而言之,分類器是資料探勘中用於對樣本進行分類的方法的總稱,包括決策樹、邏輯回歸、樸素貝葉斯、神經網路和其他演算法。