提升分類器准確率閾值移動_分類器的選擇

Ⅰ 分類器的選擇

如果訓練集很小，那麼高偏差/低方差分類器（如樸素貝葉斯分類器）要優於低偏差/高方差分類器（如k近鄰分類器），因為後者容易過擬合。然而，隨著訓練集的增大，低偏差/高方差分類器將開始勝出（它們具有較低的漸近誤差），因為高偏差分類器不足以提供准確的模型。

你也可以認為這是生成模型與判別模型的區別。

一些特定演算法的優點

樸素貝葉斯的優點：超級簡單，你只是在做一串計算。如果樸素貝葉斯（NB）條件獨立性假設成立，相比於邏輯回歸這類的判別模型，樸素貝葉斯分類器將收斂得更快，所以你只需要較小的訓練集。而且，即使NB假設不成立，樸素貝葉斯分類器在實踐方面仍然表現很好。如果想得到簡單快捷的執行效果，這將是個好的選擇。它的主要缺點是，不能學習特徵之間的相互作用（比如，它不能學習出：雖然你喜歡布拉德·皮特和湯姆·克魯斯的電影，但卻不喜歡他們一起合作的電影）。

邏輯回歸的優點：有許多正則化模型的方法，你不需要像在樸素貝葉斯分類器中那樣擔心特徵間的相互關聯性。與決策樹和支撐向量機不同，你還可以有一個很好的概率解釋，並能容易地更新模型來吸收新數據（使用一個在線梯度下降方法）。如果你想要一個概率框架（比如，簡單地調整分類閾值，說出什麼時候是不太確定的，或者獲得置信區間），或你期望未來接收更多想要快速並入模型中的訓練數據，就選擇邏輯回歸。

決策樹的優點：易於說明和解釋（對某些人來說—我不確定自己是否屬於這個陣營）。它們可以很容易地處理特徵間的相互作用，並且是非參數化的，所以你不用擔心異常值或者數據是否線性可分（比如，決策樹可以很容易地某特徵x的低端是類A，中間是類B，然後高端又是類A的情況）。一個缺點是，不支持在線學習，所以當有新樣本時，你將不得不重建決策樹。另一個缺點是，容易過擬合，但這也正是諸如隨機森林（或提高樹）之類的集成方法的切入點。另外，隨機森林往往是很多分類問題的贏家（我相信通常略優於支持向量機），它們快速並且可擴展，同時你不須擔心要像支持向量機那樣調一堆參數，所以它們最近似乎相當受歡迎。

SVMs的優點：高准確率，為過擬合提供了好的理論保證，並且即使你的數據在基礎特徵空間線性不可分，只要選定一個恰當的核函數，它們仍然能夠取得很好的分類效果。它們在超高維空間是常態的文本分類問題中尤其受歡迎。然而，它們內存消耗大，難於解釋，運行和調參也有些煩人，因此，我認為隨機森林正漸漸開始偷走它的「王冠」。

然而…

盡管如此，回憶一下，更好的數據往往打敗更好的演算法，設計好的特徵大有裨益。並且，如果你有一個龐大數據集，這時你使用哪種分類演算法在分類性能方面可能並不要緊（所以，要基於速度和易用性選擇演算法）。

重申我上面說的,如果你真的關心准確率,一定要嘗試各種各樣的分類器,並通過交叉驗證選擇最好的一個。或者，從Netflix Prize(和Middle Earth)中吸取教訓,只使用了一個集成方法進行選擇。

熱點內容

尿不濕反滲透怎麼辦發布：2025-09-19 01:58:54 瀏覽：994

反滲透新膜壓差的原因是什麼發布：2025-09-19 01:57:26 瀏覽：420

過濾器反滲透膜怎麼拆裝視頻發布：2025-09-19 01:52:33 瀏覽：699

哪個凈水器最便宜發布：2025-09-19 01:50:26 瀏覽：717

山西簡約污水凈化費用是多少發布：2025-09-19 01:19:08 瀏覽：421

反滲透出水端壓力有多少發布：2025-09-19 01:12:49 瀏覽：294

超濾膜材料前景發布：2025-09-19 01:12:07 瀏覽：944

水處理砂崗正反洗原理發布：2025-09-19 01:07:41 瀏覽：987

大連一體化污水處理裝置發布：2025-09-19 00:59:31 瀏覽：210

熱水處理費發布：2025-09-19 00:41:33 瀏覽：121

神鋼空調濾芯在哪裡發布：2025-09-19 00:41:24 瀏覽：260

志高ro膜是通用的嗎發布：2025-09-19 00:36:28 瀏覽：300

污水水清ph值高怎麼回事發布：2025-09-19 00:35:49 瀏覽：979

泥溝村污水處理發布：2025-09-19 00:30:28 瀏覽：557

上火喝純凈水會怎麼樣發布：2025-09-19 00:30:23 瀏覽：90

mysqljson數組過濾發布：2025-09-19 00:06:19 瀏覽：437

飲水機800g多少斤發布：2025-09-18 23:59:33 瀏覽：630

最早合成的樹脂發布：2025-09-18 23:54:20 瀏覽：3

怎麼舉報抖音凈化器發布：2025-09-18 23:54:09 瀏覽：181

超濾膜水壓范圍是發布：2025-09-18 23:29:51 瀏覽：218

導航:首頁 > 廢水知識 > 提升分類器准確率閾值移動

提升分類器准確率閾值移動

與提升分類器准確率閾值移動相關的資料