如何入門機器學習研究
機器學習(Machine Learning, ML)是一門多領域交叉學科,涉及概率論、統計學、逼近論、凸分析、算法復雜度理論等多門學科。專門研究計算機怎樣模擬或實現人類的學習行為,以獲取新的知識或技能,重新組織已有的知識結構使之不斷改善自身的性能。作為越來越受到矚目的學科,本篇簡要介紹如何做相關研究的入門。
首先找一本機器學習相關書籍,簡要過一遍基礎概念。
如果對于遇到的數學概念不明白的,還需要補充高數、線性代數、概率論相關知識。
熟悉了基礎概念之后,就可以到國際上的會議、期刊上尋找感興趣的方向的論文了。
了解一個領域的最新研究,需要泛讀大量文獻。選擇精讀其中有借鑒意義的部分文章,然后找到作者主頁(國際會議的文章作者一般都有個人主頁),可以獲取到代碼,論文中往往也會提到數據集。獲取到代碼和數據集之后,就可以著手復現論文中的實驗了。
在復現實驗之中,你會加深了解到論文的優點和不足之處,也為以后自己的優化奠定了基礎。
使用 Python 開始你的機器學習之旅
安裝 Anaconda
下一步是安裝 Anacona。有了 Anaconda ,你將可以開始使用 Python 來探索機器學習的世界了。Anaconda 的默認安裝庫包含了進行機器學習所需要的工具
基本的機器學習技能
有了一些基本的 Python 編程技能,你就可以開始學習一些基本的機器學習技能了。一個實用的學習方法是學到一定技能便開始進行練習。然而,如果你想深入學習這個領域,那么你需要準備投入更多的學習時間。
一個獲取技能的有效方法是在線課程。吳恩達的 Coursera 機器學習課程 是一個不錯的選擇。其它有用的在線訓練包括:
Python 機器學習: Scikit-Learn 教程
Python 實用機器學習教程
你也可以在 LiveEdu.tv 上觀看機器學習視頻,從而進一步了解這個領
學習更多的 Python 庫
當你對 Python 和機器學習有一個好的感覺之后,可以開始學習一些開源的 Python 庫。科學的 Python 庫將會使完成一些簡單的機器學習任務變得很簡單。然而,選擇什么庫是完全主觀的,并且在業界內許多人有很大的爭論。
一些實用的 Python 庫包括:
Scikit-learn :一個優雅的機器學習算法庫,可用于數據挖掘和數據分析任務。
Tensorflow :一個易于使用的神經網絡庫。
Theano : 一個強大的機器學習庫,可以幫助你輕松的評估數學表達式。
Pattern : 可以幫助你進行自然語言處理、數據挖掘以及更多的工作。
Nilearn :基于 Scikit-learn,它可以幫助你進行簡單快速的統計學習。
探索機器學習
對基本的 Python、機器學習技能和 Python 庫有了一定理解之后,就可以開始探索機器學習了。接下來,嘗試探索一下 Scikit-learn 庫。一個不錯的教程是 Jake VanderPlas 寫的 Scikit-learn 簡介。
然后,進入中級主題,比如 K-均值聚類算法簡介、線性回歸、決策樹和邏輯回歸。
最后,深入高級機器學習主題,比如向量機和復雜數據轉換。
就像學習任何新技能一樣,練習得越多,就會學得越好。你可以通過練習不同的算法,使用不同的數據集來更好的理解機器學習,并提高解決問題的整體能力。
使用 Python 進行機器學習是對你的技能的一個很好的補充,并且有大量免費和低成本的在線資源可以幫助你。
途傲科技為中小企業提供網站制作、網站建設、微信H5、微信小程序,多商戶平臺,多級分銷系統,APP開發,手機網站,HTML5多端自適應網站,營銷型企業站建設,及對技術人才的培養等都積累與沉淀了豐富的心得和實戰經驗。
如果您有想法,可以將需求提交給我們【免費提交需求,獲取解決方案】
免責聲明:文章部分內容收集于互聯網,不代表本站的觀點和立場,如有侵權請聯系刪除。