數(shù)據(jù)挖掘考研怎么準(zhǔn)備?其實(shí)從數(shù)據(jù)挖掘的起源可以發(fā)現(xiàn),它并不是一門嶄新的科學(xué),而是綜合了統(tǒng)計(jì)分析、機(jī)器學(xué)習(xí)、人工智能、數(shù)據(jù)庫(kù)等諸多方面的研究成果而成,同時(shí)與專家系統(tǒng)、知識(shí)管理等研究方向不同的是,數(shù)據(jù)挖掘更側(cè)重于應(yīng)用的層面。
因此來(lái)說(shuō),數(shù)據(jù)挖掘融合了相當(dāng)多的內(nèi)容,試圖全面了解所有的細(xì)節(jié)會(huì)花費(fèi)很長(zhǎng)的時(shí)間。因此我建議你的第一步是用大概三個(gè)月的時(shí)間了解數(shù)據(jù)挖掘的幾個(gè)常用技術(shù):分類、聚類、預(yù)測(cè)、關(guān)聯(lián)分析、孤立點(diǎn)分析等等。這種了解是比較粗的,目標(biāo)是明白這些技術(shù)是用來(lái)干什么的,典型的算法大致是怎樣的,以及在什么情況下應(yīng)該選用什么樣的技術(shù)和算法。
經(jīng)過(guò)初步了解之后,就要進(jìn)入選題的階段,選擇自己感興趣的某個(gè)具體方向,然后通讀該方向的經(jīng)典論文(綜述、主要發(fā)展方向、應(yīng)用成果)。選題階段可能會(huì)花費(fèi)較長(zhǎng)的時(shí)間,比如一年。此時(shí),要逐漸明確突破點(diǎn),也就是將來(lái)你論文的創(chuàng)新點(diǎn)。創(chuàng)新對(duì)于研究來(lái)說(shuō)非常重要,一方面該創(chuàng)新的確比原來(lái)的方法要好,另一方面該創(chuàng)新的確具有實(shí)用的價(jià)值。
隨后,就要來(lái)實(shí)現(xiàn)自己的想法。通常對(duì)于碩士論文來(lái)說(shuō),需要建立原型系統(tǒng),進(jìn)行試驗(yàn),并用試驗(yàn)結(jié)果來(lái)支持自己的論文主題。原型系統(tǒng)就是對(duì)自己創(chuàng)新點(diǎn)的實(shí)現(xiàn),需要很好地設(shè)計(jì)和開發(fā)。需要注意的是,原型系統(tǒng)的建立和開發(fā)商用系統(tǒng)不同,需要體現(xiàn)比較好的理論基礎(chǔ)。也就是說(shuō),原型系統(tǒng)并不是簡(jiǎn)單地用于實(shí)現(xiàn)功能,而是將你的一整套理論付諸實(shí)現(xiàn)。這種理論基礎(chǔ)也將會(huì)包含在你的論文中,以體現(xiàn)論文的理論高度。
原型系統(tǒng)的搭建以及產(chǎn)生令人信服試驗(yàn)結(jié)果,這個(gè)過(guò)程一般需要至少一年的時(shí)間。所以要集中精力于核心部分(體現(xiàn)論文創(chuàng)新點(diǎn)的部分),外圍的界面等等不應(yīng)投入太多的精力,以免進(jìn)度失控。
最后是論文的整理和寫作了。建議你在之前的階段中逐步先寫出一些篇幅較短的論文(用于發(fā)在期刊、會(huì)議上),比如綜述、體系框架、算法內(nèi)核、應(yīng)用等等。這樣在最后寫畢業(yè)論文時(shí)就有了足夠多的內(nèi)容,會(huì)寫得更好更快一些。
以上只是泛泛而談。其實(shí)我覺(jué)得其中的關(guān)鍵點(diǎn)在于選題,而選題的好壞取決于你對(duì)數(shù)據(jù)挖掘研究現(xiàn)狀的了解、你的興趣和專長(zhǎng)、以及該方向在應(yīng)用上的意義。建議你和導(dǎo)師、同行多交流,能夠讓自己的方向更清晰。
至于數(shù)據(jù)挖掘領(lǐng)域的就業(yè),應(yīng)該來(lái)說(shuō)還是前景不錯(cuò)的。如果你對(duì)研究有興趣,象微軟研究院、Google、高校研究所都是不錯(cuò)的地方;如果你對(duì)實(shí)際應(yīng)用有興趣,很多大的公司包括IBM、Accenture、亞信等等都有相應(yīng)的人力需求,當(dāng)然一些甲方的單位比如證券、保險(xiǎn)、金融等等單位也都需要分析人才。
以上就是【數(shù)據(jù)挖掘考研】的全部解答,如果你想要學(xué)習(xí)【考研專業(yè)】更多這方面的知識(shí),歡迎大家前往高頓考研考試頻道!