崗位職責:1.對海量數(shù)據(jù)進行分析,并利用算法挖掘分析數(shù)據(jù)之間的相互作用關系和聯(lián)系,發(fā)現(xiàn)潛在規(guī)律,建立機器學習算法并優(yōu)化;2.負責基于大數(shù)據(jù)技術的海量數(shù)據(jù)的自動化分析和處理工作;3.負責公司數(shù)據(jù)分析及挖掘項目的實施;4.理解數(shù)據(jù)分析和挖掘的應用場景,抽象為數(shù)據(jù)產(chǎn)品需求;5.研究數(shù)據(jù)挖掘或統(tǒng)計學習領域的前沿技術,并用于實際問題的改善和優(yōu)化;6.通過對數(shù)據(jù)的敏銳洞察,深入挖掘產(chǎn)品潛在價值和需求,進而提供更有價值的服務;7.協(xié)助架構師從技術層面完成所有的技術實施架構,包括Hadoop/Spark等大數(shù)據(jù)平臺、數(shù)據(jù)倉庫、數(shù)據(jù)模型等;8.負責數(shù)據(jù)挖掘算法設計和程序編寫。職位要求:1.應用數(shù)學,統(tǒng)計學,經(jīng)濟學,計算機等相關專業(yè);2.3-5年數(shù)據(jù)相關經(jīng)驗,有大規(guī)模數(shù)據(jù)挖掘經(jīng)驗;3.在統(tǒng)計((statistics)或機器學習(machine?learning)、文本分類或聚類(text?classification?and?clustering)、海量數(shù)據(jù)處理、分布式計算(distributed?computing)等方面有一定的理論功底和實踐經(jīng)驗;4?.?精通數(shù)據(jù)分析模型,如統(tǒng)計學習理論,貝葉斯統(tǒng)計,算法信息理論,歸納推理等;并且了解它們的強弱之處;5.熟悉大規(guī)模數(shù)據(jù)分析技術,掌握分布式機器學習的相關技術,熟悉數(shù)據(jù)挖掘相關算法,如決策樹-decision?tree,?SVM、聚類-clustering,邏輯回歸-logistic?regression,貝葉斯-Bayesian?等。6.?具有深度CNN(Deep?Convolutional?Neural?Network)和深度RNN?(Deep?Recursive?Neural?Network)應用經(jīng)驗者;7.熟練掌握參數(shù)服務器的工作原理,至少熟悉一種開源分布式深度學習架構;8.熟悉Hadoop,?Storm,Spark等大數(shù)據(jù)技術以及適應場景,?有大規(guī)模數(shù)據(jù)處理和日志處理經(jīng)驗的優(yōu)先,了解NoSQL技術,有實際使用者優(yōu)先;9.精通Python語言,熟悉SQL和ETL相關流程,熟悉Linux環(huán)境及常用命令;10.對數(shù)據(jù)敏感,有強烈的好奇心,喜歡研究數(shù)據(jù)并從數(shù)據(jù)中發(fā)現(xiàn)價值;11.勤奮踏實、工作積極主動、有責任心,能夠在壓力下工作;12.具有很強的分析問題和解決問題的能力,攻關疑難問題的強烈興趣,善于學習,具有很強的團隊管理能力和溝通能力。