【職位描述】:*?能夠基于用戶在線行為數(shù)據(jù)建立多模型復(fù)合分析模型,從而實現(xiàn)behavioral?targeting,?look-alike?modeling,anomaly?detection,recommendation等在商業(yè)問題上運用*?協(xié)助工程師在大型集群上部署模型,協(xié)助實現(xiàn)模型的高效和并發(fā)【任職資格】:*?計算機科學(xué)、應(yīng)用數(shù)學(xué)、統(tǒng)計學(xué)、經(jīng)濟學(xué)、物理學(xué)、天文學(xué)、商業(yè)分析、信息系統(tǒng)、數(shù)據(jù)科學(xué)或相關(guān)本科或以上學(xué)歷*?良好的團隊合作精神與溝通能力*?具備很強的工程能力,執(zhí)行力強*?有很強的好奇心【技能要求】:必須要求:*?對常見機器學(xué)習(xí)模型,如有監(jiān)督模型k-NN,?Na?ve?Bayes,?Linear?Regression,?Logistic?Regression?(包含LASSO和RIDGE),?Regression/Decision?Tree,?GBDT,?Random?Forest,全連接神經(jīng)網(wǎng)絡(luò);無監(jiān)督模型如k-means,DBSCAN,?PCA有堅實的理論基礎(chǔ),能熟練推導(dǎo)模型公式?(以上列出的算法為必考考點)*?熟練掌握機器學(xué)習(xí)的基本概念和方法:Type?I/II?error,?activation?function?(ReLU,?Sigmoid),?SGD,?VC?(Vapnik-Chervonenkis)?dimension,?information?entropy,?cross?entropy,?KL?(Kullback-Leibler)?divergence,?cross?validation,?boosting,?bagging,?L1/L2?regularization,?backward-propagation,?model?performance?benchmark?(AUC,?logloss,?K/S,?precision,?recall,?accuracy,?F-score以及什么情況下應(yīng)該使用哪些)?(以上列出的概念為必考考點)*?熟練使用Python,Pandas,Sklearn,XGBoost(python?API),LightGBM(python?API)等編程語言和軟件包*?在項目或者課程中使用過常見的特征篩選(feature?selection)和特征降維(dimension?reduction)的方法*?熟悉不平衡樣本的處理方法*?在項目或者課程中,使用Shiny/ggplot,?Dash(python)/Seaborn/Plotly等數(shù)據(jù)可視化工具*?具備閱讀英文技術(shù)文檔和英文學(xué)術(shù)文獻的能力(筆試和內(nèi)部考核考試為全英文)額外加分項:*?參加過Kaggle/天池等機器學(xué)習(xí)建模比賽,取得良好的成績,并屬于算法團隊核心成員的人優(yōu)先*?在項目或者課程中,使用過pyspark或者dask等分布式計算平臺者優(yōu)先*?在項目或者課程中,使用過TensorFlow等深度學(xué)習(xí)平臺者優(yōu)先*?具備征信/風(fēng)控/計算廣告相關(guān)經(jīng)驗,熟悉行業(yè)中特征工程方法者優(yōu)先