1.解析PDF,Word,PPT等各類文件格式,?根據(jù)需求提取文字、表格、公式、圖像等結(jié)構(gòu)化信息;2.根據(jù)需求將文字,圖像,表格,公式等信息組織成文檔;3.編碼并實(shí)現(xiàn)信息提取的標(biāo)準(zhǔn)庫(kù),服務(wù)公司各個(gè)產(chǎn)品;4.進(jìn)行相關(guān)領(lǐng)域的算法研究,跟進(jìn)前沿技術(shù),服務(wù)各類項(xiàng)目的需求。?職位要求:1.計(jì)算機(jī)相關(guān)專業(yè)本科及以上學(xué)歷;2.熟悉pdf文件格式,有過pdf文件信息提取的相關(guān)經(jīng)驗(yàn),熟悉pdf標(biāo)準(zhǔn)者優(yōu)先;3.至少精通下列語言之一:python,java,C++;4.熟悉docx,pptx,xlsx標(biāo)準(zhǔn)者優(yōu)先;5.有深度學(xué)習(xí)和機(jī)器學(xué)習(xí)經(jīng)驗(yàn)者優(yōu)先;6.有計(jì)算機(jī)視覺和計(jì)算機(jī)圖形學(xué)經(jīng)驗(yàn)者優(yōu)先;7.思路清晰,主動(dòng)性強(qiáng),有很強(qiáng)的自我驅(qū)動(dòng)力;8.優(yōu)秀的分析和解決問題的能力,和快速學(xué)習(xí)的能力。