色噜噜狠狠色综合成人网_色五月丁香六月欧美综合_国产98在线 | 欧美_狠狠躁天天躁夜夜躁婷婷

首頁
核心技術
產品體系
解決方案
動態資訊
關于我們
搜索
首頁 動態資訊 公司新聞

以數據驅動模型,可訓練、可現場應用的賽博學習平臺

來(lai)源:易道(dao)博識 發布(bu)時(shi)間:2022-11-18

日(ri)前,由江蘇省支付清算服務協會、山東省支付清算協會支持的2022金融科技創(chuang)新(xin)發展論壇在遵義成功召開。易道博(bo)識CTO康鐵鋼先(xian)生受(shou)邀參(can)會,與(yu)來自銀行、保險(xian)、證(zheng)券等行業(ye)的100余位行業(ye)專家,分享以(yi)數(shu)據驅動模型,可訓練、可現場應用(yong)的賽博(bo)深(shen)度學(xue)習平(ping)臺(tai)在行業(ye)中的應用(yong)創(chuang)新(xin)。



行業(ye)痛(tong)(tong)點繁多,長尾憑(ping)證痛(tong)(tong)點難除(chu)


隨著金(jin)融業務(wu)的(de)發展,越(yue)來越(yue)多(duo)的(de)業務(wu)線中涉及(ji)的(de)紙質憑(ping)證影像需(xu)要(yao)用到OCR自動處理,來進(jin)一步提(ti)升業務(wu)辦理的(de)效(xiao)率。從(cong)企業內(nei)部的數據類型來看(kan),這些憑(ping)證(zheng)影像按(an)照格式可以分(fen)為兩類(lei):一類(lei)是固定(ding)格式的憑(ping)證(zheng)(戶口本(ben)、港澳臺身份證(zheng)、外國(guo)人永久(jiu)居留證(zheng)等),占(zhan)整(zheng)體(ti)90%以上;一類(lei)是非固定(ding)格式的憑(ping)證(zheng)(銀行流水等)。這些(xie)憑證存在以下特點:

1、種類(lei)多:行(xing)內在各個業務受理過程(cheng)中涉及到的憑(ping)證(zheng)都在百(bai)種以上,甚至多達幾百(bai)種;

2、更新(xin)頻(pin)繁:不少(shao)憑證會(hui)隨著(zhu)業務需求或者監管制度的變化而調整格(ge)式;

3、長尾憑證“雞(ji)肋”:存在很多使用頻率低,但(dan)總體數量大的憑證,這些憑證單(dan)獨采購識別的價值不大但(dan)又無法(fa)解決;

4、數據(ju)安全(quan):大(da)多數(shu)(shu)情(qing)況(kuang)下(xia),隱私數(shu)(shu)據是(shi)無(wu)法對外的(de),如(ru)何在這種情(qing)況(kuang)下(xia)做模型訓練是(shi)客觀(guan)需要面(mian)對的(de)問題;


基于此類特點,對憑證的OCR識別工作就特別復雜。目前針對與此的解決方案都各有缺(que)陷:要(yao)么持續(xu)投入(ru)高(gao),需要(yao)廠商(shang)就每(mei)一種憑證進行定制化開(kai)發(fa),要(yao)么需要(yao)采(cai)購(gou)廠商(shang)底(di)層能力,而且需要(yao)OCR專家團隊的支持,投入(ru)成本(ben)更高(gao)。因(yin)此,行業迫切需要(yao)一(yi)個能(neng)夠減少后續投入,自主可控的(de)解決方案。


自我數據閉環,賽博自成有機整體


賽博(bo)學習平臺(tai)是易道博(bo)識(shi)基于深度學習自主(zhu)研發的一站式機器學習訓練平臺(tai)。賽博平(ping)臺集數據管(guan)理、數據標注、模(mo)型(xing)訓(xun)練和模(mo)型(xing)應(ying)用于一身,提供及(ji)時、現場(chang)化的(de)數據驅動(dong)模(mo)型(xing)應(ying)用解決(jue)方案。



論壇上,易(yi)道博(bo)識(shi)CTO康鐵鋼(gang)介紹道:“賽博(bo)平臺充分利(li)用(yong)(yong)了現有的(de)經過長期迭代的(de)基(ji)礎模(mo)型(xing)能力,包括(kuo)圖像(xiang)、OCR和(he)NLP等(deng),在少量樣本的(de)驅動下,利(li)用(yong)(yong)遷移學習和(he)小樣本學習等(deng)技(ji)術,高效(xiao)地完成增量模(mo)型(xing)的(de)訓練(lian),生成最(zui)優的(de)模(mo)型(xing)文(wen)件,并(bing)通過推理(li)平臺來實現模(mo)型(xing)的(de)快速部署與生產應用(yong)(yong)。


產(chan)品組成(cheng)上(shang),賽博平(ping)臺(tai)(tai)(tai)由管(guan)理(li)中心CyberCenter、數據(ju)標(biao)(biao)注平(ping)臺(tai)(tai)(tai) CyberData、深度學習訓(xun)練平(ping)臺(tai)(tai)(tai) CyberLearning和(he)深度學習推理(li)平(ping)臺(tai)(tai)(tai) CyberServing幾個子(zi)平(ping)臺(tai)(tai)(tai)組成(cheng),各子(zi)平(ping)臺(tai)(tai)(tai)依次承擔平(ping)臺(tai)(tai)(tai)管(guan)理(li)、數據(ju)管(guan)理(li)與標(biao)(biao)注、模型(xing)訓(xun)練和(he)模型(xing)服務的功能,個(ge)子平臺之間相互(hu)獨立又有(you)效(xiao)(xiao)配合,形成(cheng)一個(ge)有(you)機整體(ti),從而有(you)效(xiao)(xiao)支撐數據驅(qu)動模型應用的整體(ti)功能。


數據標注平臺 CyberData


數(shu)據(ju)平(ping)臺主(zhu)要功能包括數(shu)據(ju)管(guan)理、數(shu)據(ju)處理、樣本擴充、數(shu)據(ju)標(biao)注(zhu)與采集。數(shu)據(ju)平(ping)臺內置exLabeler標(biao)注(zhu)客戶端,提供強(qiang)大專業(ye)的CV、OCR、結構化和(he)NLP任務標(biao)注(zhu)功能。同時,數(shu)據(ju)平(ping)臺還支持單人和(he)團(tuan)隊標(biao)注(zhu)模式(shi)。


用戶可以通過exLabeler客戶端完成樣本的(de)標注(zhu)。exLabeler支(zhi)持CV、OCR、結構化(hua)和(he)NLP等領域(yu)算法的(de)標注(zhu)。標注(zhu)完成的(de)數據集(ji)可以直接用于(yu)(yu)模(mo)型(xing)訓練,或進一步做后處(chu)(chu)理(如圖像(xiang)處(chu)(chu)理、樣本擴充(chong)等),然后再用于(yu)(yu)模(mo)型(xing)訓練。


數據標注(zhu)平臺 CyberData工作流程


深度學(xue)習訓練平臺 CyberLearning


訓練平臺(tai)(tai)通過自身對于訓練資源池的集中管理(li)與分配,以及與管理(li)平臺(tai)(tai)的無縫對接,可以方便地實(shi)現訓練基(ji)礎設(she)施的管理(li),從而減輕用(yong)戶的管理(li)維護工作。同(tong)時,利用(yong)自動超參(can)搜索等(deng)技(ji)術,訓練平臺(tai)(tai)可以自動搜索到最(zui)佳性能的模型(xing)。


通過(guo)分布式訓(xun)練(lian)與多框架支(zhi)持(chi),訓(xun)練(lian)平(ping)(ping)(ping)臺(tai)可(ke)(ke)以最(zui)大化(hua)利用計(ji)算資(zi)源,加速模(mo)(mo)型訓(xun)練(lian)。同時,利用自動超參(can)搜索(suo)等(deng)技(ji)術,訓(xun)練(lian)平(ping)(ping)(ping)臺(tai)可(ke)(ke)以自動搜索(suo)到最(zui)佳性能(neng)的模(mo)(mo)型。最(zui)后(hou),對于訓(xun)練(lian)所得的最(zui)優模(mo)(mo)型,訓(xun)練(lian)平(ping)(ping)(ping)臺(tai)支(zhi)持(chi)一(yi)鍵部(bu)署到推理平(ping)(ping)(ping)臺(tai),實現(xian)模(mo)(mo)型的快(kuai)速應用。


深度學習訓練平臺 CyberLearning工(gong)作流程(cheng)



深度學習推理平臺(tai) CyberServing


推理(li)平臺(tai)主要完成各種識別(bie)(bie)功(gong)能的(de)部署。業務系(xi)統通過調用推理(li)平臺(tai)提供的(de)RESTful API提交圖(tu)像并獲得識別(bie)(bie)結(jie)果(guo)。整體上講,推理(li)平臺(tai)產(chan)品需求可分(fen)解為(wei)模型(xing)管(guan)(guan)理(li)、API過程定義、識別(bie)(bie)數據查(cha)看,接口(kou)統計和其(qi)它(ta)非功(gong)能項等部分(fen)。其(qi)中模型(xing)管(guan)(guan)理(li)和API管(guan)(guan)理(li)模塊(kuai)屬于基礎核心模塊(kuai)。


推(tui)理(li)平臺(tai)對同一(yi)模型(xing)(xing)(xing)不(bu)同版(ban)(ban)本(ben)的(de)管(guan)理(li),并支持(chi)在模型(xing)(xing)(xing)服(fu)務(wu)(wu)中同時加載和運(yun)行多個(ge)(ge)版(ban)(ban)本(ben)的(de)模型(xing)(xing)(xing)。推(tui)理(li)平臺(tai)還支持(chi)一(yi)個(ge)(ge)API綁定多個(ge)(ge)模型(xing)(xing)(xing)服(fu)務(wu)(wu)。模型(xing)(xing)(xing)升級時,用戶可(ke)以選擇先在部分(fen)服(fu)務(wu)(wu)中激活新版(ban)(ban)本(ben)的(de)模型(xing)(xing)(xing),完成測試驗證后再升級其(qi)他服(fu)務(wu)(wu)。


深(shen)度學(xue)習推(tui)理平臺 CyberServing工作(zuo)流程


值得(de)一提的(de)(de)(de)是,賽博平(ping)臺打(da)造了數(shu)據(ju)驅(qu)動(dong)模(mo)(mo)型(xing)應用的(de)(de)(de)閉環(huan)。推(tui)理(li)(li)平(ping)臺支(zhi)(zhi)持對于(yu)自(zi)身(shen)所產生(sheng)(sheng)的(de)(de)(de)生(sheng)(sheng)產數(shu)據(ju)根據(ju)不(bu)同的(de)(de)(de)條件進行自(zi)動(dong)采(cai)集的(de)(de)(de)功能,采(cai)集后的(de)(de)(de)數(shu)據(ju)可(ke)以(yi)方便地導(dao)入標(biao)(biao)注平(ping)臺,形(xing)成數(shu)據(ju)集,并支(zhi)(zhi)持進一步(bu)的(de)(de)(de)數(shu)據(ju)處理(li)(li)與標(biao)(biao)注。標(biao)(biao)注完成的(de)(de)(de)數(shu)據(ju)集可(ke)以(yi)用于(yu)模(mo)(mo)型(xing)的(de)(de)(de)訓練調優,從而得(de)到(dao)性能更佳的(de)(de)(de)模(mo)(mo)型(xing),用于(yu)更新推(tui)理(li)(li)平(ping)臺生(sheng)(sheng)產模(mo)(mo)型(xing),從而形(xing)成一個完整的(de)(de)(de)數(shu)據(ju)閉環(huan)。


《國民經(jing)濟和社(she)會發展(zhan)(zhan)第十四(si)個(ge)五(wu)年規(gui)劃和2035年遠(yuan)景(jing)目(mu)標(biao)綱要》提出(chu)加快數字(zi)化(hua)發展(zhan)(zhan),人(ren)民銀行《金融科(ke)技發展(zhan)(zhan)規(gui)劃(2022-2025)》中明確了“十四(si)五(wu)”期間行業(ye)金融科(ke)技發展(zhan)(zhan)、數字(zi)化(hua)轉(zhuan)型(xing)目(mu)標(biao),要從(cong)治理體系、業(ye)務(wu)創新、技術和數據能力建設、風險防范等多維(wei)度提出(chu)重(zhong)點任務(wu),推動行業(ye)數字(zi)化(hua)轉(zhuan)型(xing)落地實施。


如(ru)今,AI產(chan)業正(zheng)逐步(bu)進入低技術(shu)門檻、低部署成本、各(ge)產(chan)業深度參與雙向共建的效率化生產(chan)階段。而作為支撐AI模型開發及落地的資源型平(ping)臺,賽博平(ping)臺可在多方(fang)面提(ti)升AI技術(shu)價值釋放。從總體(ti)上(shang)看,賽博(bo)平臺可提(ti)供較為前沿的(de)技術(shu)、符(fu)合(he)業務(wu)場景的(de)模型(xing)生產經(jing)驗(yan)以(yi)及打包的(de)數據(ju)與算法資(zi)源。


“具體(ti)而(er)言,一方面,賽博平臺(tai)一定程(cheng)度(du)上(shang)(shang)解決(jue)了(le)規(gui)模化多場景的業務不(bu)斷衍生出的長尾需求。另一方面,平臺(tai)采用自動機器學(xue)(xue)習技術,很大程(cheng)度(du)上(shang)(shang)降低了(le)機器學(xue)(xue)習的編程(cheng)工作量(liang)、節約了(le)AI 開發時間、減輕了(le)對(dui)專(zhuan)業數據科學(xue)(xue)家與算(suan)法工程(cheng)師的依(yi)賴,讓缺乏機器學習經驗的開(kai)發者用上AI,加快了開(kai)發效(xiao)率


“我(wo)們通過(guo)產品和服務來獲得行業認(ren)可。我(wo)們認(ren)真服務每一(yi)個客戶,認(ren)真解決客戶問題。”康鐵(tie)鋼說道:“我(wo)們會(hui)專注于人工智能領域,致力于人工智能領域的理論(lun)研究(jiu)與(yu)應用開發,不斷創新,為企(qi)業降本增效,通過(guo)人工智能提升社會(hui)的運(yun)行效率(lv)。”

在線留言