色噜噜狠狠色综合成人网_色五月丁香六月欧美综合_国产98在线 | 欧美_狠狠躁天天躁夜夜躁婷婷

首頁
核心技術
產品體系
解決方案
動態資訊
關于我們
搜索
首頁 動態資訊 公司(si)新聞

北京衛視專訪易道博識:擁抱深度學習OCR,從服務器端到移動端

來源:易道博(bo)識(shi) 發布(bu)時間:2022-06-20

自2021服貿會召開以來,北京衛視一直在對會中涌現的服務創新型企業進行深入關注。10月17日,在北京衛視的財經頻道中,播出了易道博識聯合創始人兼首席技術官康鐵鋼接受北京衛視的采訪,并對易道博識的技術積累,產品服務和行業領先度等方面給予了高度認可。


“深度學習的成熟,給文字識別,人臉識別的識別率帶來了巨大提升,除了涌現大量的AI初創公司,也有很多實際的落地場景,我們公司從創立開始就擁抱深度學習,并圍繞深度學習搭建了我們的產品矩陣。”康鐵鋼在采訪中介紹道。


但是,深度學習在實際應用中條件很苛刻。人工智能模型的開發與上線應用需要經歷從業務理解、數據采標及處理、模型訓練與測試到運維監控等一系列流程。過程中需要大量的AI算力、高質量數據源、Al應用算法研發及Al技術人員的支持。


事實(shi)上,大部(bu)分中小企業(ye)用戶(hu)并(bing)不具備(bei)在“算(suan)力、數據、算(suan)法(fa)”三維度從0到1部(bu)署的(de)能力,而財力雄厚(hou)的(de)大型企業(ye)亦需高性價(jia)比的(de)AI開發部(bu)署方案。


所以,如何AI基礎層服務在多環節提升技術價值,AI產業如何進入低技術門檻、低部署成本、各產業深度參與雙向共建的效率化生產階段,是企業當下面臨的重要問題。


十年(nian)磨劍,如(ru)何用好深度(du)學習這柄“利劍”?



假如,每次開發模型都需要算法工程師單獨完成從生產到上線的全流程招建,就會導取很多時間的耗損與AI模型開發成本的浪費。所以集標注、訓練、推理于一體的賽博(Cybot)深度學習平臺應運而生。


賽博學習平臺是易道博識基于深度學習自主研發的全棧式數據服務平臺,包含數據標注平臺、訓練平臺、推理平臺、接口平臺、管理平臺5大部分,涵蓋數據標注,數據訓練、推理服務三大數據服務環節,可提供模型開放及模型訓練的流水線定制化服務。


賽博學習平臺的出現凝聚了易道博識2013年創立以來,在文字識別,圖像識別等核心技術上近十年的技術沉淀和經驗積累,也與驅動AI業務的外因以及企業自身的內因緊密相關。從外因看,規模化多場景的業務不斷衍生出長尾需求,原有的應用需及時更新;從內因看,囿于開發企業有限的經營成本與AI技術人才,其資源主要投放到現階段的主營業務,現有人員難以推動業務的智能化改造。


其中,智能結構化推理平臺用于訓練產生針對各種不同版式的OCR識別引擎,自動從非結構化數字信息中抽取目標數據,為識別平臺提供結構化方法,一個版式3~5分鐘內即可完成,可以賦予客戶自主解決80%以上的固定格式業務憑證的識別問題。


而其中的API接口平臺屬于API資源的一種,其可幫助技術領先企業開放AI能力與先進資源,從而延伸價值鏈、構造產業生態,形成規模經濟與長尾經濟,且利用開發者的創新應用來反哺開放平臺;同時,其亦可在減輕基礎設施建設投入的條件下協助開發者打造自身產品或服,節省開發時間。

從總體上看,賽博學習平臺可提供較為前沿的技術、經濟合理的模型生產經驗以及為實現敏捷開發而打包的數據、算力與算法資源。具體而言,其采用自動機器學習技術,很大程度上降低了機器學習的編程工作量、節約了AI開發時間、減輕了對專業數據科學家與算法工程師的依賴,讓缺乏機器學習經驗的開發者用上AI,加快開發效率。


春(chun)風(feng)化雨,把深(shen)度學習(xi)OCR帶給移動端


國內首份OCR白皮書《智能文字識別(OCR)能力測評與應用白皮書》中指出:大量的OCR應用需要在資源受限的移動端設備上運行,當前移動端OCR算法大多以犧牲一定的算法精度來換取運行速度,針對移動設備設計兼顧性能和效率的輕量OCR模型將是未來發展的重要方向。


早在去年,易道博識就察覺到了行業上的輕量級趨勢和需求,并在今年成功推出了移動端深度學習OCR ——DOM(,Deep OCR of Mobile),也就是手機端的深度學習OCR版本。


DOM是一款可(ke)以在(zai)(zai)移動端(duan)實現深度(du)(du)學習的OCR產品,可(ke)以支(zhi)持在(zai)(zai)任意方向或(huo)角度(du)(du)以及苛刻背景(jing)條件(jian)下(xia)的超高速證(zheng)件(jian)識(shi)別(bie)。DOM最大的特點體現在(zai)(zai)兩方面:高精(jing)度(du)(du),輕量(liang)級。他可(ke)以10M左右(you)的內存環境,在(zai)(zai)保證(zheng)高精(jing)度(du)(du)的前提下(xia),深度(du)(du)學習的高速度(du)(du)優勢完美展現,在(zai)(zai)手機上實現了原(yuan)來在(zai)(zai)服務端(duan)上才(cai)能支(zhi)持的精(jing)度(du)(du)與速度(du)(du)。



相比傳統 SDK 中基(ji)于四邊定位(wei)的的方法(fa),深(shen)(shen)度學(xue)習的方法(fa)能(neng)夠更好地排除 背(bei)景噪聲(sheng)的干擾,如存在背(bei)景線條或背(bei)景特征與(yu)證(zheng)件(jian)接近的情況(kuang),從而(er)可以得到更精(jing)確的證(zheng)件(jian)輪廓信息。在識別能(neng)力上,基(ji)于深(shen)(shen)度學(xue)習技術的 DOM SDK識別核心具有大幅(fu)度領先的識別精(jing)度,具體表現在如生(sheng)僻字、少數民族證(zheng)件(jian)等場景下更好的識別效果(guo)。


DOM SDK的市場需求非常大(da)(da),證券開戶(hu),銀(yin)行開戶(hu),投保理賠,汽車金融……等大(da)(da)量應(ying)用卡證識(shi)別,且移動端需求量極大(da)(da)的業務,都是DOM SDK的應(ying)用場景(jing)。這些(xie)場景(jing)對(dui)識(shi)別速度、識(shi)別精(jing)度的要求非常高,客(ke)戶(hu)容忍度低,注重(zhong)用戶(hu)體(ti)驗(yan),對(dui)產品的魯棒性要求很高。


與人臉識別等其它識別任務不同,OCR技術不僅(jin)需(xu)要卷積神經網絡(CNN),還需(xu)要更(geng)復雜(za)、計算(suan)量更(geng)大的遞歸神經網絡(RNN、LSTM),這(zhe)需(xu)要強大算(suan)力(li)為支撐,而手機并(bing)不像(xiang)服務器端一(yi)樣(yang)擁(yong)有GPU。在不依賴算力(li)和GPU的情況下,大幅度(du)提升識別精度(du),顯著改善用戶體驗(yan),這(zhe)正是DOM SDK的技術價值所在。


潤(run)物無聲,瞄準(zhun)市場(chang)風口,賦(fu)能更多行(xing)業


道阻且長,行則將(jiang)至。易道博識(shi)作為(wei)一名在AI路上已(yi)近10年的棋手(shou)(shou),在賽博平(ping)臺和(he)移動(dong)端OCR 無疑是兩手(shou)(shou)好棋。


首先,二者均從業務(wu)前(qian)端(duan)發掘潛在及(ji)外顯的市(shi)場需求(qiu),針對剛需應用(yong)與(yu)高(gao)價值環節延伸(shen)出多條增量建設與(yu)運行需求(qiu)業務(wu)線,瞄準市(shi)場風口(kou)的同時,敏捷(jie)、經濟地消化個性(xing)化和碎(sui)片化需求(qiu),根據需求(qiu)柔性(xing)匹配(pei)生(sheng)產。


而在兩(liang)手好棋的(de)(de)背后,易道博識也(ye)在構筑自己的(de)(de) “珍瓏棋局(ju)”。


從 2020 年至今,易道博(bo)識(shi)與(yu)華(hua)為建立(li)了密切的(de)(de)合作關(guan)系。不僅(jin)與(yu)華(hua)為在產品上達(da)成兼容,還基于(yu)各自(zi)領(ling)域的(de)(de)技(ji)術與(yu)資(zi)源(yuan)(yuan)優勢,在解(jie)(jie)決方(fang)案(an)層(ceng)上積極探索實踐。其(qi)中(zhong),易道博(bo)識(shi)的(de)(de)Deep OCR技(ji)術為Atlas 800推理服務器提(ti)供了“每秒20張A4紙”量級的(de)(de)文本識(shi)別能(neng)力(li),因性能(neng)提(ti)高帶來的(de)(de)資(zi)源(yuan)(yuan)節省使得機房空間下(xia)降了60%,資(zi)源(yuan)(yuan)能(neng)耗下(xia)降了30%。現已(yi)得到華(hua)為昇騰智能(neng)OCR解(jie)(jie)決方(fang)案(an)的(de)(de)Compatible技(ji)術認證證書。


并(bing)且今年,易道博識已經和英(ying)特(te)爾創新(xin)孵化器達成戰略合作(zuo),目(mu)前就(jiu)產(chan)(chan)品研發和應(ying)用上(shang)和英(ying)特(te)爾的(de)CPU技術(shu)框架進行適配(pei),目(mu)前階(jie)段性進展順利,POC技術(shu)合作(zuo)部分已取得了(le)滿(man)意的(de)優化結(jie)果,下一階(jie)段會逐(zhu)步應(ying)用到更(geng)多(duo)的(de)產(chan)(chan)品類型(xing)上(shang)。


在線留言