近期,上海合合信息科技股份有限公司(以下簡稱“合合信息”)啟動IPO引發了眾多關注。說起合合信息,大家可能比較陌生,但談起掃描全能王,相信很多人都比較熟悉,其母公司便是合合信息。作為一款智能掃描及文字識別APP,掃描全能王的用戶可以說是遍布全球。
以掃描全能王“文件轉換excel”相關功能為例,自推出以來已被調用百萬次,“文件轉換excel”功能的技術支撐是合合信息深耕多年的智能文字識別技術。
無論是工作還是學習中,表格處理的任務都不輕松,尤其是復雜場景下的表格識別,難上加難。洞悉于此,合合信息利用高精確度的表格識別技術幫助用戶節省文件處理時間。這也是合合信息智能文字識別技術中,圖像處理和復雜場景文字識別技術的重要應用。
近年來人工智能技術飛速發展,計算機視覺(CV)、自然語言處理(NLP)和圖神經網絡等深度學習方法被廣泛引入表格識別任務中,例如語義分割、目標檢測、序列預測等。在16年領域深耕中,合合信息智能文字識別技術覆蓋了圖片、PDF格式文檔中多種類的表格識別需求,包括有線表,三線表,無線表等,并且支持合并單元格、多表格并存等復雜情況的識別。
基于分治思想,合合信息引入深度學習技術,將表格識別分為有線表識別和無線表識別兩種方案。有線表識別中,合合信息利用語義分割、角點回歸等技術方案還原有線表,在財報相關表格識別測試中,有線表識別單元格結構準確率高于98%。
無線表缺少表格線,直接套用有線表識別方案無法得到理想的表格結構。合合信息無線表識別采用序列模型、規則匹配等方案,通過自研模型直接預測表格的邏輯結構,再得到表格的物理結構,在保證表格區域內容的完整性的同時,檢測準確率較傳統方法顯著提升。
除了應用在掃描全能王APP中,合合信息的表格識別技術還已落地在保險、銀行、證券等行業中,應用于合同、銀行流水、物流單據識別等多個場景。曾助力全球知名汽車零配件供應商偉巴斯特實現票據智能掃描、識別、驗真、合規自動檢查、發票與訂單數據匹配、數字化數據、影像留存等全流程財稅管理,作業效率提升500%~1000%。
據悉,合合信息是一家人工智能及大數據科技企業,從2006年創立至今,堅持深耕智能文字識別應用及商業大數據核心技術領域,通過C端、B端產品以及行業解決方案,為全球百余個國家和地區的億級用戶及近30個行業的企業客戶提供創新的數字化、智能化服務。
除了智能文字識別外,合合信息在商業大數據領域基于大數據挖掘、知識圖譜、NLP技術開發了啟信寶APP,以及可服務于多種行業、多類型企業客戶的商業大數據服務,通過“數據-信息-知識-智能”4個層次,挖掘商業數據背后蘊藏的價值,賦能各行各業。
合合信息對于AI和大數據的布局,是基于對這兩項技術和行業需求的深入理解。據稱,這兩項技術相輔相成,海量的大數據可以幫助深度學習算法模型的設計和優化,同時AI模型也可實現更高效、深層的數據挖掘。并且,AI與大數據業務的客戶需求也具有一定程度的重疊,兩者協同耦合可以實現更多應用,能更好的解決各行業數字化轉型遇到的問題。
免責聲明:市場有風險,選擇需謹慎!此文僅供參考,不作買賣依據。
關鍵詞: