3月18日,由中國圖象圖形學學會(CSIG)主辦,合合信息、CSIG文檔圖像分析與識別專業委員會聯合承辦的“CSIG企業行”系列活動成功舉辦。
“CSIG企業行”是中國圖象圖形學學會主辦的走進企業系列活動,旨在充分利用學會專家資源,搭建學術界與企業交流合作平臺,為企業創新發展提供科技支撐,為圖像圖形領域高校師生提供與企業互動機會,共同推動圖像圖形領域的發展。
據悉,此次活動以“圖文智能處理與多場景應用技術展望”為主題,聚焦圖像文檔處理中的結構建模、底層視覺技術、跨媒體數據協同應用、生成式人工智能及對話式大型語言模型等熱門話題,特邀來自上海交大、復旦、廈門大學、中科大的頂尖學府的學者與合合信息技術團隊一道,分享文檔處理實踐經驗及NLP發展趨勢,探討人工智能與文檔處理未來。
合合信息董事長、總經理鎮立新博士致辭
活動中,合合信息董事長、總經理鎮立新博士與CSIG文檔圖像分析與識別專委會主任金連文教授分別進行了致辭。隨后,各學者針對人工智能進行了專業分享。
上海交通大學人工智能研究院常務副院長、國家杰青、IEEE Fellow楊小康教授進行了《生成式人工智能與元宇宙》主題分享。楊小康認為,以“識別-分析”為代表的判別式人工智能推動了人工智能前十年的發展,接下來十年,以“合成-重建”為代表的生成式人工智能將成為主流。
復旦大學計算機學院教授、國家優青、上海市計算機學會自然語言處理專委會主任邱錫鵬進行了《對話式大型語言模型》主題分享。“文本所承載的知識只是冰山一角,還有很多‘暗知識’并不是以文本形式記錄的。在未來的發展里,人工智能還有‘具身學習、跨模態學習’等更多知識領域需要學習。”邱錫鵬說。
廈門大學人工智能研究院負責人、國家杰青紀榮嶸教授進行了《復雜跨媒體數據協同分析與應用》主題分享。紀榮嶸指出,連接視覺與自然語言的“視覺描述”領域,是最受關注且最具潛力的人工智能研究任務之一 。視覺和語言的研究應是雙向的,各自的新發現、新方法可以互相迭代促進。跨空間、跨領域、跨任務知識遷移方面有較大探索空間,易于發現新的科學問題。
合合信息圖像算法研發總監郭豐俊也進行了《文檔圖像處理中的底層視覺技術》主題分享。郭豐俊提到,合合信息智能文檔處理技術基于對圖像目標區域的精準裁剪,對彎曲、傾斜透視的頁面進行形變矯正,在去除陰影、摩爾紋后,通過人工智能技術對文檔圖像進行增強銳化和清晰度提升,達到“圖像質量增強”的效果,在改善閱讀體驗的同時,也提升了識別轉換、圖像分析等文檔處理下游任務的質效。
據悉,合合信息是一家人工智能及大數據科技企業,專注于智能文檔處理底層技術及應用產品的研究工作,重點關注圖像質量優化、版面還原、復雜場景文字識別,文檔理解,數據“知識化”等方面。
公開資料顯示,合合信息“復雜場景文檔圖像識別與理解關鍵技術及應用”項目被中國圖象圖形學學會科技成果鑒定會委員認為“在復雜場景文檔圖像識別與理解技術方面取得了創造性的成果,并具有自主知識產權,整體技術達到國際先進水平”。
關鍵詞: