2024年9月13日,第十三屆中國知識產權年會在北京開幕,來自39個國家和4個國際組織的參會人員就知識產權法治建設、保護、運用、國際合作等展開交流。據了解,本屆年會共設置1個主論壇、11個分論壇,超過20場同期活動,以多元化形式展示知識產權事業發展的最新成果。
年會主旨演講環節上,百度集團資深副總裁梁志祥發表了主題演講。梁志祥在演講中介紹了人工智能大模型應用創新尤其是AI智能體的發展現狀,并闡釋了新時代知識產權與創新及新質生產力發展的深刻關聯。
以下為演講實錄:
今天的發言題目是“AI智能體是大模型目前最重要的應用”。2019年,我參加一個WIPO舉辦的人工智能與知識產權主題的創新論壇。在論壇上,我被問到的一個問題是:人工智能什么時候才能融入到普通人的日常生活中?那時,作為中國較早進入大模型領域的公司,百度已經發布文心模型的1.0版本,但當時大模型還不像現在這樣是一個很時尚、熱門的詞。我回答道,我們需要耐心,隨著算力、算法、數據這三個維度逐步提升,總有一天大家會看到一個進入尋常百姓家的人工智能產品。
2022年,隨著OpenAI發布ChatGPT,以及百度“文心一言”等一批中國大模型的相繼推出,我們進入了一個新的生成式人工智能時代。如今是人工智能大模型發展的窗口期。就在幾個小時之前,OpenAI發布了全新的o1模型。大模型的競爭遠未結束,甚至才剛剛開始。曾經有一段時間,大家認為大模型彼此之間的差距似乎很小,已經接近了大模型的天花板。但事實上,這一領域內的技術差距會越來越大,各公司之間的競爭也只會越來越激烈。
今天我們已經步入一個生成式人工智能的世界。過去一年中,大模型領域最熱門、最重要的概念就是AI智能體(AI Agent),AI智能體也被視為作為大模型最重要的應用場景。智能體帶來的最大變化,在于它能夠完全代表人與人之間的對話。最早期的人工智能采用嵌入式模式,所有指令都要靠人去下達,機器是被動接受、執行指令。后來發展出了副駕駛模式,即一部分由人下達指令,另一部由是機器自己生成指令?,F在的AI智能體則能夠理解人,能夠預先感知到一些變化并提前采取相應措施。也就是說,AI具備了自主執行的能力。
依托大模型,AI智能體具備四項重要的核心能力:一是理解能力,即能夠理解復雜的問題。我們經常說“理解萬歲”,人與人之間的溝通尚且如此,可見理解是非常難的事情。人工智能的理解更難,因為它需要瞬間完成對訴求的理解,而且這種理解不是從固定數據庫中摘選出來的。二是邏輯能力,即很強的演繹能力和歸納能力。三是記憶能力,比如我們和一個朋友聊一下午,聊到最后可能都忘了最開始的話題,但是智能大模型不會,你跟它聊天的所有過程它都記得。
以百度“慧播星”智能體為例,作為百度優選旗下業內首個AI全棧式數字人直播解決方案,慧播星依托多項生成式AI技術,通過智能展現、智能大腦、智能場控三大核心能力,構成了電商直播場景的超級智能體?;鄄バ巧傻闹鞑ズ透辈ザ际菙底秩酥悄荏w,其中,主播能判斷直播室當中的問題是否是關鍵問題,并回答關鍵問題,由副播回答非關鍵問題。主播、副播兩個智能體之間能夠無縫交流,無需任何人為干預,實現了“人機交互”到“人人交互”的進化。想象即現實,智能體高度便捷且便于分發的特性,使得人人在未來都可以成為智能體,成為知識產權的創造者。
最后談談知識產權與創新的關系。今天,知識產權到底是應該更多地鼓勵、支持創新,還是更多地去規范創新?我們看到,大量的創新來自于產業一線,而產業的變化遠遠超出了法律界、學術界的想象。不斷涌現的新技術,正推動著知識產權制度的變革。我非常高興地看到,本屆年會以“知識產權為新質生產力蓄勢賦能”為主題,這已經說明了知識產權與創新之間的本質關系。AI智能體是大模型最重要的應用方向,隨著新技術的不斷涌現,創新與知識產權的邊界還在不斷延伸,未來大模型的發展也必將更加超乎每個人的預料。
關鍵詞: