中國(guó)AI產(chǎn)業(yè)在加快形成新質(zhì)生產(chǎn)力過程中如何發(fā)力、定力、蓄力
金山辦公在合作、服務(wù)、供給端的AI探索
導(dǎo)讀:金山辦公副總裁、研發(fā)中臺(tái)事業(yè)部總經(jīng)理姚冬日前接受《半月談》關(guān)于AI產(chǎn)業(yè)如何加快形成新質(zhì)生產(chǎn)力的主題調(diào)研訪談,以WPS的AI創(chuàng)新為出發(fā)點(diǎn),談到了圍繞新質(zhì)生產(chǎn)力,作為辦公AI產(chǎn)業(yè)領(lǐng)域代表的金山辦公,在合作、服務(wù)、供給端如何發(fā)力,為什么有定力,要怎么蓄力。
根據(jù)中共中央、國(guó)務(wù)院印發(fā)的《數(shù)字中國(guó)建設(shè)整體布局規(guī)劃》,2025年要基本形成橫向打通、縱向貫通、協(xié)調(diào)有力的一體化推進(jìn)格局,數(shù)字中國(guó)建設(shè)取得重要進(jìn)展,數(shù)字經(jīng)濟(jì)戰(zhàn)略地位不斷提升。
金山辦公(SH:688111)和華為鴻蒙近日達(dá)成的合作,正在成為中國(guó)企業(yè)將規(guī)劃進(jìn)行市場(chǎng)化落地的一部分。6月21日至23日,在2024華為開發(fā)者大會(huì)上,WPS 鴻蒙版正式亮相。在亮相之前,WPS完成了大量的基礎(chǔ)設(shè)施工作,其中包括:超過4000萬代碼行跨平臺(tái)移植;跨平臺(tái)的交互界面兼容;在移植代碼的同時(shí),推動(dòng)第三方跨平臺(tái)基礎(chǔ)設(shè)施的建設(shè)。
金山辦公副總裁、研發(fā)中臺(tái)事業(yè)部總經(jīng)理姚冬日前接受《半月談》關(guān)于AI產(chǎn)業(yè)如何加快形成新質(zhì)生產(chǎn)力的主題調(diào)研訪談,以WPS的此次創(chuàng)新為出發(fā)點(diǎn),談到了圍繞新質(zhì)生產(chǎn)力,作為辦公AI產(chǎn)業(yè)領(lǐng)域代表的金山辦公,在合作、服務(wù)、供給端如何發(fā)力,為什么有定力,要怎么蓄力。
姚冬在2024華為開發(fā)者大會(huì)現(xiàn)場(chǎng)
合作端:合力探索辦公新質(zhì)生產(chǎn)力
更積極地合作,是現(xiàn)在許多中國(guó)企業(yè)在新質(zhì)生產(chǎn)力領(lǐng)域,合力探索的關(guān)鍵詞。
從規(guī)模上來看,金山辦公和華為鴻蒙的此次基于WPS鴻蒙版的合作,相當(dāng)于做了一次大體量的基礎(chǔ)設(shè)施建設(shè)。從實(shí)現(xiàn)速度上看,姚冬表示,“如果從拿到第一臺(tái)鴻蒙設(shè)備樣機(jī)那天算起,整個(gè)過程歷時(shí)八個(gè)月?!?/p>
他認(rèn)為這項(xiàng)合作的實(shí)現(xiàn)難度在于,面對(duì)鴻蒙這個(gè)全新的操作系統(tǒng),合作過程相當(dāng)于把軟件重新編寫一遍。令人欣喜的是,雙方的目標(biāo),放在國(guó)家層面、行業(yè)發(fā)展層面、企業(yè)對(duì)市場(chǎng)的預(yù)期層面來講,都高度一致。用姚冬的話說,“鴻蒙團(tuán)隊(duì)到金山辦公駐場(chǎng),有時(shí)候下班比我們還晚?!?/p>
合力換來了成果。目前,WPS鴻蒙原生應(yīng)用已在全端流暢運(yùn)行,WPS AI也在多端同步上線,數(shù)十項(xiàng)AI功能都遷移到了HarmonyOS NEXT。
WPS鴻蒙版,新增跨端調(diào)用、跨屏協(xié)同、墨跡批注等功能
這是新質(zhì)生產(chǎn)力在辦公領(lǐng)域的切實(shí)落地,而要發(fā)力實(shí)現(xiàn)這個(gè)和新質(zhì)生產(chǎn)力有關(guān)的目標(biāo),姚冬認(rèn)為,需要實(shí)打?qū)嵉墓こ棠芰Γ镁脼楣ψ鳛橹巍?/p>
事實(shí)上,金山辦公多次參與國(guó)家重大科技專項(xiàng)的“核高基”課題(核心電子器件、高端通用芯片及基礎(chǔ)軟件產(chǎn)品)項(xiàng)目。從2017年開始,姚冬在公司內(nèi)牽頭成立AI團(tuán)隊(duì),部分現(xiàn)在的AI創(chuàng)新,也和工程能力的歷史積累密不可分。
姚冬認(rèn)為,可以把AI分成三段鏈條:算法、模型、產(chǎn)品(服務(wù))。從算法到模型,如何做分布式計(jì)算、搭建萬卡集群等,大部分都是工程問題;再?gòu)哪P偷疆a(chǎn)品(服務(wù)),比如做推理框架、負(fù)載均衡、交互體驗(yàn)界面等,也要靠工程來實(shí)現(xiàn)。
他說,在整個(gè)AI鏈條當(dāng)中,從核心的科學(xué)算法到最后用戶能體驗(yàn)到的產(chǎn)品(服務(wù)),大部分是靠工程、研發(fā),這個(gè)問題解決不好,算法只能停留在論文階段。
金山辦公發(fā)布的2023年年報(bào)顯示,報(bào)告期內(nèi),公司研發(fā)人員共計(jì)3087人,占總員工數(shù)比例約68%。其中研發(fā)投入14.72億元,同比增長(zhǎng)10.60%,研發(fā)費(fèi)用率約32%。
這些都是金山辦公在AI創(chuàng)新時(shí)的定力。
服務(wù)端:對(duì)政企用戶效能的實(shí)際提升
在離政企用戶最近的辦公場(chǎng)景當(dāng)中,現(xiàn)在AI實(shí)際能發(fā)揮的效應(yīng)有多大?這也是本次調(diào)研訪談的重點(diǎn)之一。
據(jù)了解,經(jīng)過36年的發(fā)展,金山辦公的WPS 365服務(wù)的政企用戶已達(dá)1.7萬。其中包括華潤(rùn)數(shù)科、蒙牛集團(tuán)、通威股份等,行業(yè)覆蓋零售批發(fā)、服務(wù)、制造、建筑、運(yùn)輸、教育、住宿餐飲、軟件與信息技術(shù)服務(wù)等。
AI協(xié)同進(jìn)入辦公場(chǎng)景,對(duì)企業(yè)較為明顯的效能提升,是通過激活企業(yè)沉淀的數(shù)字資產(chǎn),使歷史數(shù)據(jù)發(fā)揮效應(yīng)。
僅舉一個(gè)例子,姚冬做了這樣一個(gè)簡(jiǎn)單計(jì)算:以一家千人規(guī)模的企業(yè)為例,假設(shè)一天產(chǎn)生約500篇文檔,一年的文檔量約18萬篇,十年就接近180萬篇。這些文檔沉淀下來,就是企業(yè)的數(shù)字資產(chǎn)。
他認(rèn)為,過去的文檔存儲(chǔ)解決的是“存放”的問題。但簡(jiǎn)單的關(guān)鍵詞搜索其實(shí)效率很低,比如有的文檔通篇沒有“簡(jiǎn)歷”兩個(gè)字,但確實(shí)是一份簡(jiǎn)歷;有文檔文件但找不到所需要的內(nèi)容,和文檔丟失其實(shí)不存在本質(zhì)區(qū)別。AI的導(dǎo)入,可以開始做到像人一樣去閱讀,用自然語(yǔ)義識(shí)別等手段,開發(fā)“企業(yè)大腦”去幫助解決這個(gè)問題,進(jìn)而進(jìn)行歸納、分析的進(jìn)一步輔助工作。
2024華為開發(fā)者大會(huì)現(xiàn)場(chǎng),姚冬展示產(chǎn)品戰(zhàn)略
目前,金山辦公聚焦三個(gè)方向的產(chǎn)品體驗(yàn),內(nèi)容創(chuàng)作(AIGC)、智慧助理(Copilot)知識(shí)洞察(Insight),在這個(gè)基礎(chǔ)上形成產(chǎn)品服務(wù)。
據(jù)了解,利用AI的能力改造產(chǎn)品,這也將是金山辦公未來幾年最核心的戰(zhàn)略,全力推進(jìn)辦公新質(zhì)生產(chǎn)力落地。
供給端:如何讓中文AI發(fā)展更長(zhǎng)遠(yuǎn)
從中長(zhǎng)期發(fā)展來考慮,中文AI要想加快形成新質(zhì)生產(chǎn)力,已經(jīng)面臨的挑戰(zhàn)和機(jī)會(huì)是什么?
以最新的一次AI“大考”來看,綜合媒體信息顯示,用國(guó)產(chǎn)大模型做高考卷,出現(xiàn)了“偏科”的現(xiàn)象,比如文科強(qiáng)、理科弱。但關(guān)于文科,閱卷老師表示,多數(shù)模型無法理解“本體”“喻體”“暗喻”等語(yǔ)文概念,寫作文不像寫作文,更像問答題。
談到提升中文AI的水平,姚冬認(rèn)為,加大在供給端的投入,釋放更多高質(zhì)量的中文語(yǔ)料用于模型訓(xùn)練,使中文AI更準(zhǔn)確,這樣有助于行業(yè)的持續(xù)創(chuàng)新,也對(duì)提升中文AI的全球影響力有深遠(yuǎn)影響。
姚冬解釋到,模型訓(xùn)練需要語(yǔ)料供應(yīng)(語(yǔ)料簡(jiǎn)單理解就是用于訓(xùn)練人工智能的文本庫(kù)或數(shù)據(jù)集合,所形成的語(yǔ)料庫(kù)是AI訓(xùn)練的基礎(chǔ)資源——編者注)?,F(xiàn)在全球范圍內(nèi),隨著算力規(guī)模的快速提升,用于模型訓(xùn)練的語(yǔ)料資源有短缺的趨勢(shì)。從中國(guó)來看,中文AI再往前走,可能遇到的挑戰(zhàn),是高質(zhì)量的中文語(yǔ)料供給缺乏。
中文AI的水庫(kù)里需要蓄力,持續(xù)加水。
綜合媒體報(bào)道信息稱,據(jù)國(guó)際數(shù)據(jù)公司(IDC)預(yù)測(cè),中國(guó)數(shù)據(jù)量規(guī)模將從2022年的23.88ZB增長(zhǎng)至2027年的76.6ZB,年均增長(zhǎng)速度CAGR達(dá)到26.3%。但目前中文優(yōu)質(zhì)數(shù)據(jù)仍然稀缺,如ChatGPT訓(xùn)練數(shù)據(jù)里,中文資料比重不足千分之一。
許多高質(zhì)量的中文語(yǔ)料沒有進(jìn)入交易環(huán)節(jié),也就不會(huì)用于中文AI的模型訓(xùn)練,因此,依托于中文AI的產(chǎn)品(服務(wù))也就會(huì)遇到發(fā)展受限的瓶頸。這是中文AI加快形成新質(zhì)生產(chǎn)力的現(xiàn)實(shí)挑戰(zhàn),也是創(chuàng)新數(shù)據(jù)要素交易模式,促進(jìn)數(shù)據(jù)要素和實(shí)體經(jīng)濟(jì)深度融合的機(jī)會(huì)。