中共中央宣傳部委托新華通訊社主辦

金山辦公在合作、服務(wù)、供給端的AI探索

2024-06-28 16:15
來(lái)源:半月談網(wǎng)

中國AI產(chǎn)業(yè)在加快形成新質(zhì)生產(chǎn)力過(guò)程中如何發(fā)力、定力、蓄力

金山辦公在合作、服務(wù)、供給端的AI探索

導讀:金山辦公副總裁、研發(fā)中臺事業(yè)部總經(jīng)理姚冬日前接受《半月談》關(guān)于A(yíng)I產(chǎn)業(yè)如何加快形成新質(zhì)生產(chǎn)力的主題調研訪(fǎng)談,以WPS的AI創(chuàng )新為出發(fā)點(diǎn),談到了圍繞新質(zhì)生產(chǎn)力,作為辦公AI產(chǎn)業(yè)領(lǐng)域代表的金山辦公,在合作、服務(wù)、供給端如何發(fā)力,為什么有定力,要怎么蓄力。

根據中共中央、國務(wù)院印發(fā)的《數字中國建設整體布局規劃》,2025年要基本形成橫向打通、縱向貫通、協(xié)調有力的一體化推進(jìn)格局,數字中國建設取得重要進(jìn)展,數字經(jīng)濟戰略地位不斷提升。

金山辦公(SH:688111)和華為鴻蒙近日達成的合作,正在成為中國企業(yè)將規劃進(jìn)行市場(chǎng)化落地的一部分。6月21日至23日,在2024華為開(kāi)發(fā)者大會(huì )上,WPS 鴻蒙版正式亮相。在亮相之前,WPS完成了大量的基礎設施工作,其中包括:超過(guò)4000萬(wàn)代碼行跨平臺移植;跨平臺的交互界面兼容;在移植代碼的同時(shí),推動(dòng)第三方跨平臺基礎設施的建設。

金山辦公副總裁、研發(fā)中臺事業(yè)部總經(jīng)理姚冬日前接受《半月談》關(guān)于A(yíng)I產(chǎn)業(yè)如何加快形成新質(zhì)生產(chǎn)力的主題調研訪(fǎng)談,以WPS的此次創(chuàng )新為出發(fā)點(diǎn),談到了圍繞新質(zhì)生產(chǎn)力,作為辦公AI產(chǎn)業(yè)領(lǐng)域代表的金山辦公,在合作、服務(wù)、供給端如何發(fā)力,為什么有定力,要怎么蓄力。

姚冬在2024華為開(kāi)發(fā)者大會(huì )現場(chǎng)

合作端:合力探索辦公新質(zhì)生產(chǎn)力

更積極地合作,是現在許多中國企業(yè)在新質(zhì)生產(chǎn)力領(lǐng)域,合力探索的關(guān)鍵詞。

從規模上來(lái)看,金山辦公和華為鴻蒙的此次基于WPS鴻蒙版的合作,相當于做了一次大體量的基礎設施建設。從實(shí)現速度上看,姚冬表示,“如果從拿到第一臺鴻蒙設備樣機那天算起,整個(gè)過(guò)程歷時(shí)八個(gè)月?!?/p>

他認為這項合作的實(shí)現難度在于,面對鴻蒙這個(gè)全新的操作系統,合作過(guò)程相當于把軟件重新編寫(xiě)一遍。令人欣喜的是,雙方的目標,放在國家層面、行業(yè)發(fā)展層面、企業(yè)對市場(chǎng)的預期層面來(lái)講,都高度一致。用姚冬的話(huà)說(shuō),“鴻蒙團隊到金山辦公駐場(chǎng),有時(shí)候下班比我們還晚?!?/p>

合力換來(lái)了成果。目前,WPS鴻蒙原生應用已在全端流暢運行,WPS AI也在多端同步上線(xiàn),數十項AI功能都遷移到了HarmonyOS NEXT。

WPS鴻蒙版,新增跨端調用、跨屏協(xié)同、墨跡批注等功能

這是新質(zhì)生產(chǎn)力在辦公領(lǐng)域的切實(shí)落地,而要發(fā)力實(shí)現這個(gè)和新質(zhì)生產(chǎn)力有關(guān)的目標,姚冬認為,需要實(shí)打實(shí)的工程能力,久久為功作為支撐。

事實(shí)上,金山辦公多次參與國家重大科技專(zhuān)項的“核高基”課題(核心電子器件、高端通用芯片及基礎軟件產(chǎn)品)項目。從2017年開(kāi)始,姚冬在公司內牽頭成立AI團隊,部分現在的AI創(chuàng )新,也和工程能力的歷史積累密不可分。

姚冬認為,可以把AI分成三段鏈條:算法、模型、產(chǎn)品(服務(wù))。從算法到模型,如何做分布式計算、搭建萬(wàn)卡集群等,大部分都是工程問(wèn)題;再從模型到產(chǎn)品(服務(wù)),比如做推理框架、負載均衡、交互體驗界面等,也要靠工程來(lái)實(shí)現。

他說(shuō),在整個(gè)AI鏈條當中,從核心的科學(xué)算法到最后用戶(hù)能體驗到的產(chǎn)品(服務(wù)),大部分是靠工程、研發(fā),這個(gè)問(wèn)題解決不好,算法只能停留在論文階段。

金山辦公發(fā)布的2023年年報顯示,報告期內,公司研發(fā)人員共計3087人,占總員工數比例約68%。其中研發(fā)投入14.72億元,同比增長(cháng)10.60%,研發(fā)費用率約32%。

這些都是金山辦公在A(yíng)I創(chuàng )新時(shí)的定力。

服務(wù)端:對政企用戶(hù)效能的實(shí)際提升

在離政企用戶(hù)最近的辦公場(chǎng)景當中,現在A(yíng)I實(shí)際能發(fā)揮的效應有多大?這也是本次調研訪(fǎng)談的重點(diǎn)之一。

據了解,經(jīng)過(guò)36年的發(fā)展,金山辦公的WPS 365服務(wù)的政企用戶(hù)已達1.7萬(wàn)。其中包括華潤數科、蒙牛集團、通威股份等,行業(yè)覆蓋零售批發(fā)、服務(wù)、制造、建筑、運輸、教育、住宿餐飲、軟件與信息技術(shù)服務(wù)等。

AI協(xié)同進(jìn)入辦公場(chǎng)景,對企業(yè)較為明顯的效能提升,是通過(guò)激活企業(yè)沉淀的數字資產(chǎn),使歷史數據發(fā)揮效應。

僅舉一個(gè)例子,姚冬做了這樣一個(gè)簡(jiǎn)單計算:以一家千人規模的企業(yè)為例,假設一天產(chǎn)生約500篇文檔,一年的文檔量約18萬(wàn)篇,十年就接近180萬(wàn)篇。這些文檔沉淀下來(lái),就是企業(yè)的數字資產(chǎn)。

他認為,過(guò)去的文檔存儲解決的是“存放”的問(wèn)題。但簡(jiǎn)單的關(guān)鍵詞搜索其實(shí)效率很低,比如有的文檔通篇沒(méi)有“簡(jiǎn)歷”兩個(gè)字,但確實(shí)是一份簡(jiǎn)歷;有文檔文件但找不到所需要的內容,和文檔丟失其實(shí)不存在本質(zhì)區別。AI的導入,可以開(kāi)始做到像人一樣去閱讀,用自然語(yǔ)義識別等手段,開(kāi)發(fā)“企業(yè)大腦”去幫助解決這個(gè)問(wèn)題,進(jìn)而進(jìn)行歸納、分析的進(jìn)一步輔助工作。

2024華為開(kāi)發(fā)者大會(huì )現場(chǎng),姚冬展示產(chǎn)品戰略

目前,金山辦公聚焦三個(gè)方向的產(chǎn)品體驗,內容創(chuàng )作(AIGC)、智慧助理(Copilot)知識洞察(Insight),在這個(gè)基礎上形成產(chǎn)品服務(wù)。

據了解,利用AI的能力改造產(chǎn)品,這也將是金山辦公未來(lái)幾年最核心的戰略,全力推進(jìn)辦公新質(zhì)生產(chǎn)力落地。

供給端:如何讓中文AI發(fā)展更長(cháng)遠

從中長(cháng)期發(fā)展來(lái)考慮,中文AI要想加快形成新質(zhì)生產(chǎn)力,已經(jīng)面臨的挑戰和機會(huì )是什么?

以最新的一次AI“大考”來(lái)看,綜合媒體信息顯示,用國產(chǎn)大模型做高考卷,出現了“偏科”的現象,比如文科強、理科弱。但關(guān)于文科,閱卷老師表示,多數模型無(wú)法理解“本體”“喻體”“暗喻”等語(yǔ)文概念,寫(xiě)作文不像寫(xiě)作文,更像問(wèn)答題。

談到提升中文AI的水平,姚冬認為,加大在供給端的投入,釋放更多高質(zhì)量的中文語(yǔ)料用于模型訓練,使中文AI更準確,這樣有助于行業(yè)的持續創(chuàng )新,也對提升中文AI的全球影響力有深遠影響。

姚冬解釋到,模型訓練需要語(yǔ)料供應(語(yǔ)料簡(jiǎn)單理解就是用于訓練人工智能的文本庫或數據集合,所形成的語(yǔ)料庫是AI訓練的基礎資源——編者注)?,F在全球范圍內,隨著(zhù)算力規模的快速提升,用于模型訓練的語(yǔ)料資源有短缺的趨勢。從中國來(lái)看,中文AI再往前走,可能遇到的挑戰,是高質(zhì)量的中文語(yǔ)料供給缺乏。

中文AI的水庫里需要蓄力,持續加水。

綜合媒體報道信息稱(chēng),據國際數據公司(IDC)預測,中國數據量規模將從2022年的23.88ZB增長(cháng)至2027年的76.6ZB,年均增長(cháng)速度CAGR達到26.3%。但目前中文優(yōu)質(zhì)數據仍然稀缺,如ChatGPT訓練數據里,中文資料比重不足千分之一。

許多高質(zhì)量的中文語(yǔ)料沒(méi)有進(jìn)入交易環(huán)節,也就不會(huì )用于中文AI的模型訓練,因此,依托于中文AI的產(chǎn)品(服務(wù))也就會(huì )遇到發(fā)展受限的瓶頸。這是中文AI加快形成新質(zhì)生產(chǎn)力的現實(shí)挑戰,也是創(chuàng )新數據要素交易模式,促進(jìn)數據要素和實(shí)體經(jīng)濟深度融合的機會(huì )。

責任編輯:王靜

熱門(mén)推薦