(資料圖片)
人民網(wǎng)上海7月 7日電 (記者唐小麗)今天下午,正值2023世界人工智能大會(huì)舉辦期間,由語言智能科技企業(yè)蜜度主辦的“語言智能與內(nèi)容生成高峰論壇”在上海世博展覽館舉行。論壇現(xiàn)場,蜜度發(fā)布了自研的國內(nèi)首個(gè)專為智能校對(duì)領(lǐng)域打造的垂直大語言模型——蜜度文修。
蜜度文修正式發(fā)布。蜜度供圖
“‘唐宋八大家’之一的歐陽修曾任館閣???,校對(duì),亦有修文之意,文修便取名于此。”蜜度智能校對(duì)事業(yè)部總經(jīng)理張曉娟一語道出了名字的由來。
張曉娟介紹,蜜度文修以大語言模型為技術(shù)底座,通過運(yùn)用高質(zhì)量數(shù)據(jù)學(xué)習(xí)多種特色子任務(wù),可以大幅度提升中文校對(duì)和潤色能力的智能化程度?!熬劢剐侣劤霭?、媒體稿件、政府公文等專業(yè)領(lǐng)域,蜜度文修能夠輔助專業(yè)用戶提高校對(duì)質(zhì)量、提升校對(duì)速度、降低差錯(cuò)率,為新時(shí)代語言文字工作高質(zhì)量發(fā)展賦能?!?/p>
早在2020年,蜜度就推出了智能文本檢測服務(wù),并以深度學(xué)習(xí)模型為方向,嘗試智能化解決基礎(chǔ)校對(duì)問題。蜜度還成立了多語言校對(duì)檢測實(shí)驗(yàn)室,圍繞“文字標(biāo)點(diǎn)差錯(cuò)”“知識(shí)性差錯(cuò)”“內(nèi)容導(dǎo)向風(fēng)險(xiǎn)識(shí)別”三個(gè)主要能力開展建設(shè)。在去年的世界人工智能大會(huì)上,蜜度發(fā)布了支持本地化部署的蜜度校對(duì)通AI-Box,這也是首個(gè)通過華為昇騰AI生態(tài)認(rèn)證的自然語言處理智能文本校對(duì)應(yīng)用解決方案。今年年初,蜜度智能校對(duì)系統(tǒng)成功入選國家新聞出版署2022年出版業(yè)科技與示范創(chuàng)新項(xiàng)目“科技創(chuàng)新成果”。
今年4月,蜜度智能校對(duì)多語言版正式上線,除了漢字、英文之外,還覆蓋了蒙古文、藏文、維吾爾文、朝鮮文等12種少數(shù)民族語言文字。6月,蜜度正式推出中文潤色服務(wù),重點(diǎn)解決用詞不當(dāng)、句式雜糅等措辭與表述問題。
而今天,在世界人工智能大會(huì)的現(xiàn)場,蜜度推出全新的蜜度文修,讓大模型時(shí)代的全新工作范式走入校對(duì)場景,除了刷新多類校對(duì)任務(wù)的最佳效果之外,完善了過去較為薄弱的易混詞細(xì)微語義辨析難題,同時(shí)在尊重原意表達(dá)的基礎(chǔ)上,更好地修正句式雜糅、邏輯錯(cuò)亂等問題,使句子表達(dá)更流暢,實(shí)現(xiàn)對(duì)句子的潤色功能。蜜度文修的發(fā)布,可以視為蜜度在大模型時(shí)代,采用與時(shí)俱進(jìn)的前沿科技積極賦能垂直辦公場景的一次實(shí)踐。
關(guān)于全新發(fā)布的蜜度文修,張曉娟認(rèn)為,創(chuàng)新點(diǎn)主要集中在兩個(gè)方面:一是引入多任務(wù)學(xué)習(xí)策略提升校對(duì)能力,設(shè)計(jì)了與校對(duì)任務(wù)密切相關(guān)的多種子任務(wù),讓模型進(jìn)行自監(jiān)督學(xué)習(xí),通過做關(guān)聯(lián)任務(wù)提升校對(duì)的智能化程度;其次,大幅度提升模型學(xué)習(xí)的數(shù)據(jù)質(zhì)量,引入自動(dòng)化手段對(duì)大規(guī)模數(shù)據(jù)進(jìn)行質(zhì)量評(píng)估,解決噪音數(shù)據(jù)對(duì)校對(duì)任務(wù)影響更為敏感的問題。
“其實(shí),蜜度的產(chǎn)品一直深度活躍在各類辦公和業(yè)務(wù)發(fā)展場景里?!泵鄱仁紫夹g(shù)官劉益東談到,在前大模型時(shí)代,蜜度就用當(dāng)時(shí)的新銳計(jì)算機(jī)技術(shù)幫助用戶實(shí)現(xiàn)辦公場景的數(shù)字化、智能化轉(zhuǎn)型升級(jí),“現(xiàn)在,大模型讓我們的產(chǎn)品和服務(wù)更為強(qiáng)大,我們從客戶那里感知到的是,經(jīng)由AI大幅度提升的效率和精準(zhǔn)度,不僅讓用戶體驗(yàn)更好,也讓業(yè)務(wù)增速更快。”