閱讀率與人工稿件基本持平 機(jī)器寫作正逐漸被接受

    2019-12-10 11:14 | 來源:科技日?qǐng)?bào) | 作者:未知 | [科技] 字號(hào)變大| 字號(hào)變小


    ?????近幾年,機(jī)器寫作不再是紙上談兵的技術(shù),已然滲透到了我們的生活之中。今日頭條、騰訊、百度、360等公司,以及新華社、南方都市報(bào)、第一財(cái)經(jīng)等傳統(tǒng)媒體單位均開展了機(jī)器寫作技術(shù)的研究與應(yīng)用。

    ????????近幾年,機(jī)器寫作不再是紙上談兵的技術(shù),已然滲透到了我們的生活之中。今日頭條、騰訊、百度、360等公司,以及新華社、南方都市報(bào)、第一財(cái)經(jīng)等傳統(tǒng)媒體單位均開展了機(jī)器寫作技術(shù)的研究與應(yīng)用。

    ????????不久前,在北京大學(xué)科技成果發(fā)布會(huì)暨北京市科技成果轉(zhuǎn)化統(tǒng)籌協(xié)調(diào)與服務(wù)平臺(tái)系列項(xiàng)目路演中,北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)研究所研究員萬小軍的AI寫作機(jī)器人頗受關(guān)注。

    ????????據(jù)介紹,這項(xiàng)成果已應(yīng)用于多家媒體單位,研發(fā)單位與各媒體單位合作推出了小明、小南、小柯等多款寫作機(jī)器人,各類機(jī)器人已經(jīng)自動(dòng)撰寫新聞稿件十萬多篇。

    ????????除了新聞寫作,還能應(yīng)用于這些領(lǐng)域

    ????????機(jī)器寫作,又稱自然語言生成,是自然語言處理領(lǐng)域的重要研究方向和研究熱點(diǎn)之一, 也是人工智能走向成熟的重要標(biāo)志之一。

    ????????目前,機(jī)器寫作在傳媒、出版、文娛、廣告等多個(gè)行業(yè)均具有廣闊應(yīng)用場(chǎng)景。歐美等地較早成立專注于機(jī)器寫作技術(shù)應(yīng)用的多家公司,例如ARRIA、AI、NarrativeScience等基于行業(yè)數(shù)據(jù),通過機(jī)器寫作生成行業(yè)報(bào)告或新聞報(bào)道,從而節(jié)省大量人力。同時(shí),不少國(guó)外知名媒體單位紛紛采用機(jī)器寫作技術(shù)進(jìn)行新聞稿件創(chuàng)作,以節(jié)約人力成本,提高效率。

    ????????“與人類作者相比,機(jī)器寫作具有效率高、時(shí)效性好、覆蓋性強(qiáng)、無偏見等優(yōu)勢(shì)。今日頭條的線上測(cè)試表明,機(jī)器人撰寫新聞稿件的閱讀率與人工稿件的閱讀率基本相同,這說明機(jī)器稿件的質(zhì)量不錯(cuò),能夠被廣大用戶所接受。”萬小軍告訴記者。

    ????????萬小軍說,我們希望計(jì)算機(jī)同時(shí)具有讀與寫的能力,除了掌握閱讀和理解語言文字的本領(lǐng)之外,還能夠掌握文字創(chuàng)作的本領(lǐng),從而像人類一樣寫出高質(zhì)量的文字作品,例如新聞資訊、報(bào)告、詩歌、小說、作文等。

    ????????然而,計(jì)算機(jī)不能憑空寫作,必須根據(jù)所輸入的數(shù)據(jù)與素材進(jìn)行創(chuàng)作。據(jù)介紹,根據(jù)輸入的不同類型的信息,計(jì)算機(jī)一般采用不同的寫作方式進(jìn)行創(chuàng)作。例如,計(jì)算機(jī)根據(jù)輸入的結(jié)構(gòu)化數(shù)據(jù)(報(bào)表、RDF數(shù)據(jù)等)進(jìn)行文字創(chuàng)作,從而能夠生成稿件。這是目前機(jī)器寫作應(yīng)用的主要方式,適用于天氣預(yù)報(bào)、醫(yī)療報(bào)告、賽事簡(jiǎn)訊、財(cái)經(jīng)報(bào)道等文本的生成。

    ????????萬小軍介紹說,近幾年機(jī)器寫作除了用于撰寫新聞、報(bào)告等實(shí)用型文本之外,還被用于創(chuàng)作古詩、現(xiàn)代詩、散文等文學(xué)作品,例如微軟小冰、清華九歌等系統(tǒng)分別能夠創(chuàng)作現(xiàn)代詩和古詩,在文字表現(xiàn)形式上的總體效果還不錯(cuò),但在意境上有所欠缺。

    ????????深度學(xué)習(xí)生成模型,但還難保準(zhǔn)確性和可讀性

    ????????近幾年,深度學(xué)習(xí)發(fā)展迅速,機(jī)器寫作技術(shù)也受到其深刻影響。

    ????????據(jù)萬小軍介紹,基于深度學(xué)習(xí)技術(shù)進(jìn)行文本生成,不依賴于模板或規(guī)則。然而,這樣的寫作方式雖然在研究上取得一定進(jìn)展,但目前還不能保證所生成稿件的準(zhǔn)確性與可讀性,難以滿足很多應(yīng)用場(chǎng)景下對(duì)稿件的質(zhì)量要求。此外,深度學(xué)習(xí)生成的模型訓(xùn)練需要大量的平行語料,而在很多領(lǐng)域內(nèi)較難獲取到這樣的大規(guī)模語料。

    ????????計(jì)算機(jī)根據(jù)已有的文字素材(例如已經(jīng)發(fā)表的新聞)進(jìn)行二次文字創(chuàng)作時(shí),能夠基于已有稿件創(chuàng)作出不一樣的稿件,主要依賴于兩類自然語言處理技術(shù):自動(dòng)文摘與文本復(fù)述。其中自動(dòng)文摘用于對(duì)單篇文本或多篇文本進(jìn)行內(nèi)容提煉與綜合,形成摘要或綜述。

    ????????萬小軍指出,多文檔自動(dòng)文摘比單文檔自動(dòng)文摘更具有挑戰(zhàn)性,原因在于不同文檔內(nèi)容的冗余性、片面性與弱連貫性。因此,對(duì)多篇新聞報(bào)道進(jìn)行長(zhǎng)篇綜述生成極其困難,其研究團(tuán)隊(duì)在這方面進(jìn)行了嘗試,提出基于段落排序與融合的方法為多篇新聞報(bào)道進(jìn)行綜述生成,取得一定效果。

    ????????文本復(fù)述則用于對(duì)現(xiàn)有文字進(jìn)行改寫,在主題與意思基本不變的前提下產(chǎn)生另一種文字表述,從而避免原文照抄,也可實(shí)現(xiàn)文本風(fēng)格化的目的。文本復(fù)述可以看作是一種單語言機(jī)器翻譯問題,因此在平行語料充足的前提下,各種統(tǒng)計(jì)機(jī)器翻譯方法(包括神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯)均可應(yīng)用于此問題。但現(xiàn)實(shí)中卻難以獲得大規(guī)模的此類平行語料,因此針對(duì)文本復(fù)述的研究需要另辟蹊徑,最新的研究主要集中在如何有效利用少量的平行語料和大規(guī)模的非平行語料進(jìn)行復(fù)述模型的學(xué)習(xí)。

    電鰻快報(bào)


    1.本站遵循行業(yè)規(guī)范,任何轉(zhuǎn)載的稿件都會(huì)明確標(biāo)注作者和來源;2.本站的原創(chuàng)文章,請(qǐng)轉(zhuǎn)載時(shí)務(wù)必注明文章作者和來源,不尊重原創(chuàng)的行為我們將追究責(zé)任;3.作者投稿可能會(huì)經(jīng)我們編輯修改或補(bǔ)充。

    相關(guān)新聞

    信息產(chǎn)業(yè)部備案/許可證編號(hào): 京ICP備17002173號(hào)-2  電鰻快報(bào)2013-2020 www.www.cqjiade.com

      

    電話咨詢

    關(guān)于電鰻快報(bào)

    關(guān)注我們

    亚洲精品高清国产一线久久| 国产成人精品午夜福麻豆| 99R在线精品视频在线播放| 99久久亚洲综合精品成人| 久久丝袜精品中文字幕| 亚洲国产美女精品久久久久∴| 999在线视频精品免费播放观看| 91精品国产91久久| 欧美精品黑人粗大欧| 无码国产精品一区二区免费模式| 国产精品对白刺激久久久| 国产精品内射视频免费| 亚洲精品无码午夜福利中文字幕| 国产成人久久精品一区二区三区 | 免费观看大片bbb| 97久久超碰国产精品旧版| 国产啪亚洲国产精品无码| 色影音先锋色资源网站| 久久99精品国产一区二区三区| 午夜福利麻豆国产精品| 97精品国产福利一区二区三区 | 亚洲无码精品浪潮| 国产精品兄妹在线观看麻豆| 国产午夜福利精品久久| 亚洲av永久无码精品秋霞电影影院| 麻豆精品不卡国产免费看| 欧美 日韩 精品 另类视频| 精品人妻无码一区二区色欲产成人 | 99re这里只有精品6| 欧美精品色婷婷五月综合| 国产精品免费无遮挡无码永久视频 | 国产69精品久久久久9999| 欧美影院在线观看| 一区二区三区四区精品视频| 好紧好爽太大了h视频| 911亚洲精品不卡| 无码国内精品久久人妻| 国产精品一香蕉国产线看观看| 久久精品毛片免费观看| 久久久久国产成人精品亚洲午夜| 国产精品网站在线观看免费传媒|