固然 NLP 最早的論文出如今 1952 年 , 可是其論文數目至 2000 年才開端遲緩增加,從 2000 年至 2017 年豪情漫筆故事,NLP 的研討數目增長了四倍,而在接下來的五年中豪情漫筆故事,NLP 的研討數目又翻了一番 , 這表白這五年 NLP 范疇獲得了爆炸式的開展,而按照作者構建的論文范疇分類集,作者研討了 NLP 中最受歡送的研討范疇(Fos)的開展與變革狀況:
經由過程這套分類法,作者利用半野生半主動的標注方法構建了一個包羅 178521 篇論文范疇標注的鍛煉集,而且鍛煉獲得了一個

固然 NLP 最早的論文出如今 1952 年 , 可是其論文數目至 2000 年才開端遲緩增加,從 2000 年至 2017 年豪情漫筆故事,NLP 的研討數目增長了四倍 , 而在接下來的五年中豪情漫筆故事,NLP 的研討數目又翻了一番,這表白這五年 NLP 范疇獲得了爆炸式的開展,而按照作者構建的論文范疇分類集 , 作者研討了 NLP 中最受歡送的研討范疇(Fos)的開展與變革狀況:
經由過程這套分類法,作者利用半野生半主動的標注方法構建了一個包羅 178521 篇論文范疇標注的鍛煉集,而且鍛煉獲得了一個弱監視的論文范疇分類器,經由過程此分類器,作者分類獲得了 1952 年至 2022 年 ACL Anthology 中包羅的一切總計 74279 篇論文作為終極的闡發研討工具 。
雖然當下伴跟著大模子的橫空出生避世,仿佛很多 NLP 成績都一夜之間釀成了曾經被處理的成績,這篇文章很應時宜的指出 , 伴跟著 NLP 利用模子愈來愈大,模子參數目直逼天文數字,與之伴生的計較本錢成績、情況成績和倫理成績有能夠成為將來 NLP 研討的支流 。
能夠看到機械翻譯與言語模子是 NLP 文獻中最受歡送的研討范疇 , 可是這兩個范疇的開展變革有著非常較著的區分,機械翻譯是一個顛末深化研討情感文本,曾經被成立了很多年的研討論文,發文數目和增加率都相對安穩,而言語模子固然也顛末了長工夫的研討,可是其出書數目直到 2018 年才開端明顯增加,在存眷其他 NLP 的范疇時也能夠看到相似的狀況,暗示進修與文天職類固然研討普遍 , 可是增加率沒有明顯變革,而對話體系和低資本 NLP 則在近期得到了十分高的增加率 。
【情感文案背景圖感情短文故事】而可注釋性 NLP,多模子和天然言語交互等范疇正處于快速開展期 , 在將來的研討中很有能夠開端加快,而作為明星產物的綠色 NLP 正值當打之年,將來能夠會迎來發作 。
而明天引見的這篇由德國慕尼黑產業大學出品的論文,便對近來 20 年 NLP 研討范疇停止了一個細致體系的分類與綜述,協助各人站在一個天主視角,概覽 NLP 360 度的全景圖 。作者期望經由過程如許的事情,能夠協助任何一個 NLP 范疇的學者、從業者、理論者和初學者辨認 NLP 的研討趨向,協助研討社區補償現有的空缺,以更好的探究 NLP 中的各類研討范疇 。
起首,作者接納矩陣式的方法繪制了從 2018 年到 2022 年 NLP 相干的各個 FoS 的文章數目-增加率矩陣,增加率高且整體文章數目的較多的研討范疇屬于 NLP 中的“明星”產物,能夠看到,占有 NLP 舞臺中間的范疇包羅言語模子感情案牘布景圖、可注釋性 NLP、低資本 NLP等,而相似機械翻譯、文天職類與暗示進修則因為其高的文章數目與低的增加率成了 NLP 研討的根底,值得存眷的另有一部門連結高增加率與低文章數目的研討范疇 , 好比段落檢索、氣勢派頭轉換、代碼天生等豪情漫筆故事,這些研討范疇固然近期熱度高漲,可是因為文章數目較少沒法獲得較著的進一步開展趨向的判定 。
而全部 NLP 的研討范疇中,也呈現了典范的二八法例,大大都 NLP 范疇的研討水平明顯低于這些最受歡送的 NLP 范疇的研討水平豪情漫筆故事 , 仿佛 NLP 研討的開展次要來自于熱點范疇與使用的驅動感情案牘布景圖,可是整體而言 , NLP 一切范疇的研討都在連結正向增加 。
所謂知古方能鑒今,按照全部 NLP 范疇的研討開展,作者又探求了 NLP 各個范疇的研討趨向并探究了 NLP 范疇將來的開展標的目的:
要說 NLP 的子范疇,隨口一提就可以夠想到很多,從機械翻譯到感情闡發,從信息檢索到文本天生,可是要以一套構造化的系統完好的概述 NLP 范疇的分類法,能夠就并非一件那末輕松的事情 。
而論文作者在參考 ACL、EMNLP、COLING 和 IJCNLP 等 NLP 范疇次要集會網站上列出的近來幾年的投稿主題 , 和 ACL Anthology 中包羅的鉆研會的主題,及 EMNLP 2022 中 828篇論文的研討范疇,構建了第一版的 NLP 范疇分類法 , 同時為了盡能夠片面完好的構建 NLP 研討范疇的各個方面,作者又與 NLP 差別范疇的專家停止了 20 余次一對一的訪談,按照訪談成果和對第一版分類的訂正與完美,作者構建了如許一套 NLP 研討范疇分類法以下圖所示:
作為了解、天生與處置天然言語這一人類糊口、交換的中心東西與信息同享的主要載體,計較言語學家早在上世紀五十年月就從“計較”的視角開端存眷利用“機械”對天然言語停止處置 。而伴跟著各類手藝的逐漸成熟,NLP 這一范疇興旺開展欣欣茂發 , 以 ACL 收錄為例,從 1952 年至今感情案牘布景圖,曾經揭曉了超越 80000 論文:
伴跟著一個范疇的快速開展 , 能夠宏觀的全景的對一個范疇有一個片面的了解是一件相稱艱難的事,而這篇經由過程搜集、分類與判定以顯現范疇構造化概述的事情能夠對我們愈加明白的理解我們身處的這個范疇會十分有協助吧!
伴跟著出書物的增長感情案牘布景圖,NLP 范疇也開展成了具有多個差別分支 , 由差別子范疇子學科配合組成的大范疇大學科,已往能夠有很多綜述 NLP 汗青,梳理 NLP 開展頭緒的文章、綜述 , 可是很遺憾很少有從一個空間的角度對 NLP 普遍放開的范疇停止概述的研討情感文本情感文本 。
操縱立異分散實際,作者繪制了 NLP 研討范疇的創重生命周期圖如上圖所示,從上圖能夠看出 , 語析范疇曾經根本步入了落日,靠近創重生命周期的式微期,而機械翻譯、暗示進修與文本闡發團體固然都比力受歡送 , 可是其曾經過了創重生命周期從成熟到式微的拐點情感文本,開展速率今朝正在減緩 。
猜你喜歡
- 感情里的細節重要嗎情感問答100題
- 感覺不到情感的病積極情感體驗
- 情感和感情是什么意思情感美文無版權情感有哪些方面
- 打動人心的情感故事情感分享情感小故事及感悟簡短
- 情感小說驛站情感漠視是什么意思
- 情感冷漠情感百度百科情感知識圖譜構建
- 女性情感話題十大網站情感解離
- 神印王座故事背景及職業簡介 動漫神印王座簡介概述
- 免費家庭情感導師咨詢100個情感問題理智與情感英文原文
- 常見的情感體驗有哪些情感的八大種類婚姻情感文案長篇
