從論文到,一鍵生成!從此報告不用愁!
文 | 子龍
編 | 小軼
俗話說:“行百步者半九十”,論文接受固然可喜可賀,然而這只是萬里長征第一步。一份具有影響力的工作少不了一個后期的宣傳,做好一個PPT絕對是一個技術(shù)活。不知道小伙伴們平時怎么做PPT,是復(fù)制粘貼長篇大論抑或提綱挈領(lǐng)圖文并茂。直接拷貝論文固然簡單,但是動輒大半頁的文字實在很難讓人提起興趣,大家都明白應(yīng)該抓住要點,并輔以圖片,但是怎么總結(jié)文章各個板塊并且合理排布呢,這又是個難題。
雖然論文千變?nèi)f化,但是計算機論文的PPT往往還是比較樸實無華的,往往遵循一定的格式,從介紹到模型,再從實驗到結(jié)論,基本上和行文對應(yīng),那么對每個板塊抽取核心信息,那么就能生成一份滿意的PPT。
今天介紹一篇'21的文章 D2S: -to- Via - Text 直接省去了苦思PPT細節(jié)的麻煩,提出一個基于問答抽取的方法,通過論文內(nèi)容和給定標(biāo)題直接生成對應(yīng)的PPT。下圖就展示了一個用D2S自動生成的論文介紹PPT樣例。上方黑框中的是論文作者自己做的PPT,下面藍框里的是D2S自動生成的。可以看到,文字介紹部分還是十分合理的,與配圖對應(yīng),整體排版上還要優(yōu)于人工制作的PPT。
論文題目:
D2S: -to- Via - Text
論文鏈接:
方法
本文將D2S(文檔生成PPT)視為一個封閉領(lǐng)域長文本問答,即限定在計算機論文的領(lǐng)域中,給定論文和每頁PPT的標(biāo)題,從論文中抽取對應(yīng)內(nèi)容并加以總結(jié),作為標(biāo)題的“答案”。整個模型分為三個模塊,分別是:
關(guān)鍵詞模塊
論文的PPT肯定要參考原本論文,從一篇論文的各個版塊的標(biāo)題那里,可以大致看出一篇文章所關(guān)注的要點和行文思路,這些標(biāo)題可能是最基本的“介紹”、“相關(guān)文獻”、“實驗”,也可能是論文所設(shè)計的模塊的名稱,比如 is all you need論文中,就有專門介紹的一個部分。這些標(biāo)題和子標(biāo)題很自然的就形成了一個樹狀結(jié)構(gòu)(模型圖左下角),這些樹狀結(jié)構(gòu)中的節(jié)點被提取出來,作為關(guān)鍵詞,輔助后續(xù)的內(nèi)容生成。
信息抽取模塊
關(guān)鍵詞模塊只是為了后續(xù)工作提供了一定的幫助,而信息抽取模塊才真正開始處理論文和PPT標(biāo)題。本文采用了基于 BERT[1]的信息抽取模型。信息抽取模型可以根據(jù)相關(guān)程度在若干候選中給出一個排序,這個模塊就是為了從論文中找到和對應(yīng)PPT標(biāo)題相關(guān)的片段。
訓(xùn)練模型
既然需要模型學(xué)習(xí)相關(guān)性,最容易想到的方法就是通過人工標(biāo)注進行有監(jiān)督學(xué)習(xí),然而很難從最終完成的PPT中看出當(dāng)前頁面與論文中哪些地方相關(guān),于是本文選擇了一個折中的方法來訓(xùn)練信息抽取模型,它將當(dāng)前PPT頁面中的內(nèi)容作為正例,將其他PPT頁面中的內(nèi)容作為反例,訓(xùn)練模型辨別這兩者的區(qū)別,進而學(xué)習(xí)PPT標(biāo)題和內(nèi)容的相關(guān)性,所學(xué)習(xí)得到的相關(guān)性可以后續(xù)用于評估PPT標(biāo)題和論文片段的相關(guān)性。
抽取片段
因為PPT頁面中的內(nèi)容和論文片段十分相似,于是通過上述方法訓(xùn)練的模型可以很好的運用于評估PPT標(biāo)題和論文片段的相關(guān)性。同時,每個論文片段同時又擁有對應(yīng)的標(biāo)題或者子標(biāo)題,即關(guān)鍵詞模塊提取到的關(guān)鍵詞,最終每個論文片段與當(dāng)前PPT標(biāo)題的相關(guān)性取決于兩方面:
其中、、分別為PPT標(biāo)題、論文片段、片段對應(yīng)關(guān)鍵詞的文本特征。
問答模塊
最終每頁PPT中的內(nèi)容由問答模塊來生成,這里采用的是預(yù)訓(xùn)練的BART模型[2]。我們需要將“問題”和“上下文信息”提供給問答模型,這里的“問題”即每頁PPT的標(biāo)題,上下文信息分為兩方面:
其中a,b為兩個字符串,d為兩者的編輯距離。
將整合好的“問題”和“上下文”以如下格式輸入到預(yù)訓(xùn)練的BART,得到對應(yīng)PPT的內(nèi)容:
圖表抽取模塊
沒有插圖的PPT是不完整的,D2S對圖片的處理非常簡單,直接利用信息抽取模塊中訓(xùn)練得到的模型評估PPT標(biāo)題和圖片或者表格的描述文字計算相關(guān)性,進而插入到對應(yīng)PPT頁面內(nèi)。
模型表現(xiàn)
本文主要評估生成PPT的兩個方面:
PPT內(nèi)容生成效果
因為這個任務(wù)的本質(zhì)是信息抽取與總結(jié),本文對比了D2S的問答模塊(記為)與如下:、(本文模型去除部分)。
同時,本文還將信息抽取模塊中的混合的方法(-Mix IR)和傳統(tǒng)的基于離散單詞對應(yīng)的BM25( IR)做對比。結(jié)果如下:
從結(jié)果中可以看到結(jié)合關(guān)鍵詞的方法往往能夠得到更好的效果。在信息抽取階段引入關(guān)鍵詞,可以更好地評估PPT標(biāo)題和論文片段的相關(guān)性,進而得到更加準(zhǔn)確的上下文,這一點從各個的結(jié)果中都可以看出。在問答模塊階段,與以往單純將論文片段作為上下文,D2S中的將關(guān)鍵詞同樣輸入到上下文部分,也大大地提高了值。
可見,論文中的標(biāo)題和子標(biāo)題是一篇文章的骨架,很大程度上可以幫助針對論文內(nèi)容的總結(jié)歸納工作,進而在生成PPT的任務(wù)中大有作為。
總結(jié)
本文由諸多模塊組成,利用了信息抽取和問答模型對計算機領(lǐng)域的論文進行總結(jié),并創(chuàng)造性的提出了生成PPT這樣的任務(wù),同時利用了論文各個版塊的標(biāo)題和子標(biāo)題提供更多的信息。