免费久久国产&夜夜毛片&亚洲最大无码中文字幕&国产成人无码免费视频之奶水&吴家丽查理三级做爰&国产日本亚欧在线观看

當前位置： OFweek 人工智能網 > 自然語言處理 > 正文

什么是文本摘要？為什么要有注意力機制？

2020-08-27 09:34

深度學習視覺

推理部分

下圖是整個Encoder－Decode的結構。通過上面的理解，我覺得這個圖非常清晰。

什么是文本摘要？為什么要有注意力機制？

Encoder整個輸入序列，并且用Encoder最后一個狀態結果來初始化Decoder。

將［start］作為輸入傳遞給解碼器Decoder。

使用通過Encoder初始化過的Decoder運行一個time stpe。

輸出將是下一個單詞的概率，將選擇概率最大的單詞。

這個預測的單詞將會在下一時間Step中作為輸入。并且通過當前狀態更新內部參數。

重復步驟3－5，直到生成［end］或達到目標序列的最大長度。

Encoder－Decoder結構的局限性

Encoder將整個輸入序列轉為固定的長度，但是當序列很長的時候，Encoder將會很難記住整個序列的內容，無法將所有必要信息準確的編碼到固定長度。但是，我們需要關注序列中所有的內容么，不需要。

注意力機制

為了解決長句子的問題，注意力機制出現在人們的視野。注意力機制為對結果重要的部分添加高的權重，以保留主要信息。舉個例子：

需要編碼的序列［x1，x2，x3，x4，x5，x6，x7］ Source sequence： “Which sport do you like the most？

需要解碼的序列［y1，y2，y3］ Target sequence： I love cricket．我們可以判斷，y1［I］與x4［you］有關，而y2［love］則與x5［like］有關。所以，相比記住序列中的所有單詞，不如增加對目標序列重要部分的權重，忽視低權重的部分。

Global Attention and Local Attention

全局注意力機制編碼器的隱藏層中，所有部分都參與attention的計算上下文。

什么是文本摘要？為什么要有注意力機制？

局部注意力機制編碼器的隱藏層中，僅有部分參與attention的計算上下文。

本文最終采用全局注意力機制。（只是添加了注意力機制，編碼的固定長度依然需要固定。所以實戰中需要通過數據確定一個合適的長度數值。短了無法表達文本內容，長了會造成計算資源浪費。）

實戰

我們的目標是為亞馬遜美食評論生成文本摘要。（這里我只提取了我覺得有用的部分）

數據表述

這些評論通常很長而且具有可描述性。數據集下載：kaggleData。數據涵蓋了超過10年的時間，包括截至2012年10月的所有？500，000條評論。這些評論包括產品，用戶信息，評級，純文本評論和摘要。它還包括來自所有其他亞馬遜類別的評論。

數據處理

由于評論文本和摘要中涉及的預處理步驟略有不同，因此我們需要定義兩個不同的函數來預處理評論和摘要。

評論文本處理

將所有字母小寫；

移除HTML標簽；

Contraction mapping；

移除（‘s）；

刪除括號內的內容（覺得括號里面的內容解釋說明不重要）；

消除標點符號和特殊字符；

刪除停用詞；

刪除低頻詞；

摘要文本處理

為摘要文本添加［start］和［end］。

數據分布

通過數據統計，可以看到摘要與文本數據的長度分布。通過數據可視化，我們可以將評論文本的長度限定在80，而摘要的長度限定在10。

<上一頁 1 2 3 下一頁>

本地收藏打印推薦給朋友

聲明： 本文由入駐維科號的作者撰寫，觀點僅代表作者本人，不代表OFweek立場。如有侵權或其他問題，請聯系舉報。

發表評論

共0條評論，0人參與

立即登錄即可訪問所有OFweek服務

忘記密碼

其他方式

請輸入評論內容...

請輸入評論/評論長度6~500個字

暫無評論

暫無評論

圖片新聞

最新活動更多

即日-5.20
立即下載>> 【限時免費】物理場仿真助力生物醫學領域技術創新
精彩回顧
立即查看>> 【直播】智測未來·2026海克斯康春季產品創新日
精彩回顧
立即查看>> 【線下論壇】新唐科技×芯唐南京 2026 年度研討會
精彩回顧
立即查看>> OFweek 2026（第十五屆）中國機器人產業大會
精彩回顧
立即查看>> 維科杯· OFweek 2025中國機器人行業年度評選
精彩回顧
立即查看>> 【在線會議】液冷服務器信號完整性及冷卻液關鍵電參數測試

一周熱點月點擊榜

企業服務廣告服務獵頭服務薪酬報告

人工智能獵頭職位更多

高級軟件工程師廣東省/深圳市
自動化高級工程師廣東省/深圳市
光器件研發工程師福建省/福州市
銷售總監（光器件）北京市/海淀區
激光器高級銷售經理上海市/虹口區
光器件物理工程師北京市/海淀區
激光研發工程師北京市/昌平區
技術專家廣東省/江門市
封裝工程師北京市/海淀區
結構工程師廣東省/深圳市

掃碼關注公眾號
OFweek人工智能網
獲取更多精彩內容

文章糾錯

x

_*文字標題：

_*糾錯內容：

聯系郵箱：

_*驗證碼：

看不清，點擊換一張

粵公網安備 44030502002758號