[NLP] BLEU 計算相似度
BLEU 是一種評估文字相似度的演算法,經常用於評估『機器翻譯』與『人工翻譯』之間的相似度。最近由於有比對文句之間相似度與否的需求,故在他人推薦之夏稍微研究了一下 BLEU 的原理,同時試用了 NLTK 中提供的 BLEU 函式。
Read More »[NLP] BLEU 計算相似度自然語言處理
BLEU 是一種評估文字相似度的演算法,經常用於評估『機器翻譯』與『人工翻譯』之間的相似度。最近由於有比對文句之間相似度與否的需求,故在他人推薦之夏稍微研究了一下 BLEU 的原理,同時試用了 NLTK 中提供的 BLEU 函式。
Read More »[NLP] BLEU 計算相似度我曾經在 Stanford CoreNLP 教學 —— by Python 紀錄了該如何透過 Python 調用 Stanford CoreNLP 這個由 Stanford 團隊開發的好用工具。不過,就在最近我重新按照我自己寫的流程操縱的時候,我在新的版本遇到了以下這樣的問題:
Read More »[已解決] OSError: stanford-chinese-corenlp-yyyy-MM-dd-models.jar not exists. You should download and place it in the models/stanford-corenlp-4.0.0/ first.在我們進行自然語言處理 (NLP) 任務的時候,有時候,我們會需要進行『兩個句子』的比對,好用來確認他們兩者之間相似不相似 —— 當然,如果想要比較文本,也是可以這麼做,不過稍微有點少見。
Read More »使用 Python 計算兩句子的最短編輯距離 (Minimum Edit Distance)今天我在使用 Python 進行自然語言處理 (NLP) 的遇到了這個問題:
Read More »[已解決] OSError: [E050] Can’t find model ‘en’. It doesn’t seem to be a shortcut link, a Python package or a valid path to a data directory.如果今天我們想要進行文字的翻譯,大部分的人想必都會不約而同地使用 『Google 翻譯』吧!畢竟一來 Google 翻譯的名聲相當響亮、二來由於近年來 NLP 相關的深度學習技術越來越成熟,Google 翻譯的品質也是逐年提昇。
Read More »[Python] 使用 googletrans 套件來進行 Google 翻譯Facebook AI 團隊在本周開源了聊天機器人 Blender,印象中這個專案 (當時似乎是叫做 ParlAI) 似乎幾年前就有看過了?不過既然 Facebook 現在公佈了 Blender 出來,那想必是有其過人之處。
Read More »[NLP][Python] 試用 FB 團隊最新開源的聊天機器人 Blender我最近研究了一會兒的文字雲產生工具,使用的當然是 Python 上鼎鼎有名的 wordcloud。目前我有個想做的功能是自定義圖片的背景,不過上網一查目前只有找到使用圖片遮罩置換圖片形狀 …… 我直覺可能是這個功能太簡單、而且太單純了,所以反而沒什麼人討論。
Read More »[Python] wordcloud 自定義背景圖片在 Python 中的 wordcloud 是一個著名於產生文字雲的模組。今天我想要紀錄的是該如何控制文字雲中的顏色。
Read More »[Python] wordcloud 設定文字雲中文字顏色wordcloud 是個 Python 中用於產生文字雲的模組,之前我也簡單地寫過該怎麼使用這個套件來製作文字雲。不過今天我更進一步地研究了設定 wordcloud 依照不同的『圖片遮罩』來產生不同形狀的文字雲、甚至控制文字雲的顏色。
Read More »[Python] wordcloud 模組使用 mask 生成特定形狀、顏色FastText 是由 Facebook AI Research Lab (FAIR) 所開發的『詞嵌入』以及『文本分類』,支援 294 種語言,並且使用類神經網路訓練詞嵌入模型。
Read More »[NLP][Python] 使用 FastText 訓練詞向量