[NLP][Python] 有許多功能的自然語言處理工具: HanLP
HanLp 的全名為 Han Language Processing,根據 Github 的 README 介紹,其由『大快搜尋』開發並且開源於網路上。
HanLP 提供了各式各樣的功能,包括:
- 中文斷詞
- 詞性標記
- 命名實體識別
- 關鍵字抽取
- 自動摘要
- 拼音轉換
- 簡繁轉換
- 文本推薦
- 文本分類
- Word2Vec
- 語料庫工具
以上眾多的功能,我想我肯定還有漏掉的部份。
如果想要參閱這個工具的 Github,請看這邊: https://github.com/hankcs/HanLP
如果想要在線上直接試用這個工具,你也可以去他們在線演示的網站: http://hanlp.com/
以下,我會展示該如何透過 Python 去呼叫這個工具,來完成一些自然語言處理的工作。
Read More »[NLP][Python] 有許多功能的自然語言處理工具: HanLP