Skip to content

25 9 月, 2019

[NLP][Python] 中文自然語言分析的工具: THULAC

Last Updated on 2021-04-03 by Clay

說實話,我好久沒用到這個工具了,最近突然有這種需要,便挖出以前研究過的程式碼,並開始尋找是否有我當初沒有測試過的功能,順便紀錄成筆記。

有時候會想,若是當初有像現在這樣紀錄筆記該有多好,能夠留點東西給自己、方便查詢。

Read More »[NLP][Python] 中文自然語言分析的工具: THULAC

[NLP][Python] 有許多功能的自然語言處理工具: HanLP

Last Updated on 2021-04-01 by Clay

HanLp 的全名為 Han Language Processing,根據 Github 的 README 介紹,其由『大快搜尋』開發並且開源於網路上。

HanLP 提供了各式各樣的功能,包括:

  • 中文斷詞
  • 詞性標記
  • 命名實體識別
  • 關鍵字抽取
  • 自動摘要
  • 拼音轉換
  • 簡繁轉換
  • 文本推薦
  • 文本分類
  • Word2Vec
  • 語料庫工具

以上眾多的功能,我想我肯定還有漏掉的部份。

如果想要參閱這個工具的 Github,請看這邊: https://github.com/hankcs/HanLP

如果想要在線上直接試用這個工具,你也可以去他們在線演示的網站: http://hanlp.com/

以下,我會展示該如何透過 Python 去呼叫這個工具,來完成一些自然語言處理的工作。

Read More »[NLP][Python] 有許多功能的自然語言處理工具: HanLP