[NLP][Python] 中文自然語言分析的工具: THULAC
說實話,我好久沒用到這個工具了,最近突然有這種需要,便挖出以前研究過的程式碼,並開始尋找是否有我當初沒有測試過的功能,順便紀錄成筆記。
有時候會想,若是當初有像現在這樣紀錄筆記該有多好,能夠留點東西給自己、方便查詢。
Read More »[NLP][Python] 中文自然語言分析的工具: THULAC說實話,我好久沒用到這個工具了,最近突然有這種需要,便挖出以前研究過的程式碼,並開始尋找是否有我當初沒有測試過的功能,順便紀錄成筆記。
有時候會想,若是當初有像現在這樣紀錄筆記該有多好,能夠留點東西給自己、方便查詢。
Read More »[NLP][Python] 中文自然語言分析的工具: THULACHanLp 的全名為 Han Language Processing,根據 Github 的 README 介紹,其由『大快搜尋』開發並且開源於網路上。
HanLP 提供了各式各樣的功能,包括:
以上眾多的功能,我想我肯定還有漏掉的部份。
如果想要參閱這個工具的 Github,請看這邊: https://github.com/hankcs/HanLP
如果想要在線上直接試用這個工具,你也可以去他們在線演示的網站: http://hanlp.com/
以下,我會展示該如何透過 Python 去呼叫這個工具,來完成一些自然語言處理的工作。
Read More »[NLP][Python] 有許多功能的自然語言處理工具: HanLP在處理各式各樣的 NLP 任務當中,難免會遇到有工具針對繁體、或簡體特別適合的情況 —— 畢竟這可能跟訓練語料有關。這時候,我們很有可能會需要能自動幫我們轉換中文簡繁的工具。而在 Python 當中,我覺得最方便的工具非 OpenCC 莫屬。
Read More »[NLP][Python] 透過 opencc-python-reimplemented 套件來使用中文繁簡轉換工具 OpenCC在繁體中文的自然語言處理(NLP)當中,CKIP 無疑是斷詞最精準、最負盛名的工具。這項工具是由台灣中研院資訊所、語言所於民國 75 年成立的中文語言言小組所開發,也在多個中文斷詞的比賽當中得過獎項。
之前由於 CKIP 一直沒有開源,導致需要前往官方的 Demo 網站試用( https://ckip.iis.sinica.edu.tw/demo/ ),或者是寄信取得授權,可以使用下載版的 CKIP 一個月,看是要直接使用 bat 檔,或是使用 Python 另外調用。
Read More »[NLP][Python] 透過 ckiptagger 來使用繁體中文斷詞的最佳工具 CKIP『斷詞』(或者你習慣講『分詞』)的重要性在中文 NLP 當中幾乎可說是無人不知、無人不曉。若是今天我們要進行中文的句法分析,試想:若是我們連句子當中有哪些『詞』都不知道,只知道有什麼樣的『字』存在於句子中,那我們該如何去分析這個句子?
於是在進行中文處理時,『斷詞』的工作可謂是必不可少。
當然,搞不好往後的中文分析都是使用深度學習,到了那一天或許也不再需要斷詞啦,不過現階段還是要的。
最近幾天 Monster Hunter World: Iceborne 發售了(其實已經發售一段時間了),最近沉浸在獵龍的樂趣裡頭,真的是什麼都不想管了,哈哈哈哈。
如果你想看我當初遊玩心得的話,傳送門在這裡: 魔物獵人《世界》Iceborne —— 發售首日至今心得
Read More »[Python] 我無聊使用了 PyQt5 製作一個簡單的魔物獵人世界: Iceborne 屬性表熟悉的魔物獵人終於又回來啦!為了這款大型共鬥遊戲始祖的遊戲,我甚至還推辭掉了一個比賽的報告(這是不良的示範!)從發售日開完一路奮戰狩獵至今,再次重回了高中時代和朋友、老弟共同享受狩獵魔物的那種無憂無慮的時光,導致我去實驗室幫老闆跑實驗時都在想魔物獵人,哈哈哈哈哈哈哈哈!
本篇分成三個部份介紹我至今的遊玩心得,分別為【作品介紹】、【遊玩心得】、【抱怨篇】三個部份!(最後一個其實沒什麼必要哈哈哈哈!我的粉絲濾鏡讓遊戲看起來超好玩的!)
Read More »[PS4] 《魔物獵人世界:冰原》MHWI 主線通關心得目前為止,我認為已經介紹過許多簡單便可調用、也是開發界面比較常用到的元件。(其實只是我自己常用到,哈哈哈哈)
所以今天我把比較不常放在一起講的『下拉式選單』以及『BoxLayout』放在一起講,希望能趕快結束掉基本介紹的部份。
Read More »[PyQt5] 基本教學(6) 下拉選單、BoxLayout繼上次做了菜單與工具欄的筆記之後,今天再次介紹新的元件,也是我打算用於自己專案界面的元件。
今天主要簡單地介紹該如何使用 PyQt5 裡頭的 QProgrssBar、QHorizontalSlider、QDial 等三個元件。翻譯成中文的話不外乎是:進度條、滑動條、旋轉鈕。算是相當淺顯易懂。
Read More »[PyQt5] 基本教學(5) 進度條、滑動條、旋轉鈕PyInstaller 是一個相當方便的 Python 套件,主要目的是用於打包 Python 的 .py 檔成為 exe 執行檔。
這樣做的價值在於,我們可以很方便地發佈我們所寫的程式到那些電腦裡沒有安裝 Python 的人那邊。PyInstaller 會自動綁定你所需要的所有模組、套件,然後自動打包。(當然,這裡面的坑非常多,建議搭配 stackoverflow 以及 github 的問題討論,可以解決不少遇到的問題)
Read More »[Python] 使用 PyInstaller 套件將程式打包成 exe 執行檔