在Window上安裝mecab-ipadic-NEologd
今天的主角:ipadic萬能擴充包
首先看了一下ReadMe,並沒有提到windows的安裝方法。 但這時可以注意到有ubuntu系統的指示,OK—
- On Ubuntu
$ sudo apt-get install mecab libmecab-dev mecab-ipadic-utf8 git make curl xz-utils file
$ cd mecab-ipadic-neologd
$ ./bin/install-mecab-ipadic-neologd -n
在windows要怎麼弄來Ubuntu?
-
VMBox BJ4
-
Microsoft Store window8以上導入的這個功能中,其實找的到Ubuntu,跟隨指示安裝後,便能得到一個Linux的視窗XD。這個部分之後可能會寫一下(?
安裝
基本上照著Readme輸入之後便能順利獲取/更新mecab-ipadic-NEologd。
$ sudo apt-get install mecab libmecab-dev mecab-ipadic-utf8 git make curl xz-utils file
$ git clone --depth 1 https://github.com/neologd/mecab-ipadic-neologd.git
$ cd mecab-ipadic-neologd
$ ./bin/install-mecab-ipadic-neologd -n
好了之後如何使用
Ubuntu產生的檔案會放在User/user/AppData/Local/Packages/CanonicalGroupLimited.UbuntuonWindows_xxxxxxxxx/LocalState/rootfs/home/Ubuntu_Username/mecab-ipadic-neologd/build/
為一個資料夾:mecab-ipadic-2.7.0-20070801-neologd-current_date
將此資料夾重新命名為ipadic
並覆蓋MeCab/dic
路徑下的同名檔案,替換便宣告完成囉!
這時可以來試試看是否成功套用
import MeCab
t=MeCab.Tagger("-Ochasen")
t.parse("ミリオンライブシアターデイズ")
t.parse('転生したらスライムだった件')
Output
'ミリオンライブシアターデイズ\tミリオンライブシアターデイズ\tミリオンライブシアターデイズ\t名詞-固有名詞-組織\t\t\nEOS\n'
'転生したらスライムだった件\tテンセイシタラスライムダッタケン\t転生したらスライムだった件\t名詞-固有名詞-一般\t\t\nEOS\n'