使用类似于MMSG的分词算法 找出所有分词可能,主要根据一下几项来评价:
x、词数量最少; a、词平均频率最大; b、每个词长度标准差最小; c、未识别词最少; d、符合语法结构项:如两个连续的动词减分,数词后面跟量词加分;
取以上几项综合排名最最好的
词总频率,越大越好
词标准差,越小越好 每个词长度标准差最小
未识别词,越小越好
符合语法结构程度,越大越好 符合语法结构项:如两个连续的动词减分,数词后面跟量词加分
結算評分(自動計算)
词数量,越小越好
防止因無分段導致分析過久甚至超過處理負荷 越高越精準但是處理時間會加倍成長甚至超過記憶體能處理的程度
數字越小越快
FATAL ERROR: CALL_AND_RETRY_LAST Allocation failed - JavaScript heap out of memory
评价排名
Generated using TypeDoc
字典识别模块
老雷leizongmin@gmail.com