自然语言处理中的中文分词问题,前向最大匹配算法(FMM)。 注:题目举例说明了FMM的基本思想。
(1)设计字典的数据结构 struct dictnote。
(2)用C/C++实现FMM,可选接口为 int FMM(vector iLetters, dictnode *iRoot,
vector*oResults); 其中 iLetters 为待分词的句子,比如
{“小”,“明”,“今”,“天”,“买”,“了”,“i”,“p”,“o”,“n”,“e”,“6”}, iRoot 是字典, oResults
保存输出结果,即分词的位置。也可以自己设计接口。
(3)收集了一些手机品牌的字典,如{iphone, 诺基亚}。 现在要求查找包含这些手机品牌的网页,比如包含 iphone6, 诺基亚
9973 等。 怎么修改FMM实现这个功能,可以写伪代码。