2024-09-14 19:23 发布于四川

关注

华为OD统一考试 - 中文分词模拟器

题目描述

给定一个连续不包含空格的字符串，该字符串仅包含英文小写字母及英文标点符号（逗号、分号、句号），同时给定词库，对该字符串进行精确分词。

说明：

精确分词：字符串分词后，不会出现重叠。即"ilovechina"，不同词库可分割为"i,love,china"，"ilove,china"，不能分割出现重叠的"i,ilove,china"，i 出现重叠
标点符号不成词，仅用于断句
词库：根据外部知识库统计出来的常用词汇例：dictionary = ["i", "love", "china", "lovechina", "ilove"]
分词原则：采用分词顺序优先且最长匹配原则"ilovechina"，假设分词结果 [i,ilove,lo,love,ch,china,lovechina]，则输出 [ilove,china]错误输出：[i,lovechina]，原因："ilove" > 优先于 "lovechina" 成词错误输出：[i,love,china]，原因："ilove" > "i"遵循最长匹配原则

输入描述

第一行输入待分词语句 "ilovechina"

字符串长度限制：0 < length < 256

第二行输入中文词库 "i,love,china,ch,na,ve,lo,this,is,this,word"

词库长度限制：1 < length < 100000

输出描述

按顺序输出分词结果 "i,love,china"

用例

输入

ilovechina

i,love,china,ch,na,ve,lo,this,is,the,word

输出

i,love,china

说明

无

输入

iat

i,love,china,ch,na,ve,lo,this,is,the,word,beauti,tiful,ful

输出

i,a,t

说明

单个字母，

不在词库中且不成词则输出单个字母

输入

ilovechina,thewordisbeautiful

i,love,china,ch,na,ve,lo,this,is,the,word,beauti,tiful,ful

输出

i,love,china the,word,is,beauti,ful

说明

标点符号为英文标点符号

题目解析

本题感觉题意不是很清晰。

我对题目的理解是：

句子：ilovechina

词库：[i,love,china,ch,na,ve,lo,this,is,the,word]

现在要用词库里面的词汇组成句子。并且选择词汇时，优先选择词库中靠前的，且长度最长的。

比如组成句子“ilovechina”的第一个词汇，必然是 "i" 开头的，因此我们去词库中找 "i" 开头的词汇，按词库顺序依次是：

i
is

其中 is 虽然是 i 开头，但是不符合句子后续部分要求，因此选择词库中词汇 “i”。

此时句子还剩下 "lovechina" 没有分词，则继续在词库中查找 "l" 开头的词汇，按词库顺序依次是：

love
lo

其中 "love" 是顺序靠前，且长度较长的，因此选择词库中词汇 "love"。

此时句子还剩下 "china" 没有分词，则继续在词库中查找 "c" 开头的词汇，按词库顺序依次是：

china
ch

其中 "china" 是顺序靠前，且长度较长的，因此选择词库中词汇 "china"。

此时句子"ilovechina" 完成分词，分词结果为：["i", "love", "china"]。

本题，我的疑惑主要在于用例2：

句子："iat"

词库：[i,love,china,ch,na,ve,lo,this,is,the,word,beauti,tiful,ful]

按照之前的逻辑，首先找到组成句子的第一个词汇，该词汇必然以"i"开头，则匹配到词库中的词汇"i"。

接下来句子还剩"at"，再去

剩余60%内容，订阅专栏后可继续查看/也可单篇购买

2024华为OD机试卷题文章被收录于专栏

本专栏给大家提供了华为2024最新华为OD 题目汇总。华为OD机试刷题记录机考算法题库，帮助你上岸华为。提供C++/Java、JavaScript、Python四种语言的解法。

全部评论

推荐最新楼层

北京理工大学 Java

没有python代码吗？

点赞回复分享

发布于 2024-10-21 09:46 云南

09-11 22:10

门头沟学院嵌入式软件工程师

26届小米秋招嵌入式一面面经

一面（1）自我介绍：我是xxx，就读于xxx，…（2）通信协议了解过吗（SPI，I2C，UART）？选一个你熟悉的说一下，我选的是I2C协议（必须要真的懂时序）。（3）I2C协议你是用到哪里的，代码怎么实现的？（4）Linux下I2C驱动编程：I2C核心层、I2C总线层、I2C驱动层（5）platform 与 设备树的区别（6）linux 下怎么获取到设备树中硬件（板级）的信息（7）TCP，UDP的不同之处，socket套接字编程了解吗，TCP服务器端的编程步骤，UDP和TCP socket编程哪里不同（8）I/O复用，select、epoll，poll的区别（9）linux字符设备驱动程序的...

查看10道真题和解析

点赞评论收藏

分享

09-16 15:38

门头沟学院 Java

还有近乎0面试的吗

本科 211，从八月下旬开始正式投入秋招投递，到现在陆陆续续投了大概 100 家公司可结果真的太打击人了 —— 迄今为止，只收到了两个面试邀约，其中一个一面就挂了，另一个还在等反馈，简历大部分都是投出去就没动静，偶尔收到几个笔试或 AI 面试，认真准备后也没下文。有时候看着自己投过的公司列表，再想想 100 家的数量和几乎为零的有效反馈，真的会怀疑：是我能力不够，还是今年秋招本来就这么难？211 本的背景，在秋招里到底算不算有优势啊？现在每天都在焦虑里打转：早上醒来第一件事就是刷招聘软件和邮箱，没消息就心慌；晚上躺着翻来覆去睡不着，总忍不住想 “别人是不是都拿到好多面试了”“我会不会秋招全凉...

还在等面试的卑微求职：我就是，本科南理工，然后现在只有一堆的笔试和测评，

面试是没有的，有也是AI面

我的秋招日记

点赞评论收藏

分享

08-28 20:36

门头沟学院 Java

这offer能接吗

有没有了解的兄弟姐妹，当时想着投着练练手先，结果真给offer了，一共只有一面😨听hr和面试官意思是实施岗，基本没什么开发

扶老爷爷闯红灯：肯德基招软件工程师了？

投递康冠科技KTC等公司10个岗位

点赞评论收藏

分享

今天 17:45

西安科技大学 Java

鼠鼠秋招简历求助（佬们给点建议）

如标题所说，鼠鼠已经来杭州实习三个月了，这两天收拾了下简历和行李，准备猛攻秋招，感觉实习没什么产出，希望佬们给点修改简历的建议，准备海投了

点赞评论收藏

分享

评论

1

收藏

全站热榜

更多

携程秋招笔试

热聊中

创作者周榜

更多

正在热议

更多

# 从顶到拉给所有面过的公司评分 #

20337次浏览 180人参与

# 机械人春招想让哪家公司来捞你？ #

357393次浏览 3109人参与

# 为了求职，我做过的疯狂伪装 #

12545次浏览 230人参与

# 晒晒你的中秋福利 #

15231次浏览 98人参与

# 职场破冰，你们都聊什么？ #

7258次浏览 75人参与

# 大家实习每天都在干啥 #

89076次浏览 518人参与

# 校招笔试 #

648次浏览 30人参与

# 机械笔面试考察这些知识点 #

10500次浏览 96人参与

# 你的公司给实习生发中秋礼物吗 #

1934次浏览 30人参与

# bilibili求职进展汇总 #

89533次浏览 810人参与

# 工作压力大怎么缓解 #

105189次浏览 1052人参与

# 秋招OC许愿 #

346888次浏览 2530人参与

# 广联达求职进展汇总 #

11038次浏览 50人参与

# 机械人怎么评价今年的华为 #

208984次浏览 1524人参与

# 宣讲会你有哪些意向不到的收获 #

1427次浏览 22人参与

# 聊聊这家公司值得去吗 #

558967次浏览 3712人参与

# 你面试被问到过哪些不会的问题？ #

21935次浏览 817人参与

# 百度秋招提前批进度 #

150429次浏览 1770人参与

# 电网笔面经互助 #

46765次浏览 431人参与

# 秋招的嫡长offer #

30524次浏览 285人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务