首页
题库
面试
求职
学习
竞赛
More+
所有博客
搜索面经/职位/试题/公司
搜索
我要招人
去企业版
登录 / 注册
首页
>
试题广场
>
N-gram是一种简单有效的统计语言模型,通常n采用1-3之
[单选题]
N-gram是一种简单有效的统计语言模型,通常n采用1-3之间的值,它们分别称为unigram、bigram和trigram。现有给定训练语料合计三个文档如下:
D1: John read Moby Dick
D2: Mary read a different book,
D3: She read a book by Cher
利用bigram求出句子“John read a book”的概率大约是( )
1
0.06
0.09
0.0008
查看答案及解析
添加笔记
求解答(15)
邀请回答
收藏(1355)
分享
7个回答
添加回答
86
Henryhust
2-gram公式
P(s1,s2,s3...) = P(s1)*P(s2|s1)*P(s3|s2).....
解:
john在文章开头的概率:P(john) = 1/3
P(read | John) = 1
P(a|read) = 2/3
P(book|a) = 1/2
P(尾巴|book) = 1/2, book出现两次,其中一次是在句子结尾处
P("John read a book") = 1/3 * 1 * 2/3 * 1/2 * 1/2 = 1/18 ≈ 0.06,故选择B
发表于 2019-08-30 18:44:26
回复(2)
30
无聊的咸鱼瘫
unigram,bigram,trigram,是自然语言处理(NLP)中的问题。父词条:n-gram.
unigram: 单个word
bigram: 双word
trigram:3 word
比如:
西安交通大学:
unigram 形式为:西/安/交/通/大/学
bigram形式为: 西安/安交/交通/通大/大学
trigram形式为:西安交/安交通/交通大/通大学
(来源百度百科)
发表于 2019-08-15 16:45:17
回复(0)
19
81192_J
发表于 2019-08-15 17:08:05
回复(4)
3
陈福林
bigram的语言模型:P(w1w2w3...wn)=P(w1)P(w2|w1)P(w3|w2)...P(wn|wn-1)
P(wn|wn-1)=count(wn,wn-1)/count(wn-1)
发表于 2018-12-26 13:41:32
回复(0)
2
付*君
我咋没懂题目的意思呢
发表于 2020-08-16 17:08:46
回复(0)
1
牛客828855060号
book作为结尾的概率是1/2
发表于 2020-05-05 23:18:31
回复(0)
0
睡不醒的夏不烦
<p>词袋模型的极大似然估计</p>
发表于 2020-06-10 15:42:39
回复(0)
这道题你会答吗?花几分钟告诉大家答案吧!
提交观点
问题信息
算法工程师
数理统计
机器学习
概率统计
2019
360集团
来自:
360公司-2019校...
上传者:
小小
难度:
7条回答
1355收藏
8588浏览
热门推荐
相关试题
某人先写了n封投向不同的信,再写n...
组合数学
概率统计
概率论与数理统计
评论
(4)
在区间[-1, 1]随意取两个数,...
人人网
概率统计
概率论与数理统计
评论
(1)
有甲,乙两批种子,发芽率分别是0...
概率统计
概率论与数理统计
评论
(3)
有以下程序 #include
360集团
C++
Java工程师
C++工程师
iOS工程师
安卓工程师
运维工程师
算法工程师
测试工程师
2019
系统工程师
测试开发工程师
评论
(17)
来自
360公司-2019校招...
市场与销售的区别在哪里?
市场营销
评论
(1)
扫描二维码,关注牛客网
意见反馈
下载牛客APP,随时随地刷题