首页
题库
面试
求职
学习
竞赛
More+
所有博客
搜索面经/职位/试题/公司
搜索
我要招人
去企业版
登录 / 注册
首页
>
试题广场
>
在大规模的语料中,挖掘词的相关性是一个重要的问题。以下哪一个
[单选题]
在大规模的语料中,挖掘词的相关性是一个重要的问题。以下哪一个信息不能用于确定两个词的相关性。
互信息
最大熵
卡方检验
最大似然比
添加笔记
邀请回答
收藏(745)
分享
10个回答
添加回答
2
推荐
牛客职导官方账号
【正确答案】B
【解析】
本题考查候选人对一些数学名词的掌握
A 互信息; 单个随机变量中包含的关于另一个随机变量的信息量
B 最大熵; 最大熵代表了整体分布的信息
C 卡方检验; 卡方检验是统计样本的实际观测值与理论推断值之间的偏离程度的值
D 最大似然比; 通过似然比为基础可以构造一个服从卡方分布统计量
ACD均为两个或多个数据之间相关性程度的挖掘方式,而B最大熵则是元素在整体环境下分布的状态,不是相关性的关系,故选B
编辑于 2021-11-19 12:21:19
回复(0)
13
MyGoodHelper
B
最大熵原理
是一种选择随机变量统计特性最符合客观情况的准则,也称为最大信息原理。随机量的概率分布是很难测定的,一般只能测得其各种均值(如数学期望、方差等)或已知某些限定条件下的值(如峰值、取值个数等),符合测得这些值的分布可有多种、以至无穷多种,通常,其中有一种分布的熵最大。选用这种具有最大熵的分布作为该随机变量的分布,是一种有效的处理方法和准则。这种方法虽有一定的主观性,但可以认为是最符合客观情况的一种选择。在投资时常常讲不要把所有的鸡蛋放在一个敏感词里,这样可以降低风险。在信息处理中,这个原理同样适用。在
数学
上,这个原理称为最大熵原理。
发表于 2015-01-26 21:34:47
回复(3)
1
六道2013
C肯定是啊,选B
发表于 2015-09-09 16:20:57
回复(0)
17
BrainerGao
最大熵代表了整体分布的信息,通常
具有最大熵的分布作为该随机变量的分布,
不能体现两个词的相关性,但是卡方是检验两类事务发生的相关性。所以选B
发表于 2016-09-29 21:32:56
回复(0)
2
牛客144166号
最大似然比估计来比较两个词的相关性吗!???困惑
发表于 2017-09-04 09:54:36
回复(0)
1
聪明波冲冲冲!
最大熵的分布表示了整体的随机分布,卡方检验用于判断两个变量之间的相关性。eg.卡方值是多少,你选了多大的置信度
发表于 2022-02-18 07:59:18
回复(0)
1
恨自己不够强
最大熵代表了整体分布的信息,通常
具有最大熵的分布作为该随机变量的分布,
不能体现两个词的相关性,但是卡方是检验两类事务发生的相关性。
两个词没法说最大熵吧,但是卡方是检验两类事务发生的相关性。
发表于 2019-03-15 08:53:05
回复(0)
0
我都不知道
还以为卡方检验是最大熵检验呢
发表于 2024-04-26 17:13:50
回复(0)
0
乐呜呜呜呜
https://zhuanlan.zhihu.com/p/240676850
互信息与熵
发表于 2023-03-29 19:29:53
回复(0)
0
薛定谔的熊
答案D最大似然比是什么鬼。。。
发表于 2016-09-07 12:39:12
回复(0)
这道题你会答吗?花几分钟告诉大家答案吧!
提交观点
问题信息
搜狐
数理统计
数据分析
自然语言处理
上传者:
虫子吃大米
难度:
10条回答
745收藏
20557浏览
热门推荐
相关试题
有甲,乙两批种子,发芽率分别是0...
概率统计
概率论与数理统计
评论
(3)
某人先写了n封投向不同的信,再写n...
组合数学
概率统计
概率论与数理统计
评论
(4)
在区间[-1, 1]随意取两个数,...
人人网
概率统计
概率论与数理统计
评论
(1)
编程题 ,按照要求创建Java 应...
Java
评论
(1)
市场与销售的区别在哪里?
市场营销
评论
(1)
扫描二维码,关注牛客网
意见反馈
下载牛客APP,随时随地刷题
A 互信息; 单个随机变量中包含的关于另一个随机变量的信息量
B 最大熵; 最大熵代表了整体分布的信息
C 卡方检验; 卡方检验是统计样本的实际观测值与理论推断值之间的偏离程度的值
D 最大似然比; 通过似然比为基础可以构造一个服从卡方分布统计量
ACD均为两个或多个数据之间相关性程度的挖掘方式,而B最大熵则是元素在整体环境下分布的状态,不是相关性的关系,故选B