首页 > 试题广场 >

在大规模的语料中,挖掘词的相关性是一个重要的问题。以下哪一个

[单选题]
在大规模的语料中,挖掘词的相关性是一个重要的问题。以下哪一个信息不能用于确定两个词的相关性。
  • 互信息
  • 最大熵
  • 卡方检验
  • 最大似然比
推荐
【正确答案】B
【解析】
本题考查候选人对一些数学名词的掌握


A 互信息; 单个随机变量中包含的关于另一个随机变量的信息量
B 最大熵; 最大熵代表了整体分布的信息
C 卡方检验; 卡方检验是统计样本的实际观测值与理论推断值之间的偏离程度的值
D 最大似然比; 通过似然比为基础可以构造一个服从卡方分布统计量

ACD均为两个或多个数据之间相关性程度的挖掘方式,而B最大熵则是元素在整体环境下分布的状态,不是相关性的关系,故选B
编辑于 2021-11-19 12:21:19 回复(0)
B
最大熵原理是一种选择随机变量统计特性最符合客观情况的准则,也称为最大信息原理。随机量的概率分布是很难测定的,一般只能测得其各种均值(如数学期望、方差等)或已知某些限定条件下的值(如峰值、取值个数等),符合测得这些值的分布可有多种、以至无穷多种,通常,其中有一种分布的熵最大。选用这种具有最大熵的分布作为该随机变量的分布,是一种有效的处理方法和准则。这种方法虽有一定的主观性,但可以认为是最符合客观情况的一种选择。在投资时常常讲不要把所有的鸡蛋放在一个敏感词里,这样可以降低风险。在信息处理中,这个原理同样适用。在数学上,这个原理称为最大熵原理。

发表于 2015-01-26 21:34:47 回复(3)
C肯定是啊,选B
发表于 2015-09-09 16:20:57 回复(0)
最大熵代表了整体分布的信息,通常 具有最大熵的分布作为该随机变量的分布, 不能体现两个词的相关性,但是卡方是检验两类事务发生的相关性。所以选B

发表于 2016-09-29 21:32:56 回复(0)
最大似然比估计来比较两个词的相关性吗!???困惑
发表于 2017-09-04 09:54:36 回复(0)
最大熵的分布表示了整体的随机分布,卡方检验用于判断两个变量之间的相关性。eg.卡方值是多少,你选了多大的置信度
发表于 2022-02-18 07:59:18 回复(0)
最大熵代表了整体分布的信息,通常 具有最大熵的分布作为该随机变量的分布, 不能体现两个词的相关性,但是卡方是检验两类事务发生的相关性。
两个词没法说最大熵吧,但是卡方是检验两类事务发生的相关性。
发表于 2019-03-15 08:53:05 回复(0)
还以为卡方检验是最大熵检验呢
发表于 2024-04-26 17:13:50 回复(0)
发表于 2023-03-29 19:29:53 回复(0)
答案D最大似然比是什么鬼。。。
发表于 2016-09-07 12:39:12 回复(0)