关注
找到一份通过的代码,你们看看 #!/usr/bin/env python
import math
import random
import sys
class Solution2(object):
def tfidf(self, line, idf):
tf = {}
tfidf = []
data = []
words = line.split(",")
length = len(words)
for word in words:
tf[word] = tf.get(word, 0) + 1 / length
for word in words:
tfidf.append(str(round(tf.get(word) * idf.get(word), 2)))
data.append("tf:%s,idf:%s" % (tf.get(word), idf.get(word)))
return (tfidf)
def getWordDocs(self, docs):
N = len(docs)
idf = {}
for doc in docs:
words = set(doc.split(","))
for word in words:
idf[word] = idf.get(word, 0) + 1
for (k, v) in idf.items():
idf[k] = round(math.log(N / v, 2), 2)
return idf
if __name__ == "__main__":
solution2 = Solution2()
n = int(sys.stdin.readline().strip())
dd = []
for i in range(0, n):
dd.append(sys.stdin.readline().strip())
idf = solution2.getWordDocs(dd)
for item in dd:
tfidf = solution2.tfidf(item, idf)
print(",".join(tfidf))
查看原帖
点赞 3
相关推荐
06-21 17:53
华南师范大学 Java 点赞 评论 收藏
分享
06-30 08:52
广东食品药品职业学院 C++ 
点赞 评论 收藏
分享
牛客热帖
更多
正在热议
更多
# 大厂面试初体验 #
5282次浏览 42人参与
# 如果可以,你希望哪个公司来捞你 #
100798次浏览 457人参与
# 如何提高实习转正率? #
2221次浏览 30人参与
# leader认为你工作不认真怎么办 #
30854次浏览 140人参与
# 你遇到过哪些神仙同事 #
100298次浏览 724人参与
# 我的国央企投递进展 #
46635次浏览 291人参与
# 国企是理工四大天坑的最好选择吗 #
13680次浏览 95人参与
# 五一之后,实习真的很难找吗? #
78502次浏览 515人参与
# 机械人,你被简历秒挂的企业有哪些? #
43003次浏览 281人参与
# 招聘要求与实际实习内容不符怎么办 #
112985次浏览 770人参与
# 如果公司给你放一天假,你会怎么度过? #
17078次浏览 128人参与
# 找工作时的取与舍 #
80442次浏览 568人参与
# 投递几十家公司,到现在0offer,大家都一样吗 #
246289次浏览 1792人参与
# 三一重工求职进展汇总 #
15052次浏览 67人参与
# OPPO求职进展汇总 #
662846次浏览 5041人参与
# 你的秋招第一场笔试是哪家 #
142761次浏览 1453人参与
# 总结:哪家公司面试体验感最差 #
61077次浏览 276人参与
# 如果重来一次你还会读研吗 #
176896次浏览 1786人参与
# 机械人,说说你的烦心事 #
69697次浏览 839人参与
# 面试时被问的最奇葩的问题 #
22982次浏览 130人参与