社区微信群开通啦,扫一扫抢先加入社区官方微信群
社区微信群
前言:
今天为大家带来的内容是Python英文文章词频统计(14份剑桥真题词频统计),文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
Python剑桥真题词频统计
提示:
最好还是要学以致用,小编自主搜集了19年最近的14份剑桥真题之后,通过Python提供的jieba第三方库,对所有的文章信息进行了词频统计,并选择性地剔除了部分简易词汇,比如:数字,普通冠词等,较懒,未清除干净。
Python代码如下:
words = jieba.cut(text, cut_all = False, HMM = True)
word_ = {}
for word in words:
if (word.strip() not in stwlist):
if len(word) > 1:
if word != 't':
if word != 'rn':
if word in word_:
word_[word] += 1
else:
word_[word] = 1
word_freq = []
for word, freq in word_.items():
word_freq.append((word, freq))
word_freq.sort(key = lambda x:x[1], reverse = True)
for i in range(3500):
word, freq = word_freq[i]
print('{0:10}{1:5}'.format(word, freq))
以上就是本文的全部内容啦!
python交流群:877562786(群里含大量学习资料,面试宝典等)
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!