词频统计器--python dict

本是古典何须时尚 2022-06-02 03:15 358阅读 0赞

吐槽

平时就比较常用的统计器老是写的很low，最近看到了一个比较优雅的写法记录一下。

需求

想对jieba.cut返回的分词列表进行字频统计。

代码

优化前

def gen_counter_dict(type_list):
    type_dict = {}
    for type in type_list:
        if type in type_dict.keys():
            type_dict[type] += 1
        else:
            type_dict[type] = 1
    return type_dict

优化后

seg_list = jieba.cut(content, cut_all=False)#默认精准模式
counter = dict()
for seg in seg_list:
    counter[seg] = counter.get(seg, 1) + 1 
    #get()获取key为seg的value，若key不存在不会报keyerror返回一个默认值，这里设为1
counter_sorted = sorted(counter.items(), key=lambda value:value[1], reverse=True)

简要分析

dict字典取值的方式一般两种:
1.1 dict[key],当key不存在的时候，会报keyerror的异常
2.1 dict.get(key, 1), 当可以不存在的时候，会返回一个默认值这里就是1
sorted函数一般是返回一个排序后的列表，对于dict的排序，会返回一个元组的列表，lambda表达是定义了排序比较的参照点。reverse定义是否逆序，默认是从小到大排。reverse=True即从大到小排

发表评论取消回复

表情：

评论列表（有 0 条评论，358人围观）

还没有评论，来说两句吧...

相关阅读

相关【初学python】实例九：词频统计

今天我们来统计一下一本书里面的一些关键字。这里首先忽略了一个问题：这是一本什么书？中文？还是英文？如果是英文，我们要解决的问题有很多：比如说大小写问题，标点符号问题

以你之姓@/ 2023年10月18日 14:10/ 0 赞/ 258 阅读

相关【Python】文本词频统计

![format_png][] 哈姆雷特英文 [https://python123.io/resources/pye/hamlet.txt][https_python123

我不是女神ヾ/ 2023年07月25日 09:19/ 0 赞/ 273 阅读

相关 Python-英文小说词频统计

import operator import re 1) 统计出文本中的单词的词频，找出词频最高和最低的单词及其词频，并输出

绝地灬酷狼/ 2023年06月10日 14:24/ 0 赞/ 132 阅读

相关 Python编程PTA题解——词频统计

Description：编写程序，对一段英文文本，统计其中所有不同单词的个数，以及词频最大的前10%的单词。所谓“单词”，是指由不超过80个单词字符组成的连续字符串，但长

绝地灬酷狼/ 2023年05月28日 14:26/ 0 赞/ 109 阅读

相关 python 词频统计，分词笔记

Python的中文分词库有很多，常见的有： [jieba][]（结巴分词） [THULAC][]（清华大学自然语言处理与社会人文计算实验室） [pkuseg

怼烎@/ 2022年10月13日 15:53/ 0 赞/ 430 阅读

相关词频统计器--python dict

吐槽平时就比较常用的统计器老是写的很low，最近看到了一个比较优雅的写法记录一下。需求想对jieba.cut返回的分词列表进行字频统计。代码优化

本是古典何须时尚/ 2022年06月02日 03:15/ 0 赞/ 359 阅读

相关 python 词频的统计多种方式

现有列表如下： \[6, 7, 5, 9, 4, 1, 8, 6, 2, 9\] 希望统计各个元素出现的次数，可以看作一个词频统计的问题。我们希望最终得到一个这样的结果

谁借莪１个温暖的怀抱￠/ 2022年05月30日 05:53/ 0 赞/ 451 阅读

相关中文词频统计

本次作业的要求来自于：[https://edu.cnblogs.com/campus/gzcc/GZCC-16SE2/homework/2773][https_edu.cnbl

浅浅的花香味﹌/ 2021年12月20日 20:39/ 0 赞/ 452 阅读

相关中文词频统计

作业要求来自： [https://edu.cnblogs.com/campus/gzcc/GZCC-16SE2/homework/2773][https_edu.cnblogs

柔光的暖阳◎/ 2021年12月17日 08:37/ 0 赞/ 390 阅读

相关 Python3 简单实现词频统计

Python3 统计单词出现的行数以 [红楼梦][Link 1] 的数据为例，Python 实现: with open('红楼梦.txt', 'r', enc

深藏阁楼爱情的钟/ 2021年12月15日 14:59/ 0 赞/ 519 阅读