Pandas怎么计算元素的数量和频率


本篇内容介绍了“Pandas怎么计算元素的数量和频率”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!在pandas.Series的pandas.DataFrame列中,将描述获取唯一元素数(不包括重复项的案例数)和每个元素的出现频率(出现数)的方法。使用pandas.Series方法的unique(),value_counts()和nunique()。还提供了nunique()作为pandas.DataFrame的方法。在这里:pandas.Series.unique():返回NumPy数组ndarray中唯一元素值的列表pandas.Series.value_counts():返回唯一元素的值及其在出现的次数。pandas.Series.nunique(), pandas.DataFrame.nunique():返回int,pandas.Series中唯一元素的数量。在解释了基本用法之后,对一下内容进行介绍。唯一元素的数量(不包括重复项的)唯一元素值列表唯一元素的频率(出现次数)独特元素及其出现的字典模式及其频率归一化频率以下面的数据为例。unique()返回唯一元素值的列表。一维NumPy数组ndarray类型而不是列表类型(Python内置类型)。还包括缺失值NaN。value_counts()返回pandas.Series,其中唯一元素的值是index,出现的次数是data。当需要元素的频率(出现次数)时使用此选项。默认情况下,它按出现次数的降序排序,但是如果参数ascending = True,则以升序排序,如果参数sort = False,则不进行排序。默认情况下,NaN被排除,但如果参数dropna = False,则也计入NaN。免费云主机域名如果指定了参数normalize = True,则将值归一化,以使总数变为1。请注意,如果包含缺失值NaN,则该值将根据参数dropna的设置而有所不同。pandas.Series.nunique()以整数int形式返回唯一元素的数量。默认情况下,不包含NaN,并且如果指定了参数dropna = False,则结果还将包含NaN。pandas.DataFrame.nunique()计算每列的唯一元素数。返回pandas.Series类型。默认情况下,不包含NaN,并且如果指定了参数dropna = False,则结果还将包含NaN。默认情况下,该值为每列,但是如果参数axis = 1或axis =‘columns’,则返回每行的值。如上所述,pandas.Series.nunique()和pandas.DataFrame.nunique()可以计算唯一元素的数量(唯一元素的数量)。使用unique(),您可以获取NumPy数组ndarray类型的唯一元素值的列表。如果要使用列表类型(Python内置类型),则可以使用tolist()方法将其转换。可以将tolist()方法应用于通过value_counts()获得的pandas.Series的索引。也可以作为NumPy数组ndarray类型的值来获取。如上所述,在unique()的情况下,始终包含NaN,但是value_counts()可以指定参数dropna是否包含NaN。要获取每个唯一元素的频率(出现次数),请访问通过value_counts()获得的pandas.Series的值。使用iteritems()方法检索for循环中的元素值和频率(出现次数)。也可以将to_dict()方法应用于value_counts()获得的pandas.Series使其成为字典。使用items()方法在for循环中检索元素值和频率(出现次数)。默认情况下,value_counts()返回pandas.Series,它以出现次数的降序排列,因此顶部是最频繁出现的值及其频率。原始pandas.Series的元素成为所得pandas.Series的索引。当数值为索引时,无法使用[Number]指定该值(这会导致错误),因此严格使用iat [Number]进行指定。 (由于示例是字符串,因此[Number]无关紧要)使用apply()方法将其应用于pandas.DataFrame的每一列。Pandas中map(),applymap(),apply()函数的使用方法如果存在多种模式,则上述方法只能获得一种模式。pandas.Series的mode()方法将模式值返回为pandas.Series。如果使用tolist()列出此结果,则可以将模式值作为列表获取。请注意,即使只有一种模式,也将是一个列表。使用apply()方法将mode()应用于每列将产生具有列表类型元素的pandas.Series()。mode()也作为pandas.DataFrame的方法提供。返回pandas.DataFrame。由于各列的模式数不同,所以空缺部分成为缺失值NaN。可以使用count()方法获得每列中的模式数,该方法对不缺少值NaN的元素数进行计数。同样,正如我在开始时所写的那样,describe()方法可用于共同计算每一列的唯一元素的数量,模式值及其频率(出现的次数)。每个项目都可以使用loc []获得。在describe()中,由列类型dtype计算出的项是不同的,因此使用astype()进行类型转换(转换)。如上所述,当将value_counts()的参数归一化设置为True时,将归一化以使总数变为1的值被返回。请注意,如果包含缺失值NaN,则该值将根据参数dropna的设置而有所不同。比较多个数据的频率分布时,很方便。“Pandas怎么计算元素的数量和频率”的内容就介绍到这里了,感谢大家的阅读。如果想了解更多行业相关的知识可以关注百云主机网站,小编将为大家输出更多高质量的实用文章!

相关推荐: Spring Boot小型项目怎么使用异步任务管理器实现不同业务间的解耦

本篇内容介绍了“SpringBoot小型项目怎么使用异步任务管理器实现不同业务间的解耦”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!顾名思义,就是用来对异步任务…

免责声明:本站发布的图片视频文字,以转载和分享为主,文章观点不代表本站立场,本站不承担相关法律责任;如果涉及侵权请联系邮箱:360163164@qq.com举报,并提供相关证据,经查实将立刻删除涉嫌侵权内容。

(0)
打赏 微信扫一扫 微信扫一扫
上一篇 05/12 09:55
下一篇 05/12 12:20

相关推荐