位置: IT常识 - 正文
推荐整理分享python实现信息熵的计算代码(python 熵值法),希望有所帮助,仅作参考,欢迎阅读内容。
文章相关热门搜索词:python熵值法计算权重,python 信号,python信息系统,python 熵值法,python 信号,python 熵值法,python计算熵,python 熵值法,内容如对您有帮助,希望把文章链接给更多的朋友!
1、什么是信息熵?
1948年香农提出了信息熵(Entropy)的概念。
信息理论:
1、从信息的完整性上进行的描述:
当系统的有序状态一致时,数据越集中的地方熵值越小,数据越分散的地方熵值越大。
2、从信息的有序性上进行的描述:
当数据量一致时,系统越有序,熵值越低;系统越混乱或者分散,熵值越高。
“信息熵” (information entropy)是度量样本集合纯度最常用的一种指标。
二、python实现信息熵的计算代码
1、导入库
importnumpyasnpimportpandasaspd2、 准备数据
data=pd.DataFrame({'学历':['专科','专科','专科','专科','专科','本科','本科','本科','本科','本科','研究生','研究生','研究生','研究生','研究生'],'婚否':['否','否','是','是','否','否','否','是','否','否','否','否','是','是','否'],'是否有车':['否','否','否','是','否','否','否','是','是','是','是','是','否','否','否'],'收入水平':['中','高','高','中','中','中','高','高','很高','很高','很高','高','高','很高','中'],'类别':['否','否','是','是','否','否','否','是','是','是','是','是','是','是','否']})3、定义信息熵函数
#定义计算信息熵的函数:计算Infor(D)definfor(data):a=pd.value_counts(data)/len(data)returnsum(np.log2(a)*a*(-1))#print(infor(data["学历"]))#测试结果为:1.584962500721156下一篇:dedecms5.7如何调用指定keyword或指定的id的文档(dedecms插件)
友情链接: 武汉网站建设