信息熵原理与Python实现
admin
2024-04-03 15:59:43
0

信息熵理论

熵原理

  • 是个物理名词,最初是从平衡态热力学中总结出来的,它表述为热量与绝对温度变化的商。它标志着热量转化为功的程度,泛指某些物质系统状态的一种量度。
    • 熵是物质系统混乱度的度量,在统计物理中,有如下关系式:S=Kln⁡ΩS = K\ln{\Omega }S=KlnΩ
    • 这就是著名的玻尔兹曼关系式,KKK是玻尔兹曼常数,Ω\OmegaΩ是系统的微观状态数,在宏观条件不变的情况下,由大量粒子(原子、分子)构成的系统中,熵就表示粒子之间无规则的排列程度,或者说,表示系统的紊乱程度,当系统处于平衡时,微观状态数越多,系统越“混乱”,熵就越大,否则,熵就越小。
    • 从微观意义上讲,熵是物质系统无序性混乱度的量度。玻尔兹曼关系式被称为只有牛顿运动定律和爱因斯坦质能关系式才能与之媲美的公式,这就是统计力学熵
  • 信息是表示事物存在状态及运动体系的确定程度。它只有在相互作用的时候才能表现出来,通过它的运动状态,人们可以对它的状态进行表示。人们通过各种探测工具来提取信息,然后运用这些信息来对事物的存在状态进行度量也就是通过熵的形式对信息进行量化和度量。
    • 1929年,甸牙利科学家斯依兰德(L Szilard)提出了熵与信息不确定性的关系,进一步拓宽了熵的内涵。
    • 1948年,贝尔实验室的香农(C Shannon) 对前人的成果予以总结,强调了“信息量”这个概念。阐述了许多重要定理,把信息熵与统计力学熵概念相联系,把信息定理看作热力学第二定律在通信理论中的特殊形式,使信息熵成为信息论的一个正统的分支。

信息熵

  1. 信息熵:Shannon把信息量作为信息论的中心概念,信息中排除了冗余后的平均信息量称为“信息熵”,即香农熵。

  2. 单个离散随机变量XXX的熵H(X)H(X)H(X)的是对其平均不确定度的度量

    • 信息熵1的计算公式:H(X)=−∑xi∈Θp(xi)log⁡p(xi)=−E[log⁡p(xi)]H(X)=-\sum_{x_{i} \in \Theta} p\left(x_{i}\right) \log p\left(x_{i}\right)=-E\left[\log p\left(x_{i}\right)\right]H(X)=−∑xi​∈Θ​p(xi​)logp(xi​)=−E[logp(xi​)]
    • XXX代表取值于Θ\ThetaΘ的随机变量
    • 概率质量函数p(xi)=Pr{X=xi},xi∈Θp(x_{i})=P_{r}\left\{X=x_{i}\right\},x_{i}\in \Thetap(xi​)=Pr​{X=xi​},xi​∈Θ
    • EEE代表期望算子
    • 显然当p=0p=0p=0时,这里有plog⁡p=0p\log{p}=0plogp=0
  3. 对于随机事件XXX,其信息熵的计算公式为:H(X)=−∑i=1npilog⁡piH(X)=-\sum_{i=1}^{n} p_{i} \log{p_{i}}H(X)=−∑i=1n​pi​logpi​

    • 用nnn代表XXX的不同种离散取值,i=1,2,3,…,ni=1,2,3,\dots,ni=1,2,3,…,n
    • pip_{i}pi​代表事件xix_{i}xi​发生的概率
    • logloglog代表以222或eee为底的对数
  4. 三个性质

    • 单调性,发生概率越高的事件,其携带的信息量越低;
    • 非负性,信息熵可以看作为一种广度量,非负性是一种合理的必然;
    • 累加性,即多随机事件同时发生存在的总不确定性的量度是可以表示为各事件不确定性的量度的和,这也是广度量的一种体现。

Python实现

import math
import numpy as np
from collections import Counterdef Entropy(X):"""计算离散型变量的信息熵/香农熵, 信息熵越大, 数据的不确定性越大Parameters----------X : {ndarray} of (n_samples,)DataReturns-------entropy : floatEntropy of X"""counts = len(data) # 总数据量counter = Counter(data) # 每个离散变量出现的次数prob = [i[1]/counts for i in counter.items()] #计算每个随机变量发生的概率的pshannon = - sum([i*math.log(i) for i in prob]) # 计算信息熵return shannon
data = np.array([2,3,4,1,1,3,4,5,6,2,1,3,4,5,5,6,7,3,2,4,4,2])
shannon_entropy = Entropy(data)
print("信息熵为:", shannon_entropy)
>>> 信息熵为: 1.8585191558920355

  1. Shannon C E, A mathematical theory of communication, The Bell System Technical Journal, 1948, 27(3): 397–423. ↩︎

相关内容

热门资讯

安卓系统的如何测试软件,从入门... 你有没有想过,你的安卓手机里那些神奇的软件是怎么诞生的呢?它们可不是凭空出现的,而是经过一系列严格的...
小米8安卓系统版本,安卓系统版... 你有没有发现,手机更新换代的速度简直就像坐上了火箭呢?这不,小米8这款手机自从上市以来,就凭借着出色...
华为手机安卓系统7以上,创新体... 你有没有发现,最近华为手机越来越受欢迎了呢?尤其是那些搭载了安卓系统7.0及以上版本的机型,简直让人...
儿童英语免费安卓系统,儿童英语... 哇,亲爱的家长朋友们,你是否在为孩子的英语学习发愁呢?别担心,今天我要给你带来一个超级好消息——儿童...
ios系统切换安卓系统还原,还... 你有没有想过,有一天你的手机从iOS系统切换到了安卓系统,然后再从安卓系统回到iOS系统呢?这听起来...
灵焕3装安卓系统,引领智能新体... 你知道吗?最近手机圈里可是掀起了一股热潮,那就是灵焕3这款神器的安卓系统升级。没错,就是那个曾经以独...
安卓系统指南针软件,探索未知世... 手机里的指南针功能是不是让你在户外探险时倍感神奇?但你知道吗,安卓系统中的指南针软件可是大有学问呢!...
华为是不用安卓系统了吗,迈向自... 最近有个大新闻在科技圈里炸开了锅,那就是华为是不是不再使用安卓系统了?这可不是一个简单的问题,它涉及...
安卓系统热点开启失败,排查与解... 最近是不是你也遇到了安卓系统热点开启失败的小麻烦?别急,让我来给你详细说说这个让人头疼的问题,说不定...
小米max2系统安卓,安卓系统... 你有没有听说过小米Max2这款手机?它那超大的屏幕,简直就像是个移动的电脑屏幕,看视频、玩游戏,那叫...
电池健康怎么保持安卓系统,优化... 手机可是我们生活中不可或缺的好伙伴,而电池健康度就是它的生命力。你有没有发现,随着使用时间的增长,你...
安卓手机怎么调系统颜色,安卓手... 你有没有发现,你的安卓手机屏幕颜色突然变得不那么顺眼了?是不是也想给它换换“脸色”,让它看起来更有个...
安卓系统清粉哪个好,哪款清粉工... 手机用久了,是不是觉得卡得要命?别急,今天就来聊聊安卓系统清理垃圾哪个软件好。市面上清理工具那么多,...
华为被限制用安卓系统,挑战安卓... 你知道吗?最近科技圈可是炸开了锅!华为,这个我们耳熟能详的名字,竟然因为一些“小插曲”被限制了使用安...
安卓系统是不是外国,源自外国的... 你有没有想过,我们每天离不开的安卓系统,它是不是外国货呢?这个问题听起来可能有点奇怪,但确实很多人都...
安卓系统缺少文件下载,全面解析... 你有没有发现,用安卓手机的时候,有时候下载个文件真是让人头疼呢?别急,今天就来聊聊这个让人烦恼的小问...
kktv系统刷安卓系统怎么样,... 你有没有听说最近KKTV系统刷安卓系统的事情?这可是个热门话题呢!咱们一起来聊聊,看看这个新玩意儿到...
安卓系统连接电脑蓝牙,操作指南... 你有没有遇到过这种情况:手机里堆满了各种好用的应用,可就是想找个方便快捷的方式,把手机里的音乐、照片...
安卓车机11.0系统包,智能驾... 你有没有发现,最近你的安卓车机系统好像悄悄升级了呢?没错,就是那个安卓车机11.0系统包!这可不是一...
安卓系统最高到多少,从初代到最... 你有没有想过,你的安卓手机系统升级到哪一步了呢?是不是好奇安卓系统最高能到多少呢?别急,今天就来带你...