信息熵原理与Python实现
admin
2024-04-03 15:59:43
0

信息熵理论

熵原理

  • 是个物理名词,最初是从平衡态热力学中总结出来的,它表述为热量与绝对温度变化的商。它标志着热量转化为功的程度,泛指某些物质系统状态的一种量度。
    • 熵是物质系统混乱度的度量,在统计物理中,有如下关系式:S=Kln⁡ΩS = K\ln{\Omega }S=KlnΩ
    • 这就是著名的玻尔兹曼关系式,KKK是玻尔兹曼常数,Ω\OmegaΩ是系统的微观状态数,在宏观条件不变的情况下,由大量粒子(原子、分子)构成的系统中,熵就表示粒子之间无规则的排列程度,或者说,表示系统的紊乱程度,当系统处于平衡时,微观状态数越多,系统越“混乱”,熵就越大,否则,熵就越小。
    • 从微观意义上讲,熵是物质系统无序性混乱度的量度。玻尔兹曼关系式被称为只有牛顿运动定律和爱因斯坦质能关系式才能与之媲美的公式,这就是统计力学熵
  • 信息是表示事物存在状态及运动体系的确定程度。它只有在相互作用的时候才能表现出来,通过它的运动状态,人们可以对它的状态进行表示。人们通过各种探测工具来提取信息,然后运用这些信息来对事物的存在状态进行度量也就是通过熵的形式对信息进行量化和度量。
    • 1929年,甸牙利科学家斯依兰德(L Szilard)提出了熵与信息不确定性的关系,进一步拓宽了熵的内涵。
    • 1948年,贝尔实验室的香农(C Shannon) 对前人的成果予以总结,强调了“信息量”这个概念。阐述了许多重要定理,把信息熵与统计力学熵概念相联系,把信息定理看作热力学第二定律在通信理论中的特殊形式,使信息熵成为信息论的一个正统的分支。

信息熵

  1. 信息熵:Shannon把信息量作为信息论的中心概念,信息中排除了冗余后的平均信息量称为“信息熵”,即香农熵。

  2. 单个离散随机变量XXX的熵H(X)H(X)H(X)的是对其平均不确定度的度量

    • 信息熵1的计算公式:H(X)=−∑xi∈Θp(xi)log⁡p(xi)=−E[log⁡p(xi)]H(X)=-\sum_{x_{i} \in \Theta} p\left(x_{i}\right) \log p\left(x_{i}\right)=-E\left[\log p\left(x_{i}\right)\right]H(X)=−∑xi​∈Θ​p(xi​)logp(xi​)=−E[logp(xi​)]
    • XXX代表取值于Θ\ThetaΘ的随机变量
    • 概率质量函数p(xi)=Pr{X=xi},xi∈Θp(x_{i})=P_{r}\left\{X=x_{i}\right\},x_{i}\in \Thetap(xi​)=Pr​{X=xi​},xi​∈Θ
    • EEE代表期望算子
    • 显然当p=0p=0p=0时,这里有plog⁡p=0p\log{p}=0plogp=0
  3. 对于随机事件XXX,其信息熵的计算公式为:H(X)=−∑i=1npilog⁡piH(X)=-\sum_{i=1}^{n} p_{i} \log{p_{i}}H(X)=−∑i=1n​pi​logpi​

    • 用nnn代表XXX的不同种离散取值,i=1,2,3,…,ni=1,2,3,\dots,ni=1,2,3,…,n
    • pip_{i}pi​代表事件xix_{i}xi​发生的概率
    • logloglog代表以222或eee为底的对数
  4. 三个性质

    • 单调性,发生概率越高的事件,其携带的信息量越低;
    • 非负性,信息熵可以看作为一种广度量,非负性是一种合理的必然;
    • 累加性,即多随机事件同时发生存在的总不确定性的量度是可以表示为各事件不确定性的量度的和,这也是广度量的一种体现。

Python实现

import math
import numpy as np
from collections import Counterdef Entropy(X):"""计算离散型变量的信息熵/香农熵, 信息熵越大, 数据的不确定性越大Parameters----------X : {ndarray} of (n_samples,)DataReturns-------entropy : floatEntropy of X"""counts = len(data) # 总数据量counter = Counter(data) # 每个离散变量出现的次数prob = [i[1]/counts for i in counter.items()] #计算每个随机变量发生的概率的pshannon = - sum([i*math.log(i) for i in prob]) # 计算信息熵return shannon
data = np.array([2,3,4,1,1,3,4,5,6,2,1,3,4,5,5,6,7,3,2,4,4,2])
shannon_entropy = Entropy(data)
print("信息熵为:", shannon_entropy)
>>> 信息熵为: 1.8585191558920355

  1. Shannon C E, A mathematical theory of communication, The Bell System Technical Journal, 1948, 27(3): 397–423. ↩︎

相关内容

热门资讯

怎么解除订阅安卓系统,安卓系统... 你是不是也和我一样,手机里订阅了好多服务,结果现在想解除订阅,却一头雾水?别急,今天就来手把手教你如...
安卓系统停用怎么开启,轻松恢复... 亲爱的手机控们,你是否曾经遇到过安卓系统突然停用的情况,让你手忙脚乱,不知所措?别担心,今天就来教你...
安卓系统电池健康度,电池健康度... 你有没有发现,你的安卓手机最近是不是有点儿不给力了?电池续航能力大不如前,充电速度也慢了不少?别急,...
安卓系统按键怎么截图,安卓系统... 你是不是也和我一样,有时候想截个图分享给朋友,却发现安卓手机的截图功能有点神秘呢?别急,今天就来手把...
购票系统安卓源代码,架构设计与... 你有没有想过,那些我们每天离不开的购票系统,它们背后的秘密是什么呢?今天,就让我带你一探究竟,揭开购...
安卓手机系统后台测试,深度解析... 你有没有发现,你的安卓手机后台总是悄悄地忙碌着?别小看了这些后台程序,它们可是手机系统稳定运行的关键...
安卓系统重启的图标,解锁设备新... 手机突然重启,是不是心里有点慌?别急,今天就来和你聊聊安卓系统重启的图标,让你一眼就能认出它,再也不...
车载智慧屏安卓系统,智能出行新... 你有没有发现,现在的车载智慧屏越来越智能了?尤其是那些搭载了安卓系统的,简直就像是个移动的小电脑,不...
安卓系统连上网权限,解锁设备无... 你有没有发现,你的安卓手机里有些应用总是偷偷连上网?别小看这个小小的网络权限,它可是能影响你隐私、消...
安卓谷歌操作系统,探索安卓谷歌... 你知道吗?在智能手机的世界里,有一个操作系统可是无人不知、无人不晓,那就是安卓谷歌操作系统。它就像一...
安卓系统手写%怎样调出,具体实... 你有没有遇到过这种情况:在使用安卓手机的时候,突然想用手写输入法来记录一些灵感或者重要信息,可是怎么...
安卓手机重置 系统设置,轻松恢... 手机用久了是不是感觉卡顿得厉害?别急,今天就来教你怎么给安卓手机来个大变身——重置系统设置!想象你的...
win如何安装安卓系统,Win... 哇,你有没有想过,让你的Win系统也能玩转安卓应用?没错,就是那种在手机上轻松自如的安卓系统,现在也...
苹果qq和安卓系统,跨平台体验... 你有没有发现,现在手机市场上,苹果和安卓的较量可是越来越激烈了呢!咱们就来聊聊这个话题,看看苹果QQ...
显示最好的安卓系统,探索最新旗... 你有没有想过,为什么安卓系统那么受欢迎呢?它就像一个魔法盒子,里面装满了各种神奇的魔法。今天,就让我...
安卓app怎么降级系统,系统版... 你有没有发现,有时候安卓手机的系统更新后,新功能虽然炫酷,但老系统用起来更顺手呢?别急,今天就来教你...
雷军脱离安卓系统,引领科技变革... 你知道吗?最近科技圈可是炸开了锅,因为我们的雷军大大竟然宣布要脱离安卓系统,这可真是让人大跌眼镜啊!...
安卓系统自动开网络,安卓系统自... 你有没有发现,手机里的安卓系统有时候会自动开启网络连接,这可真是让人又爱又恨啊!有时候,你正专心致志...
安卓系统怎样控制后台,因为服务... 手机里的安卓系统是不是感觉越来越卡了?后台程序太多,不仅耗电还影响性能。别急,今天就来教你怎么巧妙地...
安卓系统打游戏推荐,一触即达! 你有没有发现,现在手机游戏越来越好玩了?不管是休闲小游戏还是大型MMORPG,都能在手机上畅玩。但是...