信息熵原理与Python实现
admin
2024-04-03 15:59:43
0

信息熵理论

熵原理

  • 是个物理名词,最初是从平衡态热力学中总结出来的,它表述为热量与绝对温度变化的商。它标志着热量转化为功的程度,泛指某些物质系统状态的一种量度。
    • 熵是物质系统混乱度的度量,在统计物理中,有如下关系式:S=Kln⁡ΩS = K\ln{\Omega }S=KlnΩ
    • 这就是著名的玻尔兹曼关系式,KKK是玻尔兹曼常数,Ω\OmegaΩ是系统的微观状态数,在宏观条件不变的情况下,由大量粒子(原子、分子)构成的系统中,熵就表示粒子之间无规则的排列程度,或者说,表示系统的紊乱程度,当系统处于平衡时,微观状态数越多,系统越“混乱”,熵就越大,否则,熵就越小。
    • 从微观意义上讲,熵是物质系统无序性混乱度的量度。玻尔兹曼关系式被称为只有牛顿运动定律和爱因斯坦质能关系式才能与之媲美的公式,这就是统计力学熵
  • 信息是表示事物存在状态及运动体系的确定程度。它只有在相互作用的时候才能表现出来,通过它的运动状态,人们可以对它的状态进行表示。人们通过各种探测工具来提取信息,然后运用这些信息来对事物的存在状态进行度量也就是通过熵的形式对信息进行量化和度量。
    • 1929年,甸牙利科学家斯依兰德(L Szilard)提出了熵与信息不确定性的关系,进一步拓宽了熵的内涵。
    • 1948年,贝尔实验室的香农(C Shannon) 对前人的成果予以总结,强调了“信息量”这个概念。阐述了许多重要定理,把信息熵与统计力学熵概念相联系,把信息定理看作热力学第二定律在通信理论中的特殊形式,使信息熵成为信息论的一个正统的分支。

信息熵

  1. 信息熵:Shannon把信息量作为信息论的中心概念,信息中排除了冗余后的平均信息量称为“信息熵”,即香农熵。

  2. 单个离散随机变量XXX的熵H(X)H(X)H(X)的是对其平均不确定度的度量

    • 信息熵1的计算公式:H(X)=−∑xi∈Θp(xi)log⁡p(xi)=−E[log⁡p(xi)]H(X)=-\sum_{x_{i} \in \Theta} p\left(x_{i}\right) \log p\left(x_{i}\right)=-E\left[\log p\left(x_{i}\right)\right]H(X)=−∑xi​∈Θ​p(xi​)logp(xi​)=−E[logp(xi​)]
    • XXX代表取值于Θ\ThetaΘ的随机变量
    • 概率质量函数p(xi)=Pr{X=xi},xi∈Θp(x_{i})=P_{r}\left\{X=x_{i}\right\},x_{i}\in \Thetap(xi​)=Pr​{X=xi​},xi​∈Θ
    • EEE代表期望算子
    • 显然当p=0p=0p=0时,这里有plog⁡p=0p\log{p}=0plogp=0
  3. 对于随机事件XXX,其信息熵的计算公式为:H(X)=−∑i=1npilog⁡piH(X)=-\sum_{i=1}^{n} p_{i} \log{p_{i}}H(X)=−∑i=1n​pi​logpi​

    • 用nnn代表XXX的不同种离散取值,i=1,2,3,…,ni=1,2,3,\dots,ni=1,2,3,…,n
    • pip_{i}pi​代表事件xix_{i}xi​发生的概率
    • logloglog代表以222或eee为底的对数
  4. 三个性质

    • 单调性,发生概率越高的事件,其携带的信息量越低;
    • 非负性,信息熵可以看作为一种广度量,非负性是一种合理的必然;
    • 累加性,即多随机事件同时发生存在的总不确定性的量度是可以表示为各事件不确定性的量度的和,这也是广度量的一种体现。

Python实现

import math
import numpy as np
from collections import Counterdef Entropy(X):"""计算离散型变量的信息熵/香农熵, 信息熵越大, 数据的不确定性越大Parameters----------X : {ndarray} of (n_samples,)DataReturns-------entropy : floatEntropy of X"""counts = len(data) # 总数据量counter = Counter(data) # 每个离散变量出现的次数prob = [i[1]/counts for i in counter.items()] #计算每个随机变量发生的概率的pshannon = - sum([i*math.log(i) for i in prob]) # 计算信息熵return shannon
data = np.array([2,3,4,1,1,3,4,5,6,2,1,3,4,5,5,6,7,3,2,4,4,2])
shannon_entropy = Entropy(data)
print("信息熵为:", shannon_entropy)
>>> 信息熵为: 1.8585191558920355

  1. Shannon C E, A mathematical theory of communication, The Bell System Technical Journal, 1948, 27(3): 397–423. ↩︎

相关内容

热门资讯

安卓系统所有手机通用,揭秘所有... 你有没有发现,现在市面上各种各样的手机,品牌琳琅满目,让人挑花了眼?不过,不管你用的是哪个品牌的手机...
安卓系统变ios系统好用吗,体... 你有没有想过,为什么有些人从安卓手机换到了苹果的iPhone,而且好像换了之后整个人都精神焕发呢?没...
华为安卓系统文件删除,轻松掌握... 你有没有遇到过这种情况?手机里的文件突然不见了,尤其是华为安卓系统里的那些重要文件,真是让人心头一紧...
安卓1.5系统软件,初代智能革... 你有没有想过,手机里的那些看似普通的系统,其实背后藏着无数的故事呢?今天,就让我带你走进安卓1.5系...
安卓 代替系统音效设置,打造个... 你有没有发现,手机里的那些系统音效有时候真的让人有点烦躁呢?比如那个每次接电话时“叮咚”一声,或者是...
安卓系统整体性,构建移动设备的... 你知道吗?在智能手机的世界里,安卓系统就像是个全能的魔术师,它不仅拥有丰富的魔法,还能让各种神奇的魔...
安卓系统能玩鬼泣么?,畅享动作... 你有没有想过,在安卓系统上玩《鬼泣》这款游戏会是怎样的体验呢?没错,就是那个让你热血沸腾、挑战极限的...
安卓系统手机编曲软件,音乐创作... 你有没有想过,用手机也能轻松编曲?没错,就是那个你每天不离手的安卓系统手机!现在,我就要给你揭秘几款...
车载导航显示安卓系统,车载导航... 你有没有发现,现在的车载导航系统越来越智能了?尤其是那些搭载了安卓系统的车载导航,简直就像是个贴心的...
安卓系统启动黑屏,安卓系统启动... 手机屏幕突然黑了,这可怎么办?别急,今天就来和你聊聊安卓系统启动黑屏这个让人头疼的问题。你知道吗,这...
怎么解除订阅安卓系统,安卓系统... 你是不是也和我一样,手机里订阅了好多服务,结果现在想解除订阅,却一头雾水?别急,今天就来手把手教你如...
安卓系统停用怎么开启,轻松恢复... 亲爱的手机控们,你是否曾经遇到过安卓系统突然停用的情况,让你手忙脚乱,不知所措?别担心,今天就来教你...
安卓系统电池健康度,电池健康度... 你有没有发现,你的安卓手机最近是不是有点儿不给力了?电池续航能力大不如前,充电速度也慢了不少?别急,...
安卓系统按键怎么截图,安卓系统... 你是不是也和我一样,有时候想截个图分享给朋友,却发现安卓手机的截图功能有点神秘呢?别急,今天就来手把...
购票系统安卓源代码,架构设计与... 你有没有想过,那些我们每天离不开的购票系统,它们背后的秘密是什么呢?今天,就让我带你一探究竟,揭开购...
安卓手机系统后台测试,深度解析... 你有没有发现,你的安卓手机后台总是悄悄地忙碌着?别小看了这些后台程序,它们可是手机系统稳定运行的关键...
安卓系统重启的图标,解锁设备新... 手机突然重启,是不是心里有点慌?别急,今天就来和你聊聊安卓系统重启的图标,让你一眼就能认出它,再也不...
车载智慧屏安卓系统,智能出行新... 你有没有发现,现在的车载智慧屏越来越智能了?尤其是那些搭载了安卓系统的,简直就像是个移动的小电脑,不...
安卓系统连上网权限,解锁设备无... 你有没有发现,你的安卓手机里有些应用总是偷偷连上网?别小看这个小小的网络权限,它可是能影响你隐私、消...
安卓谷歌操作系统,探索安卓谷歌... 你知道吗?在智能手机的世界里,有一个操作系统可是无人不知、无人不晓,那就是安卓谷歌操作系统。它就像一...