(文章来源:量子认知)
在计算机科学和信息论中,数据压缩算法是按照特定的编码机制将未经编码的数据比特(或者其它信息相关的单位)较为紧凑地表示信息的方法。常见的例子如ZIP文件格式,ZIP文件格式是一种数据压缩和文档储存的文件格式,以便于在网络上传播和分发文件。这种格式不仅仅提供压缩功能占有较少信息空间,还可作为归档工具(Archiver),将许多文件存储到同一个文件中。现在我们许多人的电脑里就有这种格式及其压缩算法。
数据压缩能够实现是因为多数现实的数据都有统计冗余。有的数据比起其它数据更加常用,有的数据的使用可能性非常小。数据压缩算法通常利用统计冗余,这样就能更加简练地、但仍然是完整地表示发送方的数据。
熵是物理学和生物学中一个重要的计算参数,是一种测量在动力学方面不能做功的能量总数,也就是当总体的熵增加,其做功能力也下降,熵的量度是能量退化的指标。熵亦被用于计算一个系统中的失序现象,也就是计算该系统混乱的程度。熵是一个描述系统状态的函数,在科技中经常用熵的参考值和变化量进行分析比较,它在控制论、概率论、数论、天体物理、生命科学等领域都有重要应用,在不同的学科中也有引申出的更为具体的定义,是各领域十分重要的参量。
熵是衡量系统的分子无序性或随机性的一种指标,对于理解系统的物理组成至关重要。在复杂的物理系统中,内部元素的相互作用是不可避免的,这使得熵的计算成为一项计算量大且通常难以解决。
有人可能会感到奇怪,上面提到的数据压缩算法和熵这两个不同概念,两者看起来毫不相干,怎么就连到了一起来了呢?现在,以色列特拉维夫大学(Tel Aviv University)的一项最新研究成果提出了一种非常简单而有效的熵计算方法,这种方法很可能就存在于你的电脑里的数据压缩算法,就可以简单而又方便地计算熵。这项研究成果发表在最近一期的《物理评论快报》上。
特拉维夫大学的科学家们发现了这种使用标准压缩算法,利用我们在计算机上都拥有的zip软件来计算熵。通过使用超级计算机来模拟患者处于患病状态的蛋白质的折叠与差错折叠。他们的研究表明,使用标准压缩算法,就可以计算出蛋白质的熵值来提供有关这些蛋白质物理性质的新见解帮助诊断。
这种计算熵的新方法利用计算机仿真的强大功能,可以满足解决科学和医学领域紧急而又及时的迫切需求。研究人员认为,这项研究具有无限的应用,从生物医学模拟到在物理、化学或材料科学领域进行的基础研究,这种新算法在任何计算机上都将易于使用。
研究人员说:一个高中生就可以使用我们的概念方法来计算一个复杂的物理系统的XY模型的熵。熵过去被认为是一个具有挑战性的问题,但是学生在很少的指导下即可以完成。这证明了几乎任何人都可以轻松地使用这种方法来解决非常有趣的问题。
研究人员是在和学生们从信息论的角度讨论熵时,产生了这种计算方法的构想。他们想知道这个想法在实践中而不是理论上是否行得通。他们用可以比较的熵值模拟了一些标准物理系统。很快,他们发现压缩后的模拟数据文件大小会按预期的熵增加和减少。不久之后,他们意识到可以将压缩文件的大小转换为可用的值——物理熵。令人惊讶的是,他们进行了简单的转换即对所有研究的系统都有效。
研究人员目前正在将其方法与概念应用扩展到各种各样的系统中。研究人员总结道:“自从我们开始工作并谈论我们的工作以来,许多来自不同领域的研究人员都与我们接触,要求我们帮助他们根据他们的数据计算熵。” “目前,我们专注于蛋白质折叠的模拟,这是一个及时而紧迫的话题,可以从我们的发现中受益匪浅。”
(责任编辑:fqj)
-
数据
+关注
关注
8文章
6870浏览量
88800 -
计算
+关注
关注
2文章
444浏览量
38726
发布评论请先 登录
相关推荐
评论