百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

信息传输背后的数学

cac55 2025-03-05 13:43 12 浏览 0 评论

我们每天都在发送信息, 无论是给亲人的短信、给朋友的电子邮件, 还是那些古老的电报.然而, 令人惊讶的是, 很少会有人问:“这些存储在云端的数据是怎样以如此清晰和快速的方式传输的?”也许借助物理学, 我们可以推测消息是通过波传输的. 然而, 这并不足以解释数据是如何以高准确度传输的.因为凭直觉, 沿着非真空介质传播的波很可能会经历扰动, 这将引入错误的传输数据.此外, 这些扰动可能是不可逆的, 也就是说, 波不会经历自我修正的机制.因此, 主要的问题是:数据是怎样以如此高的保真度传输的?换句话说, 我们每天是如何享受如此迅速而准确的通信方式的?

消息、信息和数据

事实证明, 所有这些数据或信息传输背后都有一个基础的数学理论. 从互联网到智能设备的数据传输就是一个具体例子, 这是一种从一个点到另一个点的更一般、更抽象的数据传输概念. 在这里, 点可以是发送方(即信息源)或接收方(即目的地), 例如卫星或手机.

在这一通用的信息传输模型中, 发送方首先将信息或消息发送给编码器, 编码器随后通过使用合适的数学结构对消息进行编码. 一个具有历史意义的例子是使用二进制数字(比特), 即0和1, 来编码黑白图像. 在这种编码技术中(NASA在1960年代实施), 图像被划分为等大小的方块, 每个方块要么是完全黑色, 要么是完全白色;编码器用数字1表示每个黑色方块, 用0表示每个白色方块, 从而有效地产生了一组1和0(在数学术语中称为关联矩阵(Incidence matrix)).

编码后的下一个步骤是将编码的信息(我们称之为数据)传输到接收方. 在此过程中, 数据通过介质或通道传输——在卫星的情况下, 可能是大气层和靠近地球表面的银河区域——到达接收端. 最后, 接收端对数据进行解码, 即执行编码器对信息所做的反操作. 这样, 接收方就获得了原始信息. 如图1简要描述了这一过程.

消息传输系统无疑应该更复杂, 否则, 我们肯定会质疑, 从事这一领域的数学家或工程师究竟是如何赚取薪水的.上述模型中存在两个固有的问题. 首先, 你可能已经从波扰动的例子中意识到, 通道会向数据中引入扰动或噪声.这会影响传输数据的准确性或可靠性(见图2中的A). 其次, 参考NASA的例子, 有时无法100%准确地用数学结构表示图像或信息.这就产生了我们所称的信息失真(见图2中的B).

这些问题是否得到了解决或妥善处理?答案是肯定的, 但还不是完全解决(确实很棘手!). 关于第一个问题, 也称为通道编码问题, 数学家们发现, 通过添加一些与传输数据无关的额外元素(在数学术语中称为冗余), 可以降低噪声影响数据保真度的概率. 这些冗余使数据对不可逆的或永久的扰动不那么敏感, 从而提高数据的准确性. 然而, 这会降低数据传输的速度, 因为发送方必须在每个时刻都通过通道发送额外的冗余. 最终, 必须在速度和准确性之间做出妥协, 但我们能达到的最佳妥协是什么呢?

让我们在考虑第二个问题(源编码问题)时牢记这个问题. 在通过数学结构表示我们的消息时, 我们必须使用一组符号来封装其各个不同的元素. 显然, 我们希望完整地捕捉信息而不失真, 但这需要使用更多的符号. 工程师对此非常关注, 因为他们的目标是使用尽可能少的符号,尽可能多地压缩信息. 因此, 必须做出妥协, 选择最佳妥协的问题再次浮出水面.

香农的通信理论

1948年, 数学家克劳德·艾尔伍德·香农(Claude Elwood Shannon)发表了两篇论文, 统称为《通信的数学理论》, 描述并分析了一种信息传输的通用的数学模型——实际上就是我们所描述的模型. 香农证明了数据传输速率和信息压缩程度存在基本限制. 也就是说, (i) 超过某个速率, 数据传输必然变得不可靠;(ii) 低于某个数据压缩水平(即使用尽可能少的符号), 信息必然会失真.

现在, 这些发现乍一看似乎显而易见, 但如果我们稍加深入, 就会意识到它们实际上是多么迷人. 首先, 香农利用概率理论中的思想, 深入探讨了一些数学细节. 他将发送者和发射器各自建模为一个随机变量, 每次生成一个特定元素时, 都会以某个特定的概率生成该元素. 接下来, 他巧妙地制定了一种数学度量, 来衡量消息中所含信息的量, 他称之为. 换句话说, 如果我们用随机变量X表示发射器, 那么有一个函数H, 当应用于X时会得到H(X), 这就是X的熵.

这个H(X)具有非常强大的性质, 因此, 香农建立了以下有趣的事实.

  • H(X)是信息源X在不遭受不可避免失真的情况下, 数据压缩的极限度量. 换句话说, 你的信息内容或熵越高, 就越无法压缩.

  • H函数的思想可以良好地扩展, 得出一个称为互信息(mutual information)的数学表达式. 令人意外的是, 这个互信息的值是通过通道进行可靠数据传输的极限度量. 换句话说, 互信息越高, 可靠数据传输的最大速率就越大.

此外, 虽然在计算出的互信息值以上, 数据传输会变得不可靠, 但在该值以下, 任意可靠的通信水平是可以实现的. 也就是说, 可以选择在数据传输过程中允许的特定错误程度(由噪声引起), 并且总有一个低于互信息的相应速率, 使得错误恰好达到该程度. 同样, 在熵以上的任何压缩水平上, 也可以实现任意小程度的信息失真. 或许所有这些都与我们直觉上认为的不可靠性(失真程度)与速率(压缩水平)之间是连续关系的看法相悖;实际上, 对于压缩和速率都有非常明确的阈值, 超过这些阈值将导致灾难.

我们的问题解决了吗?

考虑到香农的智力成就, 我们可能会认为通信的两个基本问题已经完全解决. 不幸的是, 我们离解决这些问题还很远.大多数人并不知道, 数学家和工程师们正在积极而持续地寻找实现压缩和速率极限的方法. 确实, 了解基本极限是一回事, 而实际达到它们则是另一回事, 而后者往往更具挑战性. 同时, 数学家们常常思考利用他们众多抽象结构的新方法来表示消息或信息. 简而言之, 数学和工程界还有许多未完成的任务.

诚然, 并不是所有人都能将香农的伟大思想与其他数学家和工程师的成就相提并论. (也许有人会略感惊讶, 香农被称为信息理论之父. )尽管如此, 至少我们现在知道, 正是由于香农理论的帮助, 我们能够在一个日益迅速和不可避免的全球化浪潮的世界中, 进行如此高效和有效的沟通.

参考文献

[1] Claude Shannon (1948). A mathematical theory of communication. Bell Systems Technical Journal, vol. 27, pp. 379–423. Available for free at: http://www.alcatel-lucent.com/bstj/vol27-1948/articles/bstj27-3-379.pdf.

[2] Raymond Hill (1990). A first course in coding theory. Oxford Applied Mathematics and Computing Science Series: Oxford University Press, New York.

[3] James Gleick (2011). The information: A history, a theory, a flood. HarperCollins.

    注释
  1. [1]在概率论和信息论中, 两个随机变量的互信息(MI)度量了两个变量之间相互依赖的程度. 具体来说, 对于两个随机变量, 互信息是一个随机变量由于已知另一个随机变量而减少的“信息量”.

  2. 作者 | ALAN J.AW

    译者 | 万物有数

    原文发布于 Plus Magazine


来源:数来数趣

编辑:紫竹小筑


转载内容仅代表作者观点

不代表中科院物理所立场

如需转载请联系原公众号



相关推荐

用闲置电脑当软路由安装OpenWRT(小白教程)

话说软路由系统OpenWRT用起来真是香,里面的好多功能都是普通路由无法实现的,由于众所周知的原因,在这里就不细说,等安装完自己体验吧。今天就介绍用一台闲置的电脑(自带两个网口)充当软路由,安装Ope...

一招把废旧路由器改成交换机(用旧路由器做交换机)

家里面的路由器用个几年,就会WIFI变卡,新路由器买回来,旧路由器就没什么用了?我在这里教大家把老路由器变成交换机。近两年新出的路由器,基本都是2个LAN口,接网络设备还需要买交换机,淘汰下来的路由器...

如何将PC电脑变成web服务器:将内网主机映射到外网实现远程访问

我是艾西,今天跟大家分享内容还是比较多人问的一个问题:如何将PC电脑变成web服务器。内网主机作为web服务器,内容包括本地内网映射、多层内网映射解决方案、绕过电信80端口封锁、DDNS功能的实现(非...

电脑怎么改Wi-Fi密码(电脑怎么改wifi密码视频教程)

一.电脑打开“任意浏览器ie/google浏览器等”——>地址栏里输入管理ip地址然后按“回车键”打开该地址,如下图所示。二.输入正确的管理员密码——>点击“登录”即可(下图是PC版本的路...

旧路由器不要扔,可当电脑无线网卡使用,你还不知道吧!

家里有旧路由器,卖二手又不值钱,扔了又可惜。想不到路由器还有以下这些功能:扩大Wifi覆盖范围;充当电脑无线网卡;把这个技巧学起来,提升网络冲浪的幸福感!导航栏路由器恢复出厂设置(通用教程)有线桥接无...

硬件大师AIDA64 5.60.3716更新下载:“认准”Win10

著名硬件测试工具AIDA64更新至5.60.3716Beta版,本次更新修复了Win10Build版本号检测错误问题,识别更准确。另外还添加了对ITEIT8738F传感器、ASRock主板、NVI...

互联网病毒木马与盗版软件流量产业链(一)

A.相关地下产业链整体深度分析可能很多用户都有这样的经历,就是不管打开什么网站,甚至根本就没有打开浏览器,都会跳出来一堆的弹窗广告。那么,这个用户要么是中的病毒木马,或者是使用了盗版软件。不管是...

穿越火线tenparty.dat文件损坏怎么办?

很多玩家在玩火线的时候经常会因弹出错误代码,而被退出游戏。下面就教大家一些常见错误代码的解决方案。方法/步骤1SX提示码提示说明:您的电脑出现1,xxx,0(xxx代表任意数字)提示码,存在游...

办公小技巧015:如何关闭Windows Defender安全中心

WindowsDefenderWindowsDefender是Widows中自带杀毒软件,可以检测及清除潜藏在操作系统里的间谍软件及广告软件。为电脑提供最高强度的安全防护,也被誉为Windows的...

Win7/8.1/10团灭:微软发现严重漏洞

据外媒报道称,微软已经停止为Windows7发布新的安全更新了,理由是IE存在严重漏洞。存在严重漏洞的IE按照微软的说法,这个远程代码执行漏洞存在于IE浏览器处理脚本引擎对象的内存中。该漏洞可能以一...

WinCC flexible 2008 SP4 的安装步骤及系统要求

1、软件安装过程安装注意事项(必须严格遵守):软件仅支持以下操作系统(必须是微软原版的操作系统,Ghost版系统不支持,如番茄花园、雨林木风、电脑城装机版等):WinCCflexible2008...

Windows三方杀毒防护软件可能问题以及使用建议

在处理ECSWindows相关案例中,我们遇到很多奇怪的操作系统问题,例如软件安装失败,无法激活操作系统,无法访问本地磁盘,网络访问受到影响,系统蓝屏,系统Hang等,排查发现这与客户安装的各类杀...

杀毒软件被指泄露个人隐私(杀毒软件查出来一定是毒吗)

最近的多篇报道显示,你使用的杀毒软件在监视着你,而不仅仅是你计算机上的文件。2014年的一项研究使用虚拟机监视了杀毒软件产品向企业发送了什么信息。他们发现,所有测试的杀毒软件都给电脑分配了一个唯一的识...

开源杀毒软件ClamAV在推出约20年后终于到达1.0版本

ClamAV是一个开源的反病毒引擎,用于检测木马、病毒、恶意软件和其他恶意威胁。与商业Windows反恶意软件程序相比,它的检测水平相当低,但开发工作已经持续了几十年。该工具可用于所有平台,尽管它主要...

【Excel函数使用】时分秒时间怎么转换成秒?(二)

本节主要分享的函数是IFERROR和NUMBERVALUE上回我们用MID和FIND函数已经将数值提取出来,但是一些错误的返回值显示“#VALUE!”,此时我们需要检验错误返回值,并将错误值返回指定值...

取消回复欢迎 发表评论: