0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

浮点数在内存中的存储

Q4MP_gh_c472c21 来源:C语言与CPP编程 2020-09-20 10:52 次阅读

1 前言

我们在学习 C语言时,通常认为浮点数和小数是等价的,并没有严格区分它们的概念,这也并没有影响到我们的学习,原因就是浮点数和小数是绑定在一起的,只有小数才使用浮点格式来存储。

其实,整数和小数可以都使用定点格式来存储,也可以都使用浮点格式来存储,但实际情况却是,C 语言使用定点格式存储整数,使用浮点格式存储小数,这是在 “数值范围” 和 “数值精度” 两项重要指标之间追求平衡的结果。

2 什么是浮点数?

浮点型简单讲就是实数的意思。浮点数在计算机中用以近似表示任意某个实数。具体的说,这个实数由一个整数或定点数(即尾数)乘以某个基数(计算机中通常是 2)的整数次幂得到,这种表示方法类似于基数为 10 的科学记数法。

3 浮点数在内存中的存储

首先明确一点,无论是整型、浮点型还是字符等等数据类型在计算机底层都是以二进制的方式存储的。

浮点数在内存中的存储和整数不同,因为整数都可以转换为一一对应的二进制数据。而浮点数的存储是由符号位 (sign) + 指数位 (exponent) + 小数位 (fraction) 组成。

类型符号位指数尾数

int 和 float 同样占据四个字节的内存,但是 float 所能表示的最大值比 int 大得多,其根本原因是浮点数在内存中是以指数的方式存储。

浮点数转换到内存中存储的步骤分为如下三步:

将浮点数转换成二进制

用科学计数法表示二进制浮点数

计算指数偏移后的值

对于第3点:计算指数时需要加上偏移量(后面有介绍为什么使用偏移量),而偏移量的值与浮点数的类型有关( float 偏移量值为 127 ,double 偏移量值为 1023)。比方对于指数 6,float 与 double 类型偏移后的值分别为:

float : 127 + 6 = 133

double:1023 + 6 = 1029

4 实例

浮点数19.625用float是如何存储的:

将浮点数转换成二进制:10011.101(将 19.625 整数部分采用除 2 取余,小数部分采用乘 2 取整法);

用科学计数法表示二进制浮点数:1.0011101*2^4;

计算指数偏移后的值:127 + 4 = 131 (10000011);

拼接综上所述,float 类型的 19.625 在内存中的值为:0 - 10000011 - 001 1101 0000 0000 0000 0000。

5 float与double范围和精度

范围

float和double的范围是由指数的位数来决定的。(因为表示的时候都是1.x * 2^Y的形式,所以忽略了1.x的效果,直接取指数表示浮点数的范围)

float:

1bit(符号位) 8bits(指数位) 23bits(尾数位)

double:

1bit(符号位) 11bits(指数位) 52bits(尾数位)

于是,float的指数范围为-127~+128,而double的指数范围为-1023~+1024,并且指数位是按补码的形式来划分的。

其中负指数决定了浮点数所能表达的绝对值最小的非零数;而正指数决定了浮点数所能表达的绝对值最大的数,也即决定了浮点数的取值范围。

float的范围为-2^128 ~ +2^128,也即-3.40E+38 ~ +3.40E+38;

double的范围为-2^1024 ~ +2^1024,也即-1.79E+308 ~ +1.79E+308。

精度

float和double的精度是由尾数的位数来决定的,尾数越多能表示的小数点后面有效数字就越多,因此精度就越高。浮点数在内存中是按科学计数法来存储的,其整数部分始终是一个隐含着的“1”,由于它是不变的,故不能对精度造成影响。

float:2^23 = 8388608,一共七位,这意味着最多能有 7 位有效数字,但绝对能保证的为 6 位,也即float的精度为 6~7 位有效数字;

double:2^52 = 4503599627370496,一共 16 位,同理,double的精度为 15~16 位。

6 解剖:为什么要用偏移量的方式来计算指数?

如果不采用偏移量的方式:

8 位 2 进制数表示的有符号数范围有两个区间:0000 0000~0111 1111和1000 0000~1111 1111,分别为0~+127和-127~0。

大家看到这里的问题了吧,有两个 0 ,一个正 0 和一个负 0。

如果采用偏移量的方式:

127 转化为二进制是:0111 1111

那么

当我们要表示 -127,则有127-127即0111 1111 - 0111 1111 = 0000 0000

当我们要表示 -126,则有127-126即0111 1111 - 0111 1110 = 0000 0001

当我们要表示 -2,则有127-2即0111 1111 - 0000 0010 = 0111 1101

当我们要表示 -1,则有127-1即0111 1111 - 0000 0001 = 0111 1110

当我们要表示 0,则有0+127即0000 0000 + 0111 1111 = 0111 1111

当我们要表示 1,则有1+127即0000 0001 + 0111 1111 = 1000 0000

当我们要表示 2,则有1+127即0000 0010 + 0111 1111 = 1000 0001

当我们要表示128,则有128+127即1000 0000 + 0111 1111 = 1111 1111

由上面的例子,我们可以得出规律,采用移位存储技术,我们可以使用 8 位二进制来表示从-127~+128共计 127 个负数+零(0)+ 128 个正数总共 256 个数,看来使用移位存储既没有 +0 和 -0 的问题,又能充分使用新生成的8位二进制数最大限度的表示单精度浮点数的幂指数,是非常合理的。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 二进制
    +关注

    关注

    2

    文章

    786

    浏览量

    41577
  • C语言
    +关注

    关注

    180

    文章

    7597

    浏览量

    136035
  • 浮点数
    +关注

    关注

    0

    文章

    60

    浏览量

    15863

原文标题:浮点数的秘密

文章出处:【微信号:gh_c472c2199c88,微信公众号:嵌入式微处理器】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    TLV320AIC3106音频芯片怎么发送、接收浮点数呢?

    TLV320AIC3106 音频芯片怎么发送、接收浮点数呢?是把浮点数转成整数吗?如果是该怎么转呢? 经AD采样后得到的是整数,又该怎么转换成原始的浮点数呢?
    发表于 11-05 07:13

    labview浮点数与十六进制字符串相互转化

    与下位机数据交流及通讯时,经常有浮点数与十六进制字符串相互转化的需求,经过两天总结,找到了最简洁的相互转化的方法,萌新欢迎大佬指正,文件也附上。*附件:HEX字符串与浮点数转换.rar
    发表于 10-21 19:51

    TMS320C6745浮点数字信号处理器技术简介

    电子发烧友网站提供《TMS320C6745浮点数字信号处理器技术简介.pdf》资料免费下载
    发表于 10-09 09:34 0次下载
    TMS320C6745<b class='flag-5'>浮点数</b>字信号处理器技术简介

    分享在arduino 单片机浮点数转换位数不够,精度丢失的解决办法

    arduino由于硬件限制,浮点数只有2位小数。但经过这个函数处理可以达到7位
    的头像 发表于 08-27 14:34 538次阅读

    官方例程modbus slave rtu,浮点数精度不对是怎么回事?

    官方例程 modbus slave rtu, 浮点数精度不对,对保持寄存器设置一个浮点数,读取到的浮点数结果精度只能到小数点后两位,根本无法使用,用的是idf 5.1.2版本,开发环境是vscode。
    发表于 07-19 08:10

    请问如何打印浮点数或双精度变量?

    如何打印浮点数或双精度变量?
    发表于 07-12 08:24

    ESP8266_RTOS_SDK如何打印浮点数

    不适用于浮点数; 我的假设是编译器没有启用浮点? 如果是这种情况,我不确定要启用什么标志? 编译器版本: xtensa-lx106-elf-gcc --版本
    发表于 07-09 06:56

    如何关闭ESP32-S3的FPU浮点数计算单元?

    如何关闭ESP32-S3的FPU浮点数计算单元。如题,之前的项目在esp32s2 上面运行良好,但是移植到esp32s3上后由于fpu造成浮点数计算无法在中断中使用,并且也不能跨cpu去使用,对固件性能和稳定性造成了很大的影响
    发表于 06-27 07:32

    STM32CubeIDE printf浮点数浮点数丢失数值的原因?

    1、芯片:STM32F103C8T62、环境:STM32CubeIDE3、问题:printf浮点数浮点数数值丢失如 float A=25.6666;float B=24.7777;实际打印
    发表于 06-03 07:07

    一文带你秒懂IEEE 754浮点数

    一、简介1、常见的浮点数表示方式是IEEE754标准,它规定了浮点数存储格式和运算规则,这个标准定义了两种浮点数表示:单精度和双精度。2、任何一个
    的头像 发表于 03-18 08:09 8213次阅读
    一文带你秒懂IEEE 754<b class='flag-5'>浮点数</b>

    modbus浮点数怎么读取

    Modbus是一种通信协议,常用于工业自动化系统的设备之间的通信。它支持多种数据类型,包括整数、浮点数、字符串等。浮点数在工业领域中广泛应用,因此了解如何读取和处理Modbus浮点数
    的头像 发表于 12-28 14:38 5762次阅读

    单精度和双精度浮点数的区别

    单精度和双精度是计算机中表示浮点数的两种不同的精度。在计算机浮点数用来表示带有小数部分的实数,而单精度和双精度用来表示浮点数的精确程度不同。在以下文章
    的头像 发表于 12-15 10:25 5192次阅读

    单精度和双精度浮点数的区别

    在计算机科学和数值计算浮点数是一种用于表示实数的数据类型。浮点数有两种精度级别:单精度和双精度。这两种精度级别在表示范围、精度和存储空间等方面都有所不同。本文将详细介绍单精度和双精
    的头像 发表于 12-13 10:55 1w次阅读

    缝缝补补的浮点数进制转换器

    [浮点数]()在计算机科学是一种重要的数据类型,用于表示实数。其中,FP32和FP16是两种常见的浮点数格式,分别占用32位和16位。
    的头像 发表于 12-04 14:00 1400次阅读
    缝缝补补的<b class='flag-5'>浮点数</b>进制转换器

    请问ADSP-21469的汇编指令集ISA/VISA中有没有专门用来进行浮点数和定点数转换的指令?

    得到的ADC数据需要进行定点数浮点数的转换,为了节省开销,想使用汇编程序进行定点和浮点之间的转换。请问ADSP-21469的汇编指令集ISA/VISA中有没有专门用来进行浮点数和定
    发表于 11-29 08:03