0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

毕昇Fortran编译器内联动态库函数str_copy

openEuler 来源:openEuler 作者:openEuler 2022-09-21 11:35 次阅读

项目简介

项目名称

毕昇Fortran编译器内联动态库函数str_copy

项目描述

毕昇Fortran编译器是一款基于classic flang的高性能Fortran编译器,支持Fortran编程语言的编译和运行,提供强大的数值计算和数据处理能力,在科学计算领域应用前景广阔。f90_str_copy_klen是一个实现字符串拷贝功能的动态库函数,本项目是对该动态库函数进行内联,预期提高编译器字符串拷贝的性能。

项目导师

peixin-qiao

项目开发者

王哲葳,华东师范大学硕士在读

项目链接

https://summer-ospp.ac.cn/#/org/prodetail/22b970386

开发详情

方案描述

Flang编译器主要由flang1和flang2两个组件组成,其中flang1用于解析Fortran代码并生成中间表示,然后通过flang2生成LLVM IR并输出。本项目的主要任务就是在flang2中对解析出的“f90_str_copy_klen”函数进行内联优化。这个项目的方案分为如下几步:

01

flang2会获得通过Fortran生成的IR指令列表,遍历该列表,寻找到函数调用指令“I_CALL”。

02

通过“I_CALL”指令的位置查询所调用的是否为需要被内联的函数,如本项目需要实现的“f90_str_copy_klen”函数的内联。在确认需要内联的函数后开始生成相应的指令,“f90_str_copy_klen”函数的内联指令生成过程如下:

  1. 将复制后得到的字符串称为目标字符串,待复制的字符串称为输入字符串。首先需要从原先的指令中获得输入字符串并开辟一系列内存空间用于记录目标字符串、输入字符串的起始地址、字符串索引及字符串长度。

  2. 对每一个输入字符串,从头开始遍历。分别判断当前目标字符串、输入字符串的索引是否小于其长度,如果均符合则将输入字符串中对应索引的字符复制到目标字符串的相应地址中。如果输入字符串索引大于等于其长度则处理下一个输入字符串。如果目标字符串索引大于等于其长度则停止字符串的复制。

  3. 按照2所述流程依次遍历函数中的输入字符串,直至所有字符串都完成复制。

  4. 目标字符串索引是否仍小于其长度,若是,则将目标字符串中剩余未被赋值的字符用空格进行补充。

  5. 将实现上述功能的指令替换掉对应的“I_CALL”指令。

03

继续flang2中的流程以生成对应的LLVM IR 文件。

项目产出

实现了项目方案中所需的功能。

分别用一个字符串、三个字符串作为输入字符串,完成了共十种输入字符串各种长度情况下”f90_str_copy_klen”函数内联的的功能性测试,在这些输入字符串中也包含了一些ASCII码小于32(ASCII码为32表示空格)的特殊字符。十种情况如下:

  • a=b

  1. len(a) < len(b)
  2. len(a) = len(b)
  3. len(a) > len(b)
  • a = b // c // d

  1. len(a) < len(b)
  2. len(a) = len(b)
  3. len(b) < len(a) < len(b) + len(c)
  4. len(a) = len(b) + len(c)
  5. len(b) + len(c) < len(a) < len(b) + len(c) + len(d)
  6. len(a) = len(b) + len(c) + len(d)
  7. len(a) > len(b) + len(c) + len(d)

将“f90_str_copy_klen”在函数中调用一亿次,对内联前后所花费的时间做对比。实验结果显示没有内联时运行花费的时间约为10秒,内联后运行花费的时间约为0.7秒。

  • 测试代码如下:
    主函数:main.f90

    programmain
    integer::i
    character(20)::a,b,c,d
    a="aaaaaaaaaaaaaaa"
    b="aaaaaaaaaaaaaaa"
    c="aaaaaaaaaaaaaaa"
    doi=1,100000000
    calltest(a,b,c,d,20)
    enddo
    end
    

    字符串拼接拷贝函数:test.f90

    subroutinetest(a,b,c,d,n)
    integer::n
    character(n)::a,b,c,d
    d=a//b//c
    endsubroutine
    
  • 测试方法如下:
    未优化前:

    $flangmain.f90-c
    $flangtest.f90-O3-c
    $flangmain.otest.o-oa.out
    $time./a.out
    

    real0m10.190s
    user0m10.180s
    sys0m0.004s

    优化之后(编译选项-Mx,218,0x1使能该优化功能)

    $flangmain.f90-c
    $flangtest.f90-O3–c–Mx,218,0x1
    $flangmain.otest.o-oa.out
    $time./a.out
    

    real0m0.706s
    user0m0.702s
    sys0m0.004s

审核编辑 :李倩


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 函数
    +关注

    关注

    3

    文章

    4273

    浏览量

    62290
  • 编译器
    +关注

    关注

    1

    文章

    1614

    浏览量

    49002
  • Fortran
    +关注

    关注

    1

    文章

    7

    浏览量

    7638

原文标题:开源之夏 | 【结项报告】毕昇Fortran编译器内联动态库函数str_copy

文章出处:【微信号:openEulercommunity,微信公众号:openEuler】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    C7000优化C/C++编译器

    电子发烧友网站提供《C7000优化C/C++编译器.pdf》资料免费下载
    发表于 10-30 09:45 0次下载
    C7000优化C/C++<b class='flag-5'>编译器</b>

    Keil编译器优化方法

    我们都知道,代码是可以通过编译器优化的,有的时候,为了提高运行速度或者减少代码尺寸,会开启优化选项。
    的头像 发表于 10-23 16:35 174次阅读
    Keil<b class='flag-5'>编译器</b>优化方法

    AI编译器技术剖析

    随着人工智能技术的飞速发展,AI编译器作为一种新兴的编译技术逐渐进入人们的视野。AI编译器不仅具备传统编译器的功能,如将高级语言编写的源代码转换为机器可执行的代码,还融入了人工智能技术
    的头像 发表于 07-17 18:28 1379次阅读

    人工智能编译器与传统编译器的区别

    人工智能编译器(AI编译器)与传统编译器在多个方面存在显著的差异。这些差异主要体现在设计目标、功能特性、优化策略、适用范围以及技术复杂性等方面。以下是对两者区别的详细探讨,旨在全面解析其内在差异。
    的头像 发表于 07-17 18:19 1556次阅读

    Meta发布基于Code Llama的LLM编译器

    近日,科技巨头Meta在其X平台上正式宣布推出了一款革命性的LLM编译器,这一模型家族基于Meta Code Llama构建,并融合了先进的代码优化和编译器功能。LLM编译器的推出,标志着Meta在人工智能领域的又一重大突破,将
    的头像 发表于 06-29 17:54 1406次阅读

    IDF4.2.1的编译器优化bug导致panic怎么处理?

    == 0) && (status.st_utx_out == 0));} 它是一个inline函数。我们都认为inline关键字,会告诉编译器内联函数,于是它的代码
    发表于 06-21 10:55

    大模型应用开发平台+浪潮信息AIStation,让大模型定制更简单

    北京2024年6月5日 /美通社/ -- 近日,大模型应用开发平台与浪潮信息AIStation智能业务生产创新平台完成兼容性互认证。基于和浪潮信息AIStation,用户通过预
    的头像 发表于 06-05 11:58 367次阅读
    <b class='flag-5'>毕</b><b class='flag-5'>昇</b>大模型应用开发平台+浪潮信息AIStation,让大模型定制更简单

    SEGGER编译器优化和安全技术介绍 支持最新C和C++语言

    SEGGER编译器是专门为ARM和RISC-V微控制设计的优化C/C++编译器。它建立在强大的Clang前端上,支持最新的C和C++语言功能。 除其他外,其主要功能包括: 1) 尺寸优化:通过调整
    的头像 发表于 06-04 15:31 1331次阅读
    SEGGER<b class='flag-5'>编译器</b>优化和安全技术介绍 支持最新C和C++语言

    C语言:嵌入式开发中的关键编译器角色

    嵌入式程序开发跟硬件密切相关,需要使用C语言来读写底层寄存、存取数据、控制硬件等,C语言和硬件之间由编译器来联系,一些C标准不支持的硬件特性操作,由编译器提供。
    发表于 04-26 14:53 496次阅读
    C语言:嵌入式开发中的关键<b class='flag-5'>编译器</b>角色

    QT开发学习笔记1(安装交叉编译器

    QT安装交叉编译器
    的头像 发表于 02-18 10:02 822次阅读
    QT开发学习笔记1(安装交叉<b class='flag-5'>编译器</b>)

    lsl文件中将text段copy到ram,编译器具体是如何实现的?

    lsl文件中,将text段copy到ram,编译器具体是如何实现的?
    发表于 02-02 07:23

    华为举办鸿蒙生态千帆启航仪式,余承东公布HarmonyOS NEXT开放申请

    据余承东介绍,为实现核心竞争力的突破,华为通过多年的努力构建出一套包含鸿蒙内核、ArkTS/仓颉编程语言、方舟编译器/编译器、ArkUI以及盘古AI大模型等在内的完整生态体系。
    的头像 发表于 01-19 09:34 785次阅读

    Triton编译器的原理和性能

    Triton是一种用于编写高效自定义深度学习原语的语言和编译器。Triton的目的是提供一个开源环境,以比CUDA更高的生产力编写快速代码,但也比其他现有DSL具有更大的灵活性。Triton已被采用
    的头像 发表于 12-16 11:22 2582次阅读
    Triton<b class='flag-5'>编译器</b>的原理和性能

    TVM编译器的整体架构和基本方法

    有将近两个月没有学习一些新东西,更新一下博客了。一直在忙公司的一个项目,是做一款支持LSTM和RNN的通用架构加速IP。自己恰好负责指令编译工作,虽然开始的指令比较粗糙,没有一套完整的编译器架构
    的头像 发表于 11-30 09:36 2168次阅读
    TVM<b class='flag-5'>编译器</b>的整体架构和基本方法

    编译器的优化选项

    一个程序首先要保证正确性,在保证正确性的基础上,性能也是一个重要的考量。要编写高性能的程序,第一,必须选择合适的算法和数据结构;第二,应该编写编译器能够有效优化以转换成高效可执行代码的源代码,要做到
    的头像 发表于 11-24 15:37 828次阅读
    <b class='flag-5'>编译器</b>的优化选项