0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

中国信通院何宝宏:开源从“通用”走向“场景化”,下一代开源正在路上

科技云报到 来源:jf_60444065 作者:jf_60444065 2023-09-25 17:09 次阅读

2021年,“开源”被首次写入国家“十四五”规划,开源凭借开放、协作、共享的特点,已成为全球软件开发和产业创新发展的主导协作模式,为信息技术高质量发展提供了强大助力。与此同时,新一代人工智能、大数据、云计算工业互联网、区块链等技术领域正结合开源,呈现出技术与产业协同共进共融的态势。

如今,通过开源开放模式加速信息产业生态共建已经成为业界共识。2023年9月21日,由中国信息通信研究院(以下简称“中国信通院”)和中国通信标准化协会联合主办的“2023 OSCAR开源产业大会”在北京举行。会上,中国信通院云计算与大数据研究所所长何宝宏首次与业界分享对下一代开源的最新见解与观点。

wKgZomURTg2APY6jAAD7UkqvdkE427.png

开源拒绝重演“公地悲剧” 25年来取得巨大成功

25年来,开源以“违反”经济学基本原理的方式,以共享代码的方式大规模生产“数字公共品”。然而,在开源领域,经济学中的“公地悲剧”并没有出现。“公地悲剧”是一个经典的经济学问题,描述了个体在追求自身利益的过程中,导致公共资源过度使用和衰退的现象。

互联网的快速发展正是得益于开源的成功。从早期的操作系统Linux、安全通信OpenSSL、数据库My SQL、门户工具Apache、排版引擎Webkit,到近年来的手持终端Android网络Open Daylight、云计算Open Stack、大数据Hadoop、容器Docker以及AI深度学习领域的TensorFlow和PyTorch等,这些借助开源互联网而起的开源软件,今日又成了互联网的基石。可以说,互联网与开源同根同源、相伴相生,既是Internet over Open Source,也是Open Source over Internet。

目前,开源许可协议类型有2700多种,主要差异性体现在对分发衍生软件的限制不同。在全球活跃度的前1000个开源软件中,超过60%使用MIT、Apache 2.0以及BSD宽松型许可协议。

何宝宏指出,如今开源已取得巨大成功。从生态规模看,全球开源生态成熟繁荣,全球开源软件项目高速增长,覆盖当前主流技术领域,全球开源贡献者储备规模庞大。从行业应用看,全球行业开源逐步兴起,各行业应用开源模式建立产业开放供应链,提升生产效能。此外,开源模式正在引领科技实现越来越多的突破。

开源许可协议面临新环境 从“通用开源”走向“场景化开源”

多年来,开源促进组织OSI(Open Source Initiative)维护着对开源的定义(OSD),以及其认可的开源许可协议列表,目标是促进和保护开源软件及开源社区。一切不满足OSI所规定的全部十条要求的开放许可协议,都会被开源权威机构OSI认为是“非典型性”开源。

开源许可协议从最早的GPL开始, 逐渐演进到GPLv2和v3,中间还有Apache、MPL、AGPL、LGPL等,但是近几年来有一批新的许可协议出现,引起了社区的一些激烈的讨论。这些新的许可协议包括BSL、SSPL、Elastic以及一个比较特殊的附加条款Commons Clause。

但OSI的这10大原则,诞生于20多年前,聚焦的是软件代码,更多是关于软件产品,属于通用开源范畴。近年来,开源的这一经典定义面临着新的挑战与重构,尤其是来自云计算、大数据、大模型和AIGC的挑战,让开源早已不在局限于通用领域,更多转向聚焦于数据、服务等场景化开源。

wKgZomURThuARsMKAACoHffBN9U584.png

如今,云计算已经催生了一批“非典型性”开源许可协议。早期的开源许可协议,未涉及到云服务场景的分发形式。市场现实是云厂商基于开源技术推出云服务,但贡献甚少。于是,一批开源项目修改了开源协议,比如限制云服务模式的SSPL许可协议。

随着大数据尤其是数据资产化,开放数据和数据流通成为一种新“开源”模式。数据通常是事实和信息的表达,而版权通常适用于原创创作的表达形式,版权通常不适用于数据资产。

AI大模型涉及的开放许可证类型更为复杂。仅Hugging Face上开源的人工智能模型就超过28万,涉及66个开源协议,大致可以分为三类。第一类是通用开源软件许可协议,比如Apache 2.0/GPL 3.0/MPL 2.0;第二类是知识共享许可协议,比如CC-BY-4.0;第三类是人工智能大模型开源许可协议,比如Llama/OpenRail等。

相对OSI经典的开源定义,开源AI大模型都会对“古典”开源的定义做成新限制,多为用途和生成内容的输出。对于AIGC,更是存在新的争议,比如:AIGC生成的代码,可否参与开源贡献?目前各方对此类问题试图进行规范,比如:

2023年3月,美国版权局发布《AI版权认定声明及登记指引》,纯AIGC作品不受版权法保护,进行版权登记时需要披露AIGC部分。Apache基金会发布《第三方许可政策》,提出“AIGC的条款与开源定义保持一致”贡献者注明创建贡献时使用的工具,例如包含“Generated-by”。

事实上,AIGC涉及的版权和开放许可,还未形成广泛共识。何宝宏指出,开放许可协议的基石可分为几个阶段:软件著作权—>著作权—>知识产权—>知识产权+。涉及到开放数据和开源大模型许可协议,更需要考虑使用场景、商业收益和科技伦理问题。

迎接下一代开源 需与现实世界适配

当软件从产品成为服务,当开放的对象从代码延展到数据和模型,当开放许可的法律基础从版权延展所有权,当代码生成主体从自然人的程序员延展到AIGC,当开源与现实中的法规制度、隐私保护和科技伦理日益密切时,下一代开源将向何处去?

开源软件促进会OSI(open source initiative)对于开源提出了十个条款,包括:自由再发布、源代码公开、允许派生作品、作者源代码完整性、不能歧视任何个人或团体、不能歧视任何领域、许可协议的发布、许可协议不能只针对某个产品、许可协议不能约束其他软件、许可协议必须独立于技术。

wKgaomURTimAFPciAADoGnLdlSw798.png

目前,OSI已启动Open Source AI的定义讨论工作,定义了开放数据和人工智能系统的基本原则,涉及数据安全、版权所属、监管要求、道德伦理、责任认定等多个方面。

总体而言,何宝宏认为,下一代开源需要从两方面进行规范:一方面,开源应该与现实社会深度融合,遵守现实治理规则,如:监测统计、自律公约、责任边界、安全防护;另一方面,开源的发展也需要跟随社会长期性和周期性的发展规律。

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 开源
    +关注

    关注

    3

    文章

    3349

    浏览量

    42501
收藏 人收藏

    评论

    相关推荐

    2024开源和软件安全沙龙启幕,基调听云加入3S-Lab软件供应链安全实验室

    12月19日由中国通信标准化协会主办、中国信息通信研究(以下简称"中国信")承办的2024开源
    的头像 发表于 12-25 15:19 92次阅读
    2024<b class='flag-5'>开源</b>和软件安全沙龙启幕,基调听云加入3S-Lab软件供应链安全实验室

    开源鸿蒙应用案例重磅发布

    开放原子开发者大会暨首届开源技术学术大会开幕式上,发布了开源应用案例,向各界展示开源商业发展与实践成果。
    的头像 发表于 12-23 11:32 258次阅读

    开源能带我们走向何方

    开源大模型、开源数据库、开源框架、开源硬件......近些年,这些词汇不绝于耳。雷军说,好的代码像诗样优美,自己大二时写的代码就已经
    的头像 发表于 12-06 17:09 443次阅读

    下一代机器人技术:工业自动的五大趋势

    随着人工智能(AI)技术的迅猛发展和全球制造业的转型升级,下一代机器人技术正在引领工业自动领域的新轮变革。这些变革不仅深刻影响着生产模式,还为企业带来了前所未有的机遇和挑战。
    的头像 发表于 10-23 15:52 652次阅读

    deepin社区亮相2024 OSCAR开源产业大会

    近日,由中国通信标准化协会主办,中国信息通信研究承办的的“2024 OSCAR开源产业大会”在北京隆重开幕。本次大会旨在搭建专业平台,广纳产研智慧,扎实
    的头像 发表于 10-18 13:44 376次阅读

    中国信发布“2024云计算十大关键词”

    据研究所所长在会上对“2024云计算十大关键词”进行了解读。中国信云大所
    的头像 发表于 08-02 08:28 633次阅读
    <b class='flag-5'>中国信</b>通<b class='flag-5'>院</b>发布“2024云计算十大关键词”

    RISC-V在中国的发展机遇有哪些场景

    RISC-V在中国的发展机遇广泛存在于多个场景,这主要得益于其开源、开放、简洁、灵活等特性,以及中国作为全球最大的数据大国和信息技术市场的重要地位。以下是
    发表于 07-29 17:14

    中海科技与中国信云大所签署战略合作协议

    近日,中海企业发展集团有限公司旗下的科技先锋——深圳海智创科技有限公司(简称“中海科技”),与中国信息通信研究云计算与大数据研究所(简称“中国信云大所”)在北京正式签署战略合作协
    的头像 发表于 07-18 14:19 498次阅读

    24芯M16插头在下一代技术中的潜力

      德索工程师说道随着科技的飞速发展,下一代技术正逐渐展现出其独特的魅力和潜力。在这背景下,24芯M16插头作为种高性能、多功能的连接器,将在下一代技术中发挥至关重要的作用。以下是
    的头像 发表于 06-15 18:03 339次阅读
    24芯M16插头在<b class='flag-5'>下一代</b>技术中的潜力

    业界首个云多芯迁移标准 中国信联合浪潮云海发布

    北京2024年5月11日 /美通社/ -- 近日,中国信息通信研究(简称中国信)与浪潮云海等多家产业单位共同发布了《云多芯迁移能力要
    的头像 发表于 05-13 17:16 370次阅读
    业界首个<b class='flag-5'>一</b>云多芯迁移标准 <b class='flag-5'>中国信</b>通<b class='flag-5'>院</b>联合浪潮云海发布

    北京开源芯片研究正式加入甲辰计划!

    北京开源芯片研究正式加入甲辰计划,致力于在下一个丙辰年(2036龙年)之前,基于RISC-V实现从数据中心到桌面办公、移动穿戴到智能物联网全信息产业覆盖的开放标准体系及
    的头像 发表于 05-10 08:33 749次阅读
    北京<b class='flag-5'>开源</b>芯片研究<b class='flag-5'>院</b>正式加入甲辰计划!

    DPU技术赋能下一代AI算力基础设施

    4月19日,在以“重构世界 奔赴未来”为主题的2024中国生成式AI大会上,中科驭数作为DPU新型算力基础设施代表,受邀出席了中国智算中心创新论坛,发表了题为《以网络为中心的AI算力底座构建之路》主题演讲,勾勒出在通往AGI之路上
    的头像 发表于 04-20 11:31 854次阅读

    使用NVIDIA Holoscan for Media构建下一代直播媒体应用

    NVIDIA Holoscan for Media 现已向所有希望在完全可重复使用的集群上构建下一代直播媒体应用的开发者开放。
    的头像 发表于 04-16 14:04 674次阅读

    大众新车疑似“比亚迪汉DM-i”谍照曝光,或为下一代帕萨特

    Carscoops摄影师推断,这款新车专为中国市场打造,极有可能成为下一代中国规格的帕萨特或辉昂。造型上看,新车采用大型进气格栅,两侧设有导流槽,与刚在海外亮相的新
    的头像 发表于 03-14 16:14 778次阅读

    烽火通信在MWC 2024展示基于下一代PON和Wi-Fi7的全光接入网

    在全球数字浪潮中,烽火通信在2024年的世界移动通信大会(MWC)上引领了下一代网络技术的新潮流。该公司展示了基于下一代PON和Wi-Fi7技术的新一代全光接入网,为未来的万兆智能时
    的头像 发表于 03-01 09:51 1036次阅读