0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

蚂蚁金服开源机器学习工具SQLFlow

电子工程师 来源:fqj 2019-05-14 11:10 次阅读

5月6日,蚂蚁金服副 CTO 胡喜正式宣布开源机器学习工具 SQLFlow:“未来三年,AI 能力会成为每一位技术人员的基本能力。我们希望通过开源 SQLFlow,降低人工智能应用的技术门槛,让技术人员调用 AI 像 SQL 一样简单。”

蚂蚁金服开源机器学习工具SQLFlow

目前,SQLFlow已经在GitHub上获得1636个Star,236个Fork。(GitHub地址:https://github.com/sql-machine-learning/sqlflow)

SQLFlow 的目标是将 SQL 引擎和 AI 引擎连接起来,让用户仅需几行 SQL 代码就能描述整个应用或者产品背后的数据流和 AI 构造。其中所涉及的 SQL 引擎包括 MySQL、Oracle、Hive、SparkSQL、Flink 等支持用 SQL 或其某个变种语言描述数据,以及描述对数据的操作的系统。而这里所指的 AI 引擎包括 TensorFlow、PyTorch 等深度学习系统,也包括 XGBoost、LibLinear、LibSVM 等传统机器学习系统。

从 SQL 到机器学习

SQLFlow 可以看作一个翻译器,它把扩展语法的 SQL 程序翻译成一个被称为 submitter 的程序,然后执行。 SQLFlow 提供一个抽象层,把各种 SQL 引擎抽象成一样的。SQLFlow 还提供一个可扩展的机制,使得大家可以插入各种翻译机制,得到基于不同 AI 引擎的 submitter 程序。

SQLFlow 对 SQL 语法的扩展意图很简单:在 SELECT 语句后面,加上一个扩展语法的 TRAIN 从句,即可实现 AI 模型的训练。或者加上一个 PREDICT 从句即可实现用现有模型做预测。这样的设计大大简化了数据分析师的学习路径。

此外,SQLFlow 也提供一些基本功能,可以供各种 submitter 翻译插件使用,用来根据数据的特点,推导如何自动地把数据转换成 features。这样用户就不需要在 TRAIN 从句里描述这个转换。

蚂蚁金服开源机器学习工具SQLFlow

以上这些设计意图在 SQLFlow 的开源代码中都有体现。当然,SQLFlow 开发时间还比较短,仍然存在很多做的不够细致的地方。蚂蚁金服将其开源的另一个目的,就是希望能够和各个 SQL 引擎团队和各个 AI 团队一起打造这座横跨数据和 AI 的桥梁。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1791

    文章

    47244

    浏览量

    238366

原文标题:蚂蚁金服开源机器学习工具SQLFlow,机器学习比SQL还简单

文章出处:【微信号:TheBigData1024,微信公众号:人工智能与大数据技术】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    时代电与中信租达成战略合作

    近日,宁德时代全资子公司——时代电科技有限公司(以下简称“时代电”)与中信金融租赁有限公司(以下简称“中信租”)正式签署了一项战略合作协议。此次合作旨在共同推动巧克力换电生态的快速发展,进一步
    的头像 发表于 12-06 11:36 613次阅读

    蚂蚁数科与浙大团队荣获NeurIPS竞赛冠军

    近日,在机器学习领域的顶级国际会议NeurIPS的特设竞赛中,蚂蚁数科旗下的摩斯联合浙江大学计算机体系结构实验室陈文智、魏成坤团队组成的“Morse ARCLab”参赛队伍凭借出色的表现,成功在激烈的竞争中脱颖而出,为中国AI技
    的头像 发表于 11-26 10:27 222次阅读

    蚂蚁集团收购边塞科技,吴翼出任强化学习实验室首席科学家

    近日,专注于模型赛道的初创企业边塞科技宣布被蚂蚁集团收购。据悉,此次交易完成后,边塞科技将保持独立运营,而原投资人已全部退出。 与此同时,蚂蚁集团近期宣布成立强化学习实验室,旨在推动大模型强化
    的头像 发表于 11-22 11:14 578次阅读

    什么是机器学习?通过机器学习方法能解决哪些问题?

    来源:Master编程树“机器学习”最初的研究动机是让计算机系统具有人的学习能力以便实现人工智能。因为没有学习能力的系统很难被认为是具有智能的。目前被广泛采用的
    的头像 发表于 11-16 01:07 396次阅读
    什么是<b class='flag-5'>机器</b><b class='flag-5'>学习</b>?通过<b class='flag-5'>机器</b><b class='flag-5'>学习</b>方法能解决哪些问题?

    “0元购”智元灵犀X1机器人,软硬件全套图纸和代码全公开!资料免费下载!

    、仿真Sim2Sim、Sim2Real代码、强化学习训练代码、模型转换、推理工具,和调试工具(数据可视化、遥控器)等等,“一站式”全套图纸和代码帮助大家更好地学习人形
    发表于 10-25 15:20

    蚂蚁数科以AI全面升级云产品

    蚂蚁数科近期宣布了一项重大战略决策,即以AI技术全面升级其云服务产品矩阵,并推出“四新”战略。蚂蚁数科副总裁余滨在公开场合表示,公司将从底层技术平台到上层运营工具进行全面升级,加速迈向AI原生时代。
    的头像 发表于 10-18 17:20 690次阅读

    蚂蚁集团创新科技总部落地北京,蚂蚁T空间启用

    近日,蚂蚁集团在北京的标志性自有园区——“蚂蚁T空间”盛大启用,这标志着蚂蚁集团的创新科技总部正式扎根北京,开启了科技与产业深度融合的新纪元。蚂蚁T空间坐落于中关村南翼这一科技创新的沃
    的头像 发表于 08-15 09:53 549次阅读

    机器学习在数据分析中的应用

    随着大数据时代的到来,数据量的爆炸性增长对数据分析提出了更高的要求。机器学习作为一种强大的工具,通过训练模型从数据中学习规律,为企业和组织提供了更高效、更准确的数据分析能力。本文将深入
    的头像 发表于 07-02 11:22 616次阅读

    深度学习与传统机器学习的对比

    在人工智能的浪潮中,机器学习和深度学习无疑是两大核心驱动力。它们各自以其独特的方式推动着技术的进步,为众多领域带来了革命性的变化。然而,尽管它们都属于机器
    的头像 发表于 07-01 11:40 1353次阅读

    蚂蚁集团高层变动:蒋国飞离职,赵闻飙接任蚂蚁数科CEO

    近日,蚂蚁集团内部发生高层人事变动。据官方消息,原蚂蚁集团副总裁、蚂蚁数科总裁蒋国飞因个人生活和工作规划需要,已正式离职。这一变动无疑给蚂蚁集团的未来发展带来了新的期待和挑战。
    的头像 发表于 06-14 09:31 866次阅读

    蚂蚁集团发布首个开源金融场景多智能体框架

    在第七届数字中国建设峰会上,蚂蚁集团宣布了一项引人注目的举措:正式开源其多智能体框架agentUniverse。这一框架不仅是金融领域的首个开源多智能体技术框架,而且为核心金融行业提供了重要的技术支撑。
    的头像 发表于 05-28 09:25 711次阅读

    Hugging Face推出开源机器人代码库LeRobot

    AI领域的佼佼者Hugging Face近日宣布重磅推出并全面开源机器人工具包——LeRobot。这一创新工具包基于史上最大规模的众包机器人数据集,为开发者提供了一个前所未有的平台。
    的头像 发表于 05-09 10:32 579次阅读

    机器学习8大调参技巧

    今天给大家一篇关于机器学习调参技巧的文章。超参数调优是机器学习例程中的基本步骤之一。该方法也称为超参数优化,需要搜索超参数的最佳配置以实现最佳性能。
    的头像 发表于 03-23 08:26 622次阅读
    <b class='flag-5'>机器</b><b class='flag-5'>学习</b>8大调参技巧

    CKB唯一一款大算力机型蚂蚁K7 ​东莞现货~蚂蚁K7-63.5T

    蚂蚁
    Rykj365
    发布于 :2024年03月08日 14:06:31

    蚂蚁集团AI研发部门开源AI Infra技术,助力大模型训练效率提升

    蚂蚁集团AI创新研发部门NextEvo近日宣布,他们将全面开源AI Infra技术,以推动AI研发效率的提升。该技术框架名为DLRover,目标在于实现大规模分布式训练的智能化。
    的头像 发表于 02-04 10:01 1074次阅读