资料介绍
软件简介
OpenMLDB是一个面向机器学习应用提供正确、高效数据供给的开源数据库。除了超过10倍的机器学习数据开发效率的提升,OpenMLDB也提供了统一的计算与存储引擎减少开发运维的复杂性与总体成本。
系统特性
-
一致性
OpenMLDB首先保证在线和离线特征计算一致性,科学家使用OpenMLDB建模生成的特征,可规避特征穿越等问题,上线后使用相同LLVM IR进行编译优化,保证与在线特征计算逻辑一致。其次保证数据存储一致性,数据从离线到在线进行实时同步,用户不需要为离线和在线管理不同数据源,也避免数据不一致对特征和模型带来的影响。
-
高性能
OpenMLDB基于C++和LLVM实现了原生SQL编译器,内置了数十种物理计划和表达式优化过程,可针对不同硬件环境动态生成二进制码,内存结构针对特征存储优化。最终特征存储空间和成本比同类产品可降低9倍,在线实时特征计算性能提升9倍,离线批处理计算性能比同类产品也提升6倍以上。
-
高可用
OpenMLDB的大规模并行计算服务和数据库存储服务,都支持多节点分布式高可用特性,可以自动Failover避免单点故障。
-
SQL支持
OpenMLDB支持用户友好的SQL接口,兼容大部分ANSI SQL语法以及针对AI场景拓展了新的SQL特性。以时序特征抽取为例,支持标准SQL的Over Window语法,还针对AI场景需求进行拓展,支持基于样本表滑窗的Window Union语法,实时计算引擎支持基于当前行的Request Mode窗口聚合计算。
-
AI优化
OpenMLDB以面向ML应用开发优化为目标,架构设计以及实现上都针对AI进行大量优化。在存储方面以高效的数据结构存储特征数据,无论是内存利用率还是实时查询效率都比同类型产品高数倍,而计算方面提供了机器学习场景常用的特殊拼表操作以及特征抽取相关UDF/UDAF支持,基本满足生产环境下机器学习特征抽取和上线的应用需求。
-
低门槛
OpenMLDB使用门槛与普通数据库接近,无论是建模科学家还是应用开发者都可以使用熟悉的SQL进行开发,并且同时支持ML应用落地所必须的离线大数据批处理服务以及在线特征计算服务,使用一个数据库产品就可以低成本实现AI落地闭环。
快速开始
使用OpenMLDB快速开发和上线ML应用,以Kaggle比赛Predict Taxi Tour Duration项目为例。
# 启动docker镜像 docker run -it 4pdosc/openmldb:0.1.0 bash # 初始化环境 sh init.sh # 导入行程历史数据到OpenMLDB python3 import.py # 使用行程数据进行模型训练 python3 train.py ./fe.sql /tmp/model.txt # 使用训练的模型搭建链接OpenMLDB的实时推理HTTP服务 sh start_predict_server.sh ./fe.sql 8887 /tmp/model.txt # 通过http请求发送一个推理请求 python3 predict.py
系统架构
- 面向机器学习的高可用、高并发数据库:OpenMLDB 0次下载
- ACS数据库与RSC数据库比较研究
- 面向NoSQL数据库的JSON文档异常检测模型 20次下载
- 创建新的数据库和更改SQL Server CE数据库中的数据操作教程免费下载 5次下载
- 数据库教程之数据库的设计过程资料说明 10次下载
- 数据库学习入门资料之关系数据库标准语言SQL的详细资料概述 20次下载
- 数据库学习教程之数据库的发展状况如何数据库有什么新发展 5次下载
- 数据库学习入门资料之如何进行数据库设计 14次下载
- 数据库教程之数据库的创建与管理详细资料免费下载 18次下载
- 数据库教程之如何进行数据库设计 21次下载
- 如何进行数据库设计?数据库设计介绍和需求分析及结构设计资料概述 0次下载
- 数据库学习入门之如何进行数据库设计详细分析概述资料免费下载 14次下载
- 基于面向对象数据库的CIM应用曹帅 0次下载
- 面向对象数据库的关键技术和实现
- 基于面向对象的GIS数据库的构建技术
- 数据库优化那些事 462次阅读
- 什么是数据库 1190次阅读
- MongoDB开源文档数据库的安装 965次阅读
- 常见的数据库管理 1916次阅读
- 云数据库和自建数据库的区别及应用 4412次阅读
- 关于数据库安全技术的概述 1785次阅读
- 一文看懂数据库原理与应用 11.7w次阅读
- 数据库引擎是什么 1.1w次阅读
- 常用的数据库引擎有哪些_数据库引擎分类 2.1w次阅读
- 多维数据库有哪些 7031次阅读
- 什么是数据库技术_数据库技术的基础知识 1.3w次阅读
- 目前流行的数据库_构建数据库系统的流程 7076次阅读
- 数据库的基本概念和应用领域 2781次阅读
- 机器学习与数据挖掘的关系 4186次阅读
- SQL Server数据库学习总结 4577次阅读
下载排行
本周
- 1山景DSP芯片AP8248A2数据手册
- 1.06 MB | 532次下载 | 免费
- 2RK3399完整板原理图(支持平板,盒子VR)
- 3.28 MB | 339次下载 | 免费
- 3TC358743XBG评估板参考手册
- 1.36 MB | 330次下载 | 免费
- 4DFM软件使用教程
- 0.84 MB | 295次下载 | 免费
- 5元宇宙深度解析—未来的未来-风口还是泡沫
- 6.40 MB | 227次下载 | 免费
- 6迪文DGUS开发指南
- 31.67 MB | 194次下载 | 免费
- 7元宇宙底层硬件系列报告
- 13.42 MB | 182次下载 | 免费
- 8FP5207XR-G1中文应用手册
- 1.09 MB | 178次下载 | 免费
本月
- 1OrCAD10.5下载OrCAD10.5中文版软件
- 0.00 MB | 234315次下载 | 免费
- 2555集成电路应用800例(新编版)
- 0.00 MB | 33566次下载 | 免费
- 3接口电路图大全
- 未知 | 30323次下载 | 免费
- 4开关电源设计实例指南
- 未知 | 21549次下载 | 免费
- 5电气工程师手册免费下载(新编第二版pdf电子书)
- 0.00 MB | 15349次下载 | 免费
- 6数字电路基础pdf(下载)
- 未知 | 13750次下载 | 免费
- 7电子制作实例集锦 下载
- 未知 | 8113次下载 | 免费
- 8《LED驱动电路设计》 温德尔著
- 0.00 MB | 6656次下载 | 免费
总榜
- 1matlab软件下载入口
- 未知 | 935054次下载 | 免费
- 2protel99se软件下载(可英文版转中文版)
- 78.1 MB | 537798次下载 | 免费
- 3MATLAB 7.1 下载 (含软件介绍)
- 未知 | 420027次下载 | 免费
- 4OrCAD10.5下载OrCAD10.5中文版软件
- 0.00 MB | 234315次下载 | 免费
- 5Altium DXP2002下载入口
- 未知 | 233046次下载 | 免费
- 6电路仿真软件multisim 10.0免费下载
- 340992 | 191187次下载 | 免费
- 7十天学会AVR单片机与C语言视频教程 下载
- 158M | 183279次下载 | 免费
- 8proe5.0野火版下载(中文版免费下载)
- 未知 | 138040次下载 | 免费
评论
查看更多