0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

大数据:数据科学家需要知道十个好用的Python库

如意 来源:今日头条 作者:星云鹤峰 2020-08-08 08:41 次阅读

Python是比较流行和广为人知的编程语言之一,它已取代了业界的许多编程语言。它是数据科学专业人士比较喜欢使用的编程语言之一,因为它拥有庞大的库。

Python因其简单易用而被称为初学者级编程语言,它的编程语法易于学习,并且与C,Java和C ++相比具有较高的水平。

为了获得更准确的算法和编码,Analytics Insight给出前10个Python库

PyTorch

Pytorch是一个开源库,它基本上替代了Numpy。 PyTorch带有高级功能,可用于构建深度神经网络。数据科学专业人士仍然可以使用其他语言,例如scipy,Cython和numpy,这些语言可在需要时帮助扩展PyTorch。 Pytorch被包括Facebook,Twitter,Nvidia,Uber在内的许多组织所使用,用于快速建立研究原型并训练深度学习模型。

GitHub:https://github.com/pytorch/pytorch

Arrow

Arrow是一个人类友好的Python库,它提供了诸如对日期,时间和时间戳进行转换,操纵,创建和格式化的功能。它支持Python 2和3,它是DateTime的替代方法,它具有更好的界面,以促进丰富的功能。

GitHub:https://github.com/crsmithdev/arrow

IPython

这是最有用的python工具之一,为用户提供了丰富的体系结构。使用IPython,用户可以在其浏览器中编写和执行python代码。 Ipython可在多种操作系统上运行,包括Windows,Mac OS X,Linux和大多数其他Unix OS。 Ipython为用户提供了更多功能,包括帮助功能,高级编辑等。

GitHub:https://github.com/ipython/ipython

TensorFlow

Tensor flow是由Google Brain团队创建的开源机器学习python库。 Tensor流库用于开发,训练和设计深度学习模型,并且可以用于进行数值计算。 Tensor Flow是Theano的替代产品,它可以在移动设备,单CPU系统和GPU上运行。

GitHub:https://github.com/tensorflow/tensorflow

Caffe2

Caffe2是将Caffe框架带入现代世界的尝试。它支持分布式培训,甚至可以在移动平台中进行部署。虽然PyTorch可能更适合研究,但Caffe2适合进行大规模部署,如Facebook上所示。

GitHub:https://github.com/caffe2/caffe2

Scrapy

Scrappy是一个广泛使用的Python Web抓取库。 Scrappy最初用于创建爬网程序,ands 则专门用于抓取,如其名称所示。现在它用于多种用途,包括数据挖掘,自动化测试等。scrapy是开源的,必须具有库。

GitHub:https://github.com/scrapy/scrapy

Requests

Requests是著名的Python库之一,该库在Apache2下获得许可并用Python编写。该库可帮助用户与多种语言进行交互。借助Requests库,用户可以手动将字符串串接到其URL。他们可以使用Request 库将HTTP请求发送到服务器,并且可以添加表单数据,内容(如标头,多部分文件等)。

GitHub:https://github.com/requests/requests

Zappa

Zappa是由Miserlou创建的比较好的python软件包之一,它很容易在API Gateway和Amazon Web Services Lambda上构建和实现无服务器应用程序。由于AWS自动处理水平扩展,因此没有请求会超时。使用Zappa,您可以使用Zappa在一行中更新代码。

GitHub:https://github.com/Miserlou/Zappa

Flashtext

FlashText是更好的选择,它的优点包括,无论用户有多少个搜索词,其运行时间都是相同的,而regexp则相反,运行时间几乎随词的数量线性增加。

GitHub:https://github.com/vi3k6i5/flashtext

Fire

Fire是一个开源库,可以为任何Python项目自动生成命令行(CLI)。用户几乎不需要编写任何代码或文档字符串来构建其CLI!他们只需要调用Fire方法并将其传递给CLI的任何方法传递给它:函数,对象,类,字典,甚至根本不传递任何参数,这会将整个代码转换为CLI 。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • python
    +关注

    关注

    56

    文章

    4797

    浏览量

    84689
  • 大数据
    +关注

    关注

    64

    文章

    8889

    浏览量

    137443
  • 数据科学
    +关注

    关注

    0

    文章

    165

    浏览量

    10059
收藏 人收藏

    评论

    相关推荐

    数据库事件触发的设置和应用

    数据库无论对于生产管理还是很多的实际应用都非常重要。小编这次聊一下数据库事件触发的应用。示例使用了postgresql和Python
    的头像 发表于 12-13 15:14 137次阅读

    西湖大学:科学家+AI,科研新范式的样本

    研究,创新科研新范式。这一点在西湖大学的科研项目中已得到体现。 成立于2018年的西湖大学是由施一公院士领衔创办的、聚焦前沿科学研究的研究型大学,该校鼓励科学家们探索AI与各学科交叉融合,为科研创新提速。为此,西湖大学在浪潮信息等企业助力下打造
    的头像 发表于 12-12 15:59 165次阅读
    西湖大学:<b class='flag-5'>科学家</b>+AI,科研新范式的样本

    数据库数据恢复—通过拼接数据库碎片恢复SQLserver数据库

    运行在存储上的SQLServer数据库,有1000多个文件,大小几TB。数据库每10天生成一NDF文件,每个NDF几百GB大小。
    的头像 发表于 10-31 13:21 225次阅读
    <b class='flag-5'>数据库</b><b class='flag-5'>数据</b>恢复—通过拼接<b class='flag-5'>数据库</b>碎片恢复SQLserver<b class='flag-5'>数据库</b>

    Python解析:通过实现代理请求与数据抓取

    Python中,有多个可以帮助你实现代理请求和数据抓取。这些提供了丰富的功能和灵活的API,使得你可以轻松地发送HTTP请求、处理响应、解析HTML/XML/JSON
    的头像 发表于 10-24 07:54 174次阅读

    AI for Science:人工智能驱动科学创新》第4章-AI与生命科学读后感

    了传统学科界限,使得科学家们能够从更加全面和深入的角度理解生命的奥秘。同时,AI技术的引入也催生了一种全新的科学研究范式,即数据驱动的研究范式,这种范式强调从大量数据中提取有价值的信息
    发表于 10-14 09:21

    《AI for Science:人工智能驱动科学创新》第一章人工智能驱动的科学创新学习心得

    如何激发科学家的创新思维。AI不仅仅是工具,更是一种思维方式,它鼓励我们跳出传统框架,以数据为驱动,探索未知。这种思维方式的转变,不仅促进了科学方法的革新,也为解决全球性挑战提供了新的视角和途径
    发表于 10-14 09:12

    贴片电容型号除了要知道参数规格外还有哪些要知道

    在选择贴片电容型号时,除了要知道其参数规格(如尺寸、容量、电压、精度等)外,还需要考虑以下几个方面。
    的头像 发表于 09-21 14:58 300次阅读

    新华社:突破性成果!祝贺我国科学家成功研发这一传感器!

    6月25日,新华社以《突破性成果!祝贺我国科学家》为标题,报道了由我国科学家研发的传感器成果。 我国科学家研发高通道神经探针实现猕猴全脑尺度神经活动监测 神经探针是一种用来记录神经活动的针状电传
    的头像 发表于 06-27 18:03 497次阅读
    新华社:突破性成果!祝贺我国<b class='flag-5'>科学家</b>成功研发这一传感器!

    前OpenAI首席科学家创办新的AI公司

    消息在业界引起了广泛关注,因为苏茨克维曾是OpenAI的联合创始人及首席科学家,并在去年在OpenAI董事会上扮演了重要角色。
    的头像 发表于 06-21 10:42 525次阅读

    stm32wb55在串口发送大量数据时BLE会大概率断开连接,为什么?

    DMA发送,中断方式也试过了,都会影响 测试发现如果只发几十个字节则没有问题。但我必须要整包发出去,,,不知道为什么不阻塞还会影响cpu2的蓝牙连接 另外,发送大量数据是蓝牙连接需要
    发表于 05-20 06:04

    具有十个解码输出的进位计数器/除法器数据

    电子发烧友网站提供《具有十个解码输出的进位计数器/除法器数据表.pdf》资料免费下载
    发表于 05-17 10:47 0次下载
    具有<b class='flag-5'>十个</b>解码输出的<b class='flag-5'>十</b>进位计数器/除法器<b class='flag-5'>数据</b>表

    国内有数十个医疗大模型,大模型如何赋能智慧医疗

    电子发烧友网报道(文/吴子鹏)近日,在北京CGT新势发布会上,中国科学院院士、翊博生物首席科学家陈润生表示,中国现在有数以百计的通用大模型,其中的90%没多大用处,也发展不起来,只会加剧资源和人力
    的头像 发表于 02-05 00:17 8635次阅读

    谷歌DeepMind科学家欲建AI初创公司

    据知情人士透露,谷歌人工智能部门DeepMind的两名杰出科学家Laurent Sifre和Karl Tuyls正在与投资者商讨在巴黎成立一家新的人工智能初创公司的事宜。
    的头像 发表于 01-22 14:41 495次阅读

    飞腾首席科学家窦强荣获 “国家卓越工程师” 称号

         飞腾首席科学家窦强荣获 “国家卓越工程师” 称号 1月19日上午,首届 “国家工程师奖” 表彰大会在北京人民大会堂隆重举行。81 名个人被授予 “国家卓越工程师” 称号,50 团队被授予
    的头像 发表于 01-19 19:22 1739次阅读
    飞腾首席<b class='flag-5'>科学家</b>窦强荣获 “国家卓越工程师” 称号

    构建高效数据生态:数据库数据仓库、数据湖、大数据平台与数据中台解析_光点科技

    在数字化的浪潮中,一套高效的数据管理系统是企业竞争力的核心。从传统的数据库到现代的数据中台,每一种技术都在数据的旅程中扮演着关键角色。本文将深入探讨
    的头像 发表于 01-17 10:20 374次阅读