python

Python数据分析之pandas

Submitted by huzhenda on Sat, 07/28/2018 - 11:09

Pandas

WHAT?

Pandas是基于Numpy构建的库,在数据处理方面可以把它理解为numpy加强版,同时Pandas也是一项开源项目:Github 。不同于numpy的是,pandas拥有种数据结构:SeriesDataFrame: 

10.1

下面我们就来生成一个简单的series对象来方便理解: 

Tags

嫌Python太慢?并行运算Process Pools三行代码给你4倍提速!

Submitted by zhongzhimin on Tue, 08/29/2017 - 16:46
Python绝对是处理数据或者把重复任务自动化的绝佳编程语言。要抓取网页日志?或者要调整一百万张图片?总有对应的Python库让你轻松完成任务。 然而,Python的运营速度一直饱受诟病。默认状态下,Python程序使用单个CPU的单个进程。如果你的电脑是最近十年生产的,多数情况下会有4个及以上CPU核。也就是说,当你在等程序运行结束的时候,你的计算机有75%或者更多的计算资源都是空置的! 让我们来看看如何通过并行运算充分利用计算资源。多亏有Python的concurrent.futures模块,仅需3行代码就可以让一个普通程序并行运行。

Tags

一文读懂遗传算法工作原理(附Python实现)

Submitted by zhongzhimin on Tue, 08/08/2017 - 19:15
近日,Analyticsvidhya 上发表了一篇题为《Introduction to Genetic Algorithm & their application in data science》的文章,作者 Shubham Jain 现身说法,用通俗易懂的语言对遗传算法作了一个全面而扼要的概述,并列举了其在多个领域的实际应用,其中重点介绍了遗传算法的数据科学应用。

数据专家必知必会的7款Python工具

Submitted by zhongzhimin on Thu, 08/03/2017 - 14:57
如果你有志于做一个数据专家,你就应该保持一颗好奇心,总是不断探索,学习,问各种问题。在线入门教程和视频教程能帮你走出第一步,但是最好的方式就是通过熟悉各种已经在生产环境中使用的工具而为成为一个真正的数据专家做好充分准备。