爱了爱了!0.052 秒打开 100GB 数据,这个 Python 开源库火爆了!
阅读本文大概需要 3 分钟。
为什么要选择 vaex?
-
性能:处理海量表格数据,每秒处理超过十亿行 -
虚拟列:动态计算,不浪费内存 -
高效的内存在执行过滤 / 选择 / 子集时没有内存副本。 -
可视化:直接支持,单线通常就足够了。 -
用户友好的 API:只需处理一个数据集对象,制表符补全和 docstring 可以帮助你:ds.mean<tab>,类似于 Pandas。 -
精益:分成多个包 -
Jupyter 集成:vaex-jupyter 将在 Jupyter 笔记本和 Jupyter 实验室中提供交互式可视化和选择。
Vaex 官方网站:https://vaex.io/ 文档:https://docs.vaex.io/ GitHub:https : //github.com/vaexio/vaex PyPi:https://pypi.python.org/pypi/vaex/
原文始发于微信公众号(进击的Coder):爱了爱了!0.052 秒打开 100GB 数据,这个 Python 开源库火爆了!
THE END
0
二维码
海报
爱了爱了!0.052 秒打开 100GB 数据,这个 Python 开源库火爆了!
“
阅读本文大概需要 3 分钟。
”
编译 | AI 科技大本营(ID:rgznai100)
许多组织都在尝试收集和利用尽可能多的数据,以改善其经营方式,增……