Python在数亿级数据集中查找某个元素是否存在解决方案

更新时间:01-24 教程 由 花栀 分享

我用python+txt处理过1.7亿条数据,压力不算特别大,可以接受。

有几点要注意:

1、不要用python写循环,1.7亿的循环跑到你电脑没电。

2、多用pandas和numpy,用他们自带的查找方法。

3、如果内存不够,pandas.readcsv时要用iterator,当然这时分线程意义也不大了,因为你的瓶颈是IO。

声明:关于《Python在数亿级数据集中查找某个元素是否存在解决方案》以上内容仅供参考,若您的权利被侵害,请联系13825271@qq.com
本文网址:http://www.25820.com/tutorial/14_2107066.html