使用python编程处理大量数据，效率太慢怎么解决

我的程序是这样的
while i<10000000
if a[i]==a[i+1]:
del a[i+1]
if a[i]<a[i+1]:
if a[i+1]<=a[i+2]:
del a[i+1]
l=l-1
else : i=i+1
if a[i]>a[i+1]:
if a[i+1]>=a[i+2]:
del a[i+1]
l=l-1
else : i=i+1
a是一个一维数组，已经存有上千万个数据。
运行的时候速度很慢，怎么解决这个问题~

举报该问题

推荐答案 2013-08-27

既然存有上千万个数据，为什么不使用数据库呢？
使用小型的sqlite数据库，加上适当的索引、筛选，肯定能大大提高数据处理速度。
python也自身带有处理sqlite数据库的模块，极其方便。

温馨提示：答案为网友推荐，仅供参考

当前网址：http://88.wendadaohang.com/zd/VK1gMKS1a.html

其他回答

第1个回答 2013-08-29

循环本身是没有什么耗时的；恐怕资源消耗于数字a的反复调整变化上；
如果内存资源充裕的话建议不对数组a进行del操作，而是顺序地将满足条件的数据添加到新数组中。追问

不知道怎么编

追答

给你一段伪代码参考一下:

a, cpy, skips = range(10000000), [], 0
L = len(a)
for i, element in enumerate(a):
    if skips:
        # 跳过若干已经判断要跳过的元素
        skips -= 1
        continue

    # 用你的业务逻辑判断后续跳过几个元素
    j = i+1
    while j < L:
        if yourbusinesslogic(i, j):
            skips += 1
        else:
            break
        j += 1

    # 添加当前元素到副本列表
    cpy.append(element)

追问

我试了
原来比如a=[1,2,3,4,5,6,8,5,4,3,9,8,1]
运算后
cpy=[1,3,5,8,4,3,9,8,1]
结果还是不符合

追答#!/usr/bin/python
# encoding: utf-8

a=[1,2,3,4,5,5,5,6,8,8,5,4,4,3,9,8,1]
L = len(a)

def businesslogic(i, j):
    if j >= L-1:
        return False
    if a[i] == a[j]:
        return True
    if a[i] < a[j] <= a[j+1]:
        return True
    if a[i]>a[j]>=a[j+1]:
        return True

print a
cpy, skips = [], 0
for i, element in enumerate(a):
    if skips:
        # 跳过若干已经判断要跳过的元素
        skips -= 1
        continue

    # 用你的业务逻辑判断后续跳过几个元素
    j = i+1
    while j < L:
        if businesslogic(i, j):
            skips += 1
        else:
            break
        j += 1

    # 添加当前元素到副本列表
    cpy.append(element)

print cpy

>python "baidu.py"
[1, 2, 3, 4, 5, 5, 5, 6, 8, 8, 5, 4, 4, 3, 9, 8, 1]
[1, 8, 3, 9, 1]
>

is it?

本回答被提问者采纳

第2个回答 2013-08-28

用cython加速可能会好点。

第3个回答 2013-08-28

将数据分片处理是不是好些。追问

这个方法可行

相似回答

怎样才能提高Python运行效率?答：每次创建应用时都使用同一种编码方法几乎无一例外会导致应用的运行效率不尽人意。可以在程序分析时尝试一些试验性的办法。譬如说，在处理字典中的数据项时，你既可以使用安全的方法，先确保数据项已经存在再进行更新，也可以直接对数据项进行更新，把不存在的数据项作为特例分开处理。6.使用较新的Python版...

使用python编程处理大量数据,效率太慢怎么解决答：使用小型的sqlite数据库，加上适当的索引、筛选，肯定能大大提高数据处理速度。python也自身带有处理sqlite数据库的模块，极其方便。

优化Python编程的4个妙招答：另一种解决缓慢循环的方法就是将函数向量化。这意味着新建函数会应用于输入列表，并返回结果数组。在Python中使用向量化能至少迭代两次，从而加速计算。事实上，这样不仅能加速代码运算，还能让代码更加简洁清晰。4. Python多重处理多重处理能使系统同时支持一个以上的处理器。此处将数据处理分成多个任务，让...

一篇文章带你深度解析Python线程和进程答：加锁可以保证多个进程修改同一块数据时,同一时间只能有一个任务可以进行修改,即串行的修改。加锁牺牲了速度,但是却保证了数据的安全。因此我们最好找寻一种解决方案能够兼顾:1、效率高(多个进程共享一块内存的数据)2、帮我们处理好锁问题。 mutiprocessing模块为我们提供的基于消息的IPC通信机制:队列和管道。队列...

怎么用最短时间高效而踏实的学习python答：不管学习什么新的东西，效率最低但是又不可或缺的环节就是看教科书了。虽然看书的过程可能会很无聊，但是过一遍书至少能对整个知识框架有个大体的把握。我最早知道 Python 还是在《黑客与画家》这本书中看到的，书里面有一章节是讲编程语言的，作者很推荐把 python 作为学习编程的入门语言。我当时是把...

python如何处理大量excel数据?答：使用pip install openpyxl即可，但是在windows下安装的是2.2.6版本，但是centos自动安装的是4.1版本。from xlwt import Workbook, Formula import xlrd book = Workbook()sheet1 = book.add_sheet('Sheet 1')sheet1.write(0,0,10)sheet1.write(1,0,Formula('A1/B1'))sheet2 = book.add_sheet...

怎么用最短时间高效而踏实地学习Python答：掌握一门语言最好的方法就是用它，所以我觉得边学语法边刷Leetcode是掌握Python最快的方式之一。第二个阶段：中级，掌握自己特定领域的库，掌握pythonic写法，非常熟悉Python的特性。推荐的第一本书是《编写高质量代码--改善python程序的91个建议》，这本书大概的提了下Python工程的文件布局，更多的总结了...

学python最想要提升的是哪些地方答：开始数据量不大的时候，你可以直接通过 Python 的语法或 pandas 的方法将数据存为csv这样的文件。当然你可能发现爬回来的数据并不是干净的，可能会有缺失、错误等等，你还需要对数据进行清洗，可以学习 pandas 包的基本用法来做数据的预处理，得到更干净的数据。3.学习scrapy，搭建工程化爬虫掌握前面的...

大家正在搜

常用python编程软件 python效率低 python 运行效率 python有什么用 python运行效率高吗 python编程 python提高办公效率 python编程100例 python编程入门