如何利用python提取两个excel对比后的重复值的信息?

请问:

例如我有两个Excel表格,
一个表格 Ex1 是三列,每列都有5000行, 有名称, 信息, 价格.
另一个表格 Ex2 是我需要的物品的名称, 这里的名称有的包含在Ex1中, 有的不包含.

我想将两个Excel比较, 用Ex2的名称匹配Ex1的, 匹配上的将其名称, 信息 ,价格都输出在新的excel中,没匹配上的输出在另一个新的excel中.

(Excel处理不了上万行了.)

举报该问题

推荐答案 2019-05-08

import pandas

def read_excel():
    data1 = pandas.read_excel(r'C:\Users\admin\Desktop\1.xlsx')
    data2 = pandas.read_excel(r'C:\Users\admin\Desktop\2.xlsx')
    data3=pandas.merge(data1, data2, on=['名称'], how='outer')
    print(data3)
    data3.to_excel(r'C:\Users\admin\Desktop\3.xlsx',index=False)

read_excel()

这3个excel分别是1，2，3表，用2匹配1，得到3表，我只是以名称比，相同的都统计了，3表里信息x,价格x为空的就是没匹配上的，这个要看具体数据的情况

追问

感谢您的回复, 您的描述很详细, 也很有用.
但是我遇到了另一个问题, 因为我的表2只有名称一列,所以这样做出来的表3有很多空的表格,很难区分哪些是对应上的.
所以能否继续解决一下问题:
例如您展示的表2里,我只有 [名称] 一列, 想与表1的名称对比,并将 [对应上表1中名称的] 那些列的 [所有信息] 输出到新的excel中,不要其他的信息,这样如何去做呢?

追答import pandas

def read_excel():
    data1 = pandas.read_excel(r'C:\Users\Administrator\Desktop\1.xlsx')
    data2 = pandas.read_excel(r'C:\Users\Administrator\Desktop\2.xlsx')
    data3 = pandas.merge(data1, data2, on=['名称'], how='right')
    data3.to_excel(r'C:\Users\Administrator\Desktop\3.xlsx', index=False)

read_excel()

还是1,2,3表，2表匹配1，要是匹配上，1的值给2，没有匹配上还是2表原先的值

温馨提示：答案为网友推荐，仅供参考

当前网址：http://88.wendadaohang.com/zd/MVM1ccga1ga1gSBB1ga.html

其他回答

第1个回答 2020-02-24

data3 = pandas.merge(data1, data2, on=['名称'], how='inner')

inner：内连接，取交集，这样改一下就符合你的要求了

相似回答

如何筛选重复数据并提取出来答：1. 使用Excel 的条件格式功能。选择要检查的数据范围，然后打开条件格式对话框。在“重复项”选项卡中选择“重复值”，然后选择要突出显示的格式。2. 使用Excel 的筛选功能。选择要检查的数据范围，然后打开筛选对话框。在“高级”选项卡中选择“只保留唯一值”，然后单击“确定”。3. 使用SQL查询。在S...

如何筛选重复数据并提取出来答：利用Excel工具：首先，通过选择数据范围，利用Excel的条件格式功能，选择“重复值”选项，可以自动突出显示重复项。或者，通过筛选功能，选择“高级”选项卡，启用“只保留唯一值”选项来去除重复项。SQL查询技巧：在SQL数据库操作中，使用"SELECTDISTINCT"语句，例如：`SELECTDISTINCTcolumn1FROMtable1`，可以筛...

python提取excel表中的数据两列答：在此基础上，我们详细介绍如何从pdf文件中提取表格数据。其中一种思路便是将提取出的列表视为一个字符串，结合Python的正则表达式re模块进行字符串处理后，将其保存为以标准英文逗号分隔、可被Excel识别的csv格式文件，即进行如下操作：输出结果：尽管能获得完整的表格数据，但这种方法相对不易理解，且在处理...

python 查找两个EXCEL中的相同单元格,计算对应值并导出答：为了练习python编程吧？引入操作excel的插件，循环处理就是。

python 怎么在excel里面对比部分重复?答：import openpyxl wb = openpyxl.load_workbook(r'文件路径')ws = wb['表名']for row in range(1,ws.max_row):name = ws['A%s'%(row)].value if ws['B%s'%(row)].value is None:print(name)

如何利用excel快速的查找两个表中相同的数据答：查询重复数据的具体操作如下：1.首先选中两列数据。2.点击“条件格式”。3.其次点击“突出显示单元格规则”。4.然后点击“重复值”。5.然后点击“确定”。6.这样两列相同数据就被找出来了。

Python 如何比较两个文件中的重复字符串并输出统计数字答：这5000W 数据有点大光读写文件就要好长时间有没有hadoop 平台 http://blog.csdn.net/zhaoyl03/article/details/8657031/ 这个统计很快

你还在承受Excel的支配吗?看这里,教你用Python批量提取数据视频时间 05:08

大家正在搜

python对excel筛选提取 python提取excel数据用python读取excel python抓取excel python对excel求和 python怎么调取excel python读取excel指定列 excel利用函数提取数字 python处理excel文件