两个excel表格根据字段名首尾相连,并删除重复行
有两张表,分别存放这梁山108名好汉的信息,一张是36天罡,一张是72地煞,现在需要两张表合并一起,根据字段名首尾相连import pandas as pd
data1 = pd.read_excel('36.xlsx',index_col='姓名')
data2 = pd.read_excel('72.xlsx',index_col='姓名')
frames =
result = pd.concat(frames)
print(result)
result.to_excel('108.xlsx') 第5行代码,也可以是:
result = data1.append(data2) 根据上面的代码进行修改,加一行代码,可以删除重复行
比如两张表,都有一个共同的人,现在两表合并,此人员重复出现,此案例可以删除重复行,只保留一行数据
import pandas as pd
data1 = pd.read_excel('01.xlsx',index_col='姓名')
data2 = pd.read_excel('02.xlsx',index_col='姓名')
frames = #把两个数据放在一个列表里
result = pd.concat(frames) #两个列表根据字段名首尾相连
result = result.drop_duplicates() #把合并的结果进行检验,删除重复行
print(result)
result.to_excel('00.xlsx')
页:
[1]